데이터센터는 컴퓨팅의 새로운 단위가 되었으며, 인공지능과 데이터 과학의 부상으로 새로운 요구사항과 도전과제가 생겼습니다. 엔비디아와 AMD는 각각 GPU와 CPU를 통해 데이터센터의 성능과 효율성을 높이고자 경쟁하고 있습니다. 또한, 엔비디아는 멜라녹스라는 고성능 네트워킹 기업을 인수하여 데이터센터의 보안, 네트워크, 스토리지 작업을 가속화하는 DPU(Data Processing Unit)라는 새로운 컴퓨팅 단위를 도입했습니다. 이번 블로그에서는 엔비디아와 AMD의 4세대 데이터센터 전략과 멜라녹스의 핵심 기술에 대해 알아보겠습니다.
엔비디아의 4세대 데이터센터 전략
엔비디아는 GPU를 통해 데이터센터의 컴퓨팅 파워를 극대화하고, AI와 데이터 사이언스 애플리케이션을 가속화하는 전략을 추구하고 있습니다. 엔비디아는 최근 암페어(Ampere) 아키텍처를 기반으로 한 A100 GPU를 출시했는데요, 이 GPU는 7nm 공정으로 제작되었으며, 54개의 스트리밍 멀티프로세서(SM), 6,912개의 쿠다(CUDA) 코어, 432개의 텐서(Tensor) 코어, 40GB의 HBM2 메모리를 탑재했습니다. A100 GPU는 이전 세대인 V100 GPU보다 최대 20배의 성능 향상을 보여주었으며, 엔비디아의 멀티 인스턴스 GPU(MIG) 기술을 통해 하나의 GPU를 최대 7개의 독립적인 GPU로 분할하여 다양한 워크로드에 맞게 활용할 수 있습니다.
엔비디아는 또한, GPU를 연결하고 확장하는 NVLink와 NVSwitch라는 고속 상호 연결 기술을 개발했습니다. NVLink는 GPU 간에 최대 600GB/s의 대역폭을 제공하며, NVSwitch는 16개의 GPU를 하나의 논리적인 GPU로 묶어 4.8TB/s의 대역폭을 제공합니다. 이러한 기술들은 엔비디아의 DGX 시스템이나 HGX 플랫폼에 적용되어 대규모의 AI 모델을 훈련하거나 추론하는 데 필요한 컴퓨팅 리소스를 제공합니다.
엔비디아는 GPU를 통해 데이터센터의 컴퓨팅 측면에서 우위를 점하고 있지만, 데이터센터의 다른 측면들에 대해서는 부족함이 있었습니다. 특히, 데이터센터의 보안, 네트워크, 스토리지 작업은 CPU에 의존하고 있었으며, 이는 CPU의 부하를 증가시키고, 컴퓨팅 성능을 저하시키는 요인이었습니다. 따라서, 엔비디아는 이러한 문제를 해결하기 위해 멜라녹스라는 고성능 네트워킹 기업을 인수했습니다.
멜라녹스의 핵심 기술
멜라녹스는 1999년에 설립된 이스라엘의 기업으로, 인피니밴드(InfiniBand)와 이더넷(Ethernet) 기반의 고속 네트워킹 솔루션을 제공합니다. 멜라녹스의 주요 제품은 ConnectX와 BlueField라는 두 가지 스마트NIC(Smart Network Interface Card)입니다. 스마트NIC는 일반적인 NIC와 달리 자체적으로 프로세서와 메모리를 갖고 있어서 네트워킹 관련 작업을 오프로드할 수 있습니다. ConnectX는 엔비디아의 GPU 다이렉트(GPU Direct) 기술과 호환되어 GPU 간에 직접 데이터를 전송할 수 있으며, RDMA(Remote Direct Memory Access)와 RoCE(RDMA over Converged Ethernet)와 같은 고급 네트워킹 프로토콜을 지원합니다. BlueField는 ConnectX의 모든 기능에 더해, ARM 프로세서와 DDR4 메모리를 내장하고 있어서 보안, 스토리지, 가상화 등의 작업을 수행할 수 있습니다.
멜라녹스의 스마트NIC는 데이터센터의 성능과 효율성을 높이는 데 기여합니다. 스마트NIC는 CPU의 부하를 줄여주고, 네트워킹 지연을 최소화하며, 보안과 격리를 강화해줍니다. 또한, 스마트NIC는 소프트웨어 정의 네트워킹(SDN)과 같은 새로운 네트워킹 패러다임을 지원하며, 데이터센터의 확장성과 유연성을 향상시켜줍니다.
AMD의 4세대 데이터센터 전략
AMD는 CPU와 GPU를 모두 제공하는 기업으로, 데이터센터의 컴퓨팅과 네트워킹 측면에서 엔비디아와 경쟁하고 있습니다. AMD는 최근 제노스(Zen) 아키텍처를 기반으로 한 EPYC CPU와 RDNA 아키텍처를 기반으로 한 라데온(Radeon) GPU를 출시했습니다. EPYC CPU는 7nm 공정으로 제작되었으며, 최대 64개의 코어, 128개의 스레드, 256MB의 L3 캐시, 128개의 PCIe 4.0 레인을 지원합니다. EPYC CPU는 클라우드 컴퓨팅, 가상화, 데이터베이스, HPC 등의 워크로드에 적합하며, 인텔의 제온(Xeon) CPU보다 높은 성능과 가격 대비 성능을 보여줍니다. 라데온 GPU는 7nm 공정으로 제작되었으며, 최대 120개의 컴퓨팅 유닛, 7,680개의 스트림 프로세서, 32GB의 HBM2 메모리를 탑재했습니다. 라데온 GPU는 게임, 스트리밍, 렌더링 등의 워크로드에 적합하며, 엔비디아의 테슬라(Tesla) GPU보다 낮은 전력 소모와 비용을 갖습니다.
엔비디아와 멜라녹스의 시너지 효과
엔비디아와 멜라녹스의 인수합병은 양사의 강점을 결합하여 데이터센터 시장에서 시너지 효과를 창출할 것으로 기대됩니다.
구체적인 시너지 효과로는 다음과 같은 것들이 있습니다.
- AI 및 ML 성능 향상: 엔비디아의 GPU와 멜라녹스의 고성능 네트워킹 솔루션을 결합하면 AI 및 ML 애플리케이션의 성능을 크게 향상시킬 수 있습니다. AI 및 ML 애플리케이션은 대규모 데이터 처리가 필요하기 때문에, 엔비디아의 GPU와 멜라녹스의 고속 네트워킹 솔루션을 결합하면 데이터 처리 속도를 크게 높일 수 있습니다.
- 데이터센터 비용 절감: 엔비디아의 GPU와 멜라녹스의 고성능 네트워킹 솔루션을 결합하면 데이터센터의 비용을 절감할 수 있습니다. 기존에는 엔비디아의 GPU와 멜라녹스의 네트워킹 솔루션을 별도로 구매해야 했지만, 인수합병 이후에는 양사의 제품을 하나로 구매할 수 있게 되어 비용을 절감할 수 있습니다.
- 시장 지배력 강화: 엔비디아와 멜라녹스의 인수합병은 데이터센터 시장에서 양사의 시장 지배력을 강화할 것으로 기대됩니다. 엔비디아는 GPU 분야에서, 멜라녹스는 고성능 네트워킹 분야에서 각각 세계 시장 점유율 1위를 차지하고 있기 때문에, 양사의 인수합병으로 데이터센터 시장에서 독보적인 입지를 구축할 수 있을 것으로 예상됩니다.
엔비디아와 멜라녹스의 인수합병은 데이터센터 시장의 경쟁 구도를 크게 변화시킬 것으로 전망됩니다. 양사의 시너지 효과를 바탕으로 엔비디아는 데이터센터 시장에서 더욱 강력한 경쟁력을 확보할 것으로 예상됩니다.
엔비디아 VS AMD 경쟁 비교

엔비디아와 AMD는 그래픽 카드 시장에서 양대 산맥을 이루고 있는 기업입니다. 2023년 3분기 기준으로 엔비디아의 그래픽 카드 시장 점유율은 80%를 넘는 반면, AMD의 점유율은 20%에 불과합니다.
엔비디아와 AMD의 경쟁에서 엔비디아가 우세한 이유는 다음과 같습니다.
- 제품 경쟁력: 엔비디아는 GPU 분야에서 독보적인 기술력을 보유하고 있습니다. 특히, AI 및 머신러닝 분야에서 엔비디아의 GPU는 AMD의 GPU보다 월등한 성능을 보여주고 있습니다.
- 고객 기반: 엔비디아는 데이터센터, 게임, 엔터테인먼트 등 다양한 분야에서 고객 기반을 확보하고 있습니다. 특히, 데이터센터 시장에서 엔비디아는 독보적인 시장 지위를 가지고 있습니다.
- 재무 여건: 엔비디아는 강력한 재무 여건을 바탕으로 연구 개발 및 마케팅에 투자하고 있습니다. 반면, AMD는 재무 여건이 상대적으로 열악하여 연구 개발 및 마케팅에 투자하기 어려운 상황입니다.
엔비디아의 우세한 경쟁력은 앞으로도 지속될 것으로 전망됩니다. 특히, AI 및 머신러닝 분야의 성장으로 엔비디아의 GPU 수요는 더욱 증가할 것으로 예상됩니다.
요약
다만, AMD도 최근 들어 꾸준히 기술력을 향상시키고 있습니다. 특히, AMD는 Zen 아키텍처 기반의 CPU와 RDNA 아키텍처 기반의 GPU를 통해 경쟁력을 강화하고 있습니다. 또한, AMD는 데이터센터 시장 진출을 강화하고 있어 엔비디아와의 경쟁이 더욱 치열해질 것으로 예상됩니다.