티스토리 뷰

반응형

생성이미지
생성이미지

최근 인공지능(AI) 산업이 빠르게 성장하면서 이를 뒷받침하는 AI 인프라 기술 경쟁도 더욱 치열해지고 있습니다. 이런 가운데 글로벌 반도체 기업 **Nvidia**가 차세대 AI 컴퓨팅 플랫폼 Vera Rubin을 공개하며 업계의 큰 관심을 모으고 있습니다.

이번 플랫폼은 기존 AI 시스템보다 성능은 크게 높이고 비용은 대폭 낮춘 차세대 AI 인프라로 평가되고 있습니다.


차세대 AI 슈퍼컴퓨팅 플랫폼 ‘베라 루빈’

엔비디아는 자사의 연례 개발자 행사 **GTC**에서 베라 루빈 플랫폼을 공식 발표했습니다.

베라 루빈은 총 7개의 핵심 칩으로 구성된 AI 슈퍼컴퓨팅 시스템으로, 대규모 인공지능 모델을 효율적으로 학습하고 운영할 수 있도록 설계된 것이 특징입니다.

특히 이전 세대 플랫폼인 Blackwell과 비교했을 때

  • 와트당 추론 처리량 최대 10배 향상
  • AI 토큰당 비용 약 10분의 1 수준 절감

이라는 성능 개선이 이루어졌다고 합니다.

엔비디아 CEO **Jensen Huang**은 발표 자리에서
“AI 시대에 역사상 가장 큰 인프라 구축이 시작되고 있다”고 강조했습니다.


7개 칩으로 구성된 차세대 AI 시스템

베라 루빈 플랫폼은 다음과 같은 주요 칩들이 하나의 시스템으로 결합된 구조입니다.

  • Vera CPU
  • Rubin GPU
  • NVLink 6 스위치
  • ConnectX-9 SuperNIC
  • BlueField-4 DPU
  • Spectrum-6 이더넷 스위치
  • Groq 3 LPU 추론 가속기

이러한 칩들이 랙 단위의 AI 슈퍼컴퓨터 형태로 구성되어 대규모 AI 모델 학습과 추론을 동시에 처리할 수 있도록 만들어졌습니다.

대표적인 구성인 NVL72 랙 시스템
72개의 Rubin GPU와 36개의 Vera CPU를 연결해 기존보다 훨씬 적은 GPU로도 대형 AI 모델을 학습할 수 있는 것이 특징입니다.


오픈AI·메타 등 주요 AI 기업 참여

이번 플랫폼에는 글로벌 AI 기업들도 고객사로 참여하고 있습니다.

대표적으로

  • OpenAI
  • Anthropic
  • Meta
  • Mistral AI

등 주요 AI 기업들이 베라 루빈 기반 인프라를 사용할 예정입니다.

또한 클라우드 기업인

  • Amazon Web Services
  • Google Cloud
  • Microsoft Azure
  • Oracle Cloud Infrastructure

에서도 해당 플랫폼을 지원할 계획이라고 밝혔습니다.


‘AI 에이전트 시대’ 대비한 기술

엔비디아는 이번 플랫폼이 앞으로 등장할 AI 에이전트(Agentic AI) 시대를 대비한 인프라라고 설명했습니다.

AI가 단순히 질문에 답하는 수준을 넘어

  • 스스로 작업을 수행하고
  • 코드를 작성하며
  • 여러 도구를 활용하는 형태로 발전하면서

더 강력한 컴퓨팅 인프라가 필요해졌기 때문입니다.

이를 위해 엔비디아는 AI 에이전트 개발을 위한 OpenShell 기반 Agent Toolkit도 함께 공개했습니다.


앞으로의 AI 시장 경쟁

AI 인프라 시장에서는 현재 엔비디아가 강력한 영향력을 갖고 있지만 경쟁도 빠르게 심화되고 있습니다.

대표적으로

  • AMD
  • **Google**의 TPU
  • **Amazon**의 Trainium

등 다양한 AI 반도체 기술이 등장하면서 글로벌 경쟁이 더욱 치열해질 것으로 전망됩니다.

AI 산업이 앞으로 데이터센터와 AI 인프라 중심으로 재편되는 흐름 속에서, 엔비디아의 새로운 플랫폼이 어떤 변화를 가져올지 많은 관심이 모이고 있습니다.



#엔비디아 #Nvidia #AI플랫폼 #VeraRubin #AI반도체 #AI인프라 #데이터센터 #OpenAI #AI기술 #GTC

 
반응형