티스토리 뷰

최근 인공지능(AI)이 단순한 질문 응답을 넘어 스스로 작업을 수행하는 ‘AI 에이전트’ 단계로 발전하면서 새로운 기술적 과제가 떠오르고 있습니다. 특히 AI가 장시간 작업을 수행할 때 발생하는 데이터 저장과 처리 속도 문제가 핵심 병목으로 지적되고 있습니다.
이와 관련해 **Nvidia**는 개발자 행사 **GTC**에서 새로운 저장 아키텍처 BlueField‑4 STX를 공개하며 AI 인프라 기술 경쟁에 새로운 방향을 제시했습니다.
AI 작업 중 ‘맥락 손실’ 문제 해결
AI 에이전트가 작업을 수행하다가 중간 맥락(context)을 잃는 현상은 흔히 모델 문제로 생각되지만, 실제로는 저장 시스템 속도 문제일 가능성이 높습니다.
AI 모델은 작업 과정에서 KV 캐시(Key-Value Cache)라는 데이터를 저장합니다.
이 데이터는 AI가 이전에 처리한 정보를 기억하도록 도와주는 일종의 작업 메모리 역할을 합니다.
하지만 기존 데이터센터 구조에서는 이 데이터가
- GPU → CPU → 저장장치
와 같은 전통적인 경로를 거쳐야 하기 때문에 지연이 발생합니다. 이 과정에서 GPU 활용도가 떨어지고 AI 추론 속도도 느려질 수 있습니다.
GPU와 저장장치 사이 ‘컨텍스트 메모리 레이어’ 도입
엔비디아가 공개한 BlueField-4 STX의 핵심은 GPU와 저장장치 사이에 ‘컨텍스트 메모리 레이어’를 추가한 것입니다.
이 구조는 AI 모델이 생성하는 KV 캐시 데이터를 빠르게 저장하고 다시 불러올 수 있도록 설계되었습니다.
엔비디아에 따르면 해당 기술을 적용할 경우 기존 CPU 기반 저장 구조 대비
- 토큰 처리량 5배 증가
- 에너지 효율 4배 향상
- 데이터 수집 속도 2배 개선
효과를 기대할 수 있습니다.
AI 전용 저장 플랫폼 ‘CMX’도 공개
이번 STX 아키텍처의 첫 번째 랙 단위 구현 시스템은 Nvidia CMX 컨텍스트 메모리 스토리지 플랫폼입니다.
CMX는 대형 언어 모델(LLM)이 추론 과정에서 생성하는 KV 캐시 데이터를 빠르게 저장하고 검색할 수 있도록 설계된 고성능 컨텍스트 메모리 저장 시스템입니다.
엔비디아의 데이터센터 플랫폼은
- Vera CPU
- ConnectX-9 SuperNIC
- Spectrum-X 이더넷 네트워크
등을 기반으로 구성되며, 소프트웨어 측면에서는 DOCA 플랫폼을 통해 프로그래밍이 가능합니다.
또한 STX 시스템에는 DOCA Memo라는 새로운 저장 관리 소프트웨어 기능도 포함됩니다.
글로벌 기업들과 협력 확대
엔비디아는 STX를 단일 제품으로 판매하는 대신 참고 설계(Reference Architecture) 형태로 제공해 다양한 기업이 이를 기반으로 AI 저장 인프라를 구축하도록 할 계획입니다.
현재 STX 기반 인프라 개발에 참여한 주요 스토리지 기업은 다음과 같습니다.
- Dell Technologies
- Hewlett Packard Enterprise
- IBM
- NetApp
- Nutanix
또한 AI 및 클라우드 기업인
- CoreWeave
- Mistral AI
- Oracle Cloud Infrastructure
등도 STX 기반 저장 기술 도입을 추진하고 있습니다.
AI 인프라의 새로운 경쟁 분야 ‘스토리지’
지금까지 AI 인프라 경쟁은 대부분 GPU 성능 중심이었습니다. 그러나 AI 모델 규모가 커지고 AI 에이전트 활용이 증가하면서 **데이터 저장 계층(Storage Layer)**이 중요한 인프라 요소로 떠오르고 있습니다.
특히 기존 NAS나 오브젝트 스토리지 시스템은 AI 추론 속도에 필요한 지연시간 요구사항을 충족하기 어렵기 때문에 AI 전용 저장 구조가 필요하다는 분석이 나오고 있습니다.
엔비디아는 STX 아키텍처를 통해 AI 전용 스토리지 인프라의 표준 모델을 제시하겠다는 전략입니다.
2026년 하반기부터 본격 출시
엔비디아는 STX 기반 시스템이 2026년 하반기부터 파트너 기업을 통해 출시될 예정이라고 밝혔습니다.
업계에서는 향후 2~3년 내 대부분의 기업 AI 시스템이 멀티 단계 추론(Multi-step inference)을 수행하는 AI 에이전트 형태로 발전할 것으로 보고 있어, STX 기반 저장 인프라의 중요성도 더욱 커질 것으로 전망됩니다.
AI 산업이 GPU 중심에서 데이터와 저장 인프라 중심으로 확장되는 흐름 속에서 이번 기술이 어떤 변화를 가져올지 주목됩니다.
#엔비디아 #Nvidia #BlueField4 #AI스토리지 #AI인프라 #GTC2026 #AI에이전트 #데이터센터 #GPU컴퓨팅 #인공지능기술
'IT 과학 테크' 카테고리의 다른 글
| 엔비디아, ‘네모클로(NemoClaw)’ 공개…자율 AI 에이전트 시대 본격화 (0) | 2026.03.18 |
|---|---|
| “AI 보안, 처음부터 탑재됐다”…엔비디아 ‘에이전틱 AI 스택’ 출시에 업계 주목 (0) | 2026.03.18 |
| 엔비디아, 차세대 AI 플랫폼 ‘베라 루빈’ 공개…AI 인프라 경쟁 본격화 (0) | 2026.03.17 |
| 바이트댄스, AI 영상 생성 모델 ‘시댄스 2.0’ 글로벌 출시 일시 중단 (0) | 2026.03.16 |
| 구글, 사이버보안 기업 위즈 320억 달러 인수…창사 최대 규모 M&A (0) | 2026.03.16 |
- Total
- Today
- Yesterday
- 경제뉴스
- 정부지원금
- 짧은뉴스
- K푸드
- 전통시장
- 연말정산
- 탄소중립
- 재테크
- 미래기술
- 생활꿀팁
- 쿠팡파트너스
- 도시계획
- 건강정보
- 생활정보
- 인공지능
- 티스토리블로그
- 국내여행
- 메타
- 엔비디아
- 테크뉴스
- 청년정책
- 기후위기
- 가을축제
- 폭염주의보
- 삼성전자
- 지역경제
- 건강관리
- 2026수능
- IT뉴스
- 상생페이백
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
