5. Q&A 핵심
Q1: 추론 전용 클러스터의 미래 (C.J. Muse, Cantor Fitzgerald)
질문: 테스트 타임 컴퓨팅과 강화학습으로 트레이닝/추론 경계가 모호해지는데, 추론 전용 클러스터는?
젠슨 답변:
- 세 가지 스케일링 법칙(프리트레이닝, 포스트트레이닝, 추론)이 모두 작동 중
- 포스트트레이닝은 프리트레이닝보다 더 많은 컴퓨팅 필요
- 추론은 이미 원샷 대비 100배 컴퓨팅 필요, 향후 수천~수백만 배 증가 가능
- NVIDIA 아키텍처의 강점: 모든 워크로드(트레이닝/포스트트레이닝/추론)에 유연하게 사용 가능 ("fungible")
- Blackwell은 추론용으로 특히 강력 (25배 처리량, 20배 비용 절감)
- 결과적으로 통합 아키텍처 수요가 증가 중
Q2: GB200 시스템 복잡도와 병목 현황 (Joe Moore, Morgan Stanley)
질문: 랙 레벨 시스템 복잡도가 높은데, 램프 현황과 병목은?
젠슨 답변:
- CES 이후 더 낙관적: 더 많이 출하했기 때문
- 350개 공장에서 랙당 150만 개 컴포넌트 제조 중
- Q4에 $11B 매출로 예상 초과 달성
- CoreWeave, Microsoft, OpenAI 등 시스템 가동 공개
- "Nothing is easy, but we're doing great"
Q3: Blackwell Ultra 동시 램프 관리 (Harlan Sur, J.P. Morgan)
질문: 현재 Blackwell 램프 중인데 2H에 Ultra도 나오면 공급망 관리는?
젠슨 답변:
- Blackwell Ultra: 2H 출시 예정
- 전환이 쉬움: Hopper→Blackwell은 NVLink 8→NVL 72로 시스템 아키텍처 전체 변경이었지만, Blackwell→Ultra는 같은 아키텍처에 프로세서/메모리/네트워킹만 업그레이드
- 연간 리듬 유지: 그 다음 칩 Vera Rubin도 파트너들과 준비 중
- GTC에서 발표 예고: Ultra, Vera Rubin, 그 다음 칩까지 공개 예정
Q4: 커스텀 ASIC vs NVIDIA GPU (Timothy Arcuri, UBS)
질문: 커스텀 ASIC이 많이 언급되는데, 이종 슈퍼클러스터 구축 가능성은?
젠슨 답변 - NVIDIA의 4가지 차별점:
- 범용성: 모든 모델(자기회귀, 확산, 비전, 멀티모달)에서 우수, 새로운 알고리즘의 초기 타겟
- 엔드투엔드: 데이터 처리 → 트레이닝 → 포스트트레이닝 → 추론까지 모든 단계 커버, 모든 클라우드 + 온프렘 + 로봇 가능
- 성능/속도: 2~8배 성능 우위 → AI 팩토리는 고정 전력에서 처리량 = 매출이므로 직접적 ROI
- 소프트웨어 생태계: CUDA 위 생태계가 2년 전보다 10배 복잡, 다른 칩으로 이식 매우 어려움
추가 포인트:
- "칩이 설계됐다고 배치되는 건 아님" - 비즈니스 결정 시 NVIDIA가 유리
- 배치 속도가 빠름 (not for the faint of heart)
Q5: 지역별 성장과 미국 의존도 (Ben Reitzes, Melius Research)
질문: 미국이 $5B 증가했는데, 다른 지역 규제 시 미국만으로 성장 지속 가능?
젠슨 답변:
- 중국: Q4와 동일 비율 유지 (규제 이전의 절반), 비율은 안정적
- AI의 주류화: AI는 현대 소프트웨어이며 모든 산업에 통합 중
- 배달, 쇼핑, 교육, 헬스케어, 금융, 기후, 광물 발견 등 모든 서비스
- 아직 초기 단계: 수십 년간 구축된 CPU 기반 데이터센터를 AI/가속 컴퓨팅으로 전환하는 여정의 2년차
- GDP 대비 기회: 역사상 어떤 기술도 AI만큼 큰 GDP 부문을 다룬 적 없음
3가지 컴퓨터 시대 (자동차 예시):
- Agentic AI: 직원 생산성 향상 (설계, 마케팅, 운영)
- Physical AI: 10억 대 자동차를 위한 AI 팩토리
- 로봇 시스템: 자동차 내부의 자율주행 AI
이 세 영역은 이제 막 시작 단계로, 장기적으로 CSP보다 훨씬 큰 시장