Huawei and Deepseek 출시 Cloudmatrix 384 Supernode : AI 컴퓨팅 파워의 새로운 벤치 마크
최근 화웨이와 Deepseek은 공동으로 주요 제품을 발표했습니다Cloudmatrix 384 슈퍼 노드, AI 컴퓨팅 전력 인프라의 진입을 새로운 시대로 표시합니다. 이 획기적인 기술은 화웨이의 하드웨어 장점과 DeepSeek의 알고리즘 혁신 기능을 통합하여 대규모 AI 교육을위한 슈퍼 컴퓨팅 파워 지원을 제공합니다.
1. 핵심 성능 매개 변수
색인 | 매개 변수 |
---|---|
컴퓨팅 장치 | 384 Ascend 910B 프로세서 |
전력 규모 컴퓨팅 | 147.5 Pflops (FP16) |
인터넷 대역폭 | Huawei의 자체 개발 된 Edge Interconnect Architecture, 최대 768GB/s의 대역폭 |
에너지 효율 비율 | 1.2tflops/w |
모델 크기를 지원합니다 | 1 억 달러 규모의 매개 변수를 초과합니다. 큰 모델 교육 |
2. 기술 혁신의 하이라이트
1.이기종 컴퓨팅 아키텍처: Huawei Atlas 900 POD와 Deepseek Distributed Training Framework의 깊은 통합을 통해 컴퓨팅 리소스의 활용률은 40%증가합니다.
2.동적 탄성 스케줄링: 실시간 확장 및 교육 작업 감소 지원, 실패 복구 시간을 초로 단축
3.녹색 에너지 절약 디자인: PUE 값이 1.08 인 액체 냉각 열 소산 기술 사용
3. 산업 응용 전망
응용 분야 | 일반적인 경우 |
---|---|
자율 주행 | 1 천만 킬로미터의 시뮬레이션 교육 데이터의 병렬 처리를 지원합니다. |
약물 개발 | 분자 역학 시뮬레이션 효율은 300 배입니다 |
금융 기술 | 밀리 초 수준에서 고주파 거래 전략의 반복을 실현할 수 있습니다. |
AIGC | 500 억 파라미터 멀티 모달 대형 모델의 주간 교육 지원 |
4. 시장 제품 비교
제품 | 컴퓨팅 파워 (Pflops) | 에너지 효율 비율 | 노드 스케일 |
---|---|---|---|
CloudMatrix 384 | 147.5 | 1.2tflops/w | 384 노드 |
NVIDIA DGX H100 | 132 | 0.9tflops/w | 노드 256 |
Google TPU V4 | 120 | 1.1tflops/w | 2048 칩 |
5. 생태 구성의 발전
현재 20 개 이상의 주요 회사가 다음을 포함하여 CloudMatrix Ecosystem 계획에 합류했습니다.
- 학술 기관 : Tsinghua University, 지능형 산업 연구소 중국 과학 아카데미 자동화 연구소
- 클라우드 서비스 제공 업체 : Alibaba Cloud, Tencent Cloud, 화산 엔진
- 업계 사용자 : Xiaopeng Motors, Wuxi Apptec, Ping an
6. 전문가 의견
중국 인공 지능 산업 개발 개발 Alliance의 사무 총장은 다음과 같이 말했습니다 : "Cloudmatrix 384의 출시는 초대형 스케일 클러스터 분야의 국내 AI 컴퓨팅 전력 인프라 분야의 격차를 메 웁니다. 혁신적인 이질적인 협력 아키텍처는 업계에 새로운 패러다임을 제공합니다."
공식 보고서에 따르면, 슈퍼 노드의 첫 번째 배치는 2024 년 2 분기의 상하이 린탕 컴퓨팅 파워 허브와 Gui'an Huawei Cloud Data Center에 배치 될 것이며 연간 생산 용량은 50 개의 슈퍼 노드 클러스터에 도달 할 것으로 예상됩니다.
세부 사항을 확인하십시오
세부 사항을 확인하십시오