英伟达 安培个人超算:双路AMD64核心 售价超100万

2020-05-15 09:03:24 来源:互联网

  NVIDIA终于公开了备受期待的“安培(Ampere)”的架构,这个核弹级的GPU芯片主要面对的并不是PC游戏市场,而是人工智能、高性能计算、大数据等等尖端领域。

  在公开了新的架构的同时NVIDIA还发布了相应的第三代工作站“DGX A100”,按照NVIDIA的说法叫做“个人超级计算机”,可以支持在桌面端进行AI研究,并扩展到云端。

  DGX A100内部配备了八颗安培架构的Tesla A100 GPU,每一颗整合40GB HBM2高带宽显存,总容量达320GB。

  每颗GPU均支持多达12路的NVLink互连总线,GPU-GPU带宽高达600GB/s,可保证八颗GPU彼此完全互连,同时还有6颗NVIDIA NVSwitch芯片,双向带宽高达4.8TB/s。

  不过从示意图上可以看出,每颗GPU周围其实有六颗HBM2显存芯片,很显然有一颗没有启用,剩下的五颗单颗容量8GB从而组成40GB。这意味着,A100核心现在应该也是屏蔽了六分之一的规模。

  网络方面配备了刚完成收购的Mellanox的解决方案,包括八颗单端口ConnectX-6 VPI用于聚类,峰值性能200GB/s,以及一颗双端口ConnectX-6 VPI用于数据与存储网络。

  有趣的是,搭配的CPU处理器这次抛弃了Intel至强,改为使用两颗AMD二代霄龙(Rome),且是顶级的64核心型号,同时搭配1TB DDR4内存、15TB PCIe 4.0 NVMe SSD固态硬盘。

  黄仁勋称这是“世界上最大的显卡”,不算外壳单单是其中的计算板加散热器就有45斤的重量,集成超过3万个不同组件,钻孔数量多达100万个,连接电路长达1公里。

  NVIDIA宣称,DGX A100系统单节点的峰值性能为:INT8 10 PetaOPS(每秒1亿亿次整数运算)、FP16 5 PFlops(每秒5千万亿次半精度浮点运算)、TF32 2.5 PFlops(每秒2.5千万亿次运算)、FP64 156 TFlops(每秒156万亿次双精度浮点运算)。

  相比于高端CPU服务器,它的AI计算性能要高出150倍,内存带宽高出40倍,IO带宽也高出40倍。

  NVIDIA DGX A100个人超算现已上市,售价19.9万美元,约合人民币141万元。

  该方案的云服务客户有阿里云、亚马逊AWS、百度云、Google Cloud、微软Azure、甲骨文、腾讯云,系统级客户有AtoS、Cray、戴尔、富士通、技嘉、HPE、浪潮、联想、广达、SuperMicro。

打开游侠APP查看更多精彩
相关资讯
热门资讯
下载APP可查看更多精彩资讯