AMD MI100计算卡FP32超英伟达A100
- +1 你赞过了
【天极网DIY硬件频道】AMD在上半年公布针对专业计算市场的CDNA架构,将不再与桌面游戏系统的RDNA混用。WCCFTech近日分享关于采用CDNA GPU架构的AMD Radeon Instinct MI100计算卡性能参数。AMD Radeon Instinct MI100计算卡在FP32算力和性价比上都给人留下深刻印象。
根据被称为AMD官方演示的幻灯片来看,AMD Radeon Instinct MI100将于2020下半年投放市场。AdpredTV展示英伟达Volta和Ampere GPU的基准测试对比,而且最新分享的幻灯片表明,AMD及其合作伙伴还有服务器领域的后续计划。
AMD计划推出面向高性能计算的定制服务器,基于双路霄龙CPU平台,可选Rome或最新的Milan芯片,据说将在2020年12月推出;基于英特尔至强CPU平台的衍生版本的发布时间可能在2021年2月。
每颗霄龙CPU可通过第二代Infinity Fabric互连方案,与两块Radeon Instinct MI100加速卡连接。单卡热设计功耗300W,四路配置可提供136 TFlops的FP32(SGEMM)算力。定制服务器还支持包括256GB/s的PCIe 4.0通道、四卡组合带宽4.9TB/s的128GB大显存(单卡32GB、带宽1.225TB/s的HBM2e显存)。标准配置或无缘XGMI,并将仅限于1U机架版本。
第二款AMD Radeon Instinct MI100 3U服务器具有更强大的规格,包括支持两颗霄龙CPU连接八张MI100计算卡。基于XGMI方案的每组4卡,可提供双向100GB/s的连接和1.2TB/s显存带宽。四路MI100加速卡的FP32算力达到惊人的272TFlops,并匹配512GB/s的PCIe带宽。基于3U外形的机架平台的总额定功率为3kW。
为便于评估性能,AdoredTV将MI100计算卡和英伟达公司的Volta V100/Ampere A100 GPU加速卡进行比较。后者具有XSM的外形尺寸,并提供400W/250W两种PCIe接口版本。
基准测试表明,Radeon Instinct MI100计算卡的FP32性能高英伟达Ampere A100方案约13%,更是Volta V100 GPU的两倍以上。MI100的性价比是V100S的2.4倍、同时比Ampere A100高出50%。即使在Resenet配置中纳入32张计算卡,性能的缩放也非常接近线性。
不过在FP64计算、人工智能和数据分析等其它类型的HPC工作负载中,英伟达A100 GPU加速卡依然具有更出色的性能。英伟达还拥有多实例GPU架构等方面的优势。得益于在Ampere A100 GPU上使用新一代Tensor内核,其FP64/FP16/张量性能指标分别提升2.5/2/2倍。
PPT的最后还提到AMD将在三大领域提供更好的性能/价值,包括石油天然气、学术研究以及高性能计算/机器学习。
最新资讯
热门视频
新品评测