AMD發表全新AMD Instinct™ MI100加速器,為全球最快高效能運算(HPC)GPU,同時也是首款突破10 teraflops (FP64)效能的x86伺服器GPU。MI100加速器獲得戴爾、技嘉、HPE、美超微(Supermicro)等各大廠商的新款加速運算平台支援,結合AMD EPYC™ CPU以及ROCm™ 4.0開放軟體平台,旨在為即將到來的exascale等級時代推動全新發現。

AMD Instinct MI100 GPU採用全新AMD CDNA架構打造,搭配AMD第2代EPYC處理器,為高效能運算與AI開創出全新等級的加速系統。MI100在高效能運算方面提供高達11.5 TFLOPS的FP64尖峰效能,在AI與機器學習工作負載方面則提供高達46.1 TFLOPS的FP32 Matrix尖峰效能註2。透過全新AMD Matrix Core技術,MI100在執行AI訓練工作負載時能提供比AMD前一代加速器提升近7倍的FP16理論尖峰浮點運算效能註3。

AMD資料中心GPU與加速處理部門全球副總裁Brad McCredie表示,AMD推出AMD Instinct MI100,為全球最快的高效能運算GPU,代表著我們往exascale等級運算的目標邁進一大步。瞄準科學運算中最關鍵的工作負載,最新加速器搭配AMD ROCm開放軟體平台,兩強合併的組合為科學家與研究人員提供更為優越的高效能運算工作基礎。

瞄準Exascale等級時代所打造的開放軟體平台
AMD ROCm開發者軟體為exascale等級運算提供基礎。ROCm作為一個由編譯器、程式開發API與函式庫組成的開源工具集,可以幫助眾多exascale等級軟體開發者打造高效能應用程式。經過優化的ROCm 4.0能為基於MI100的系統提供大規模運算的效能。ROCm 4.0已將編譯器升級至支援開源並統一支援OpenMP® 5.0與HIP。此外,PyTorch與Tensorflow框架都已針對ROCm 4.0進行優化,能配合MI100達到更高的效能註7、8。ROCm 4.0是為高效能運算、機器學習以及人工智慧程式開發者量身打造的最新方案,讓他們開發高效能的可移植軟體。

橡樹嶺國家實驗室領導運算中心科學總監Bronson Messer表示,我們已經率先使用MI100加速器,初步使用效果讓人非常振奮。我們見證到大幅的效能提升,相比其他GPU高出達2到3倍。我們也同樣意識到軟體對效能影響的重要性。開源的ROCm開放軟體平台以及HIP開發者工具能在各種平台上運行,這是我們自推出首款混合CPU/GPU系統以來最關切的特點。