2019年尾聲,國際芯片巨頭英偉達(dá)、英特爾、AMD等在高性能計(jì)算(HPC)上新動作連連,升級市場競爭,在本周舉辦2019國際超級計(jì)算大會(SC19)上,芯片巨頭們便展開了正面交鋒。
巨頭們認(rèn)為,隨著人工智能時(shí)代的到來和數(shù)據(jù)科學(xué)的爆發(fā),HPC市場的增長趨勢將不容忽視,必先占領(lǐng)高地。
(來源:英偉達(dá))
英偉達(dá)宣布幾項(xiàng)重要動作,以推進(jìn)HPC上的布局:包括發(fā)布一款參考設(shè)計(jì)平臺,將CUDA加速帶入到Arm架構(gòu)當(dāng)中,幫助企業(yè)能夠快速構(gòu)建GPU加速的Arm服務(wù)器;和微軟合作構(gòu)建搭載在Microsoft Azure云上的新型GPU加速超級計(jì)算機(jī),將超快的計(jì)算能力帶到了Azure系統(tǒng);推出軟件套件Magnum IO,專為解決存儲和輸入/輸出(I/O)遇到瓶頸這一問題進(jìn)行了優(yōu)化,可以更好地幫助數(shù)據(jù)科學(xué)家和AI研究人員解決數(shù)據(jù)瓶頸問題。
據(jù)介紹,此次發(fā)布的全新NDv2實(shí)例是Azure上規(guī)模最大的一次部署,該產(chǎn)品專為處理要求苛刻的AI和高性能計(jì)算應(yīng)用而設(shè)計(jì),是全球速度最快的超級計(jì)算機(jī)之一,可在一個(gè)Mellanox InfiniBand后端網(wǎng)絡(luò)上提供多達(dá)800個(gè)互聯(lián)的NVIDIA V100 Tensor Core GPU。
另外,對于用戶來說,他們將可以在自己的桌面中租用整臺AI超級計(jì)算機(jī),其性能與那些需要數(shù)月時(shí)間才能完成部署的大型本地超級計(jì)算機(jī)相匹配。
英偉達(dá)副總裁兼加速計(jì)算總經(jīng)理Ian Buck表示:“這款在Microsoft Azure上推出的新產(chǎn)品實(shí)現(xiàn)了AI的大眾化,使更多人能夠獲得基礎(chǔ)工具,來解決一些全球最大的挑戰(zhàn)。”
(來源:英偉達(dá))
而英偉達(dá)CEO黃仁勛稱:“高性能計(jì)算正在崛起。機(jī)器學(xué)習(xí)和AI領(lǐng)域的突破正在重新定義科學(xué)研究方法,并且可能帶來激動人心的新架構(gòu)。從超大規(guī)模云到百萬兆級超級計(jì)算,英偉達(dá)GPU與ARM的組合讓創(chuàng)新者們能夠?yàn)椴粩嘣黾拥男聭?yīng)用創(chuàng)建系統(tǒng)。”
同樣在SC19的場合上,英特爾也高調(diào)宣布其推出的首款為高性能計(jì)算設(shè)計(jì)的GPU。英特爾推出的“Ponte Vecchio”,是一款專為高性能計(jì)算建模、模擬工作任務(wù)和人工智能訓(xùn)練而設(shè)計(jì)的GPU,將基于英特爾新一代7納米工藝進(jìn)行制造。
(來源:英特爾)
與英偉達(dá)的CUDA接口類似,英特爾還推出了面向開發(fā)者的onEAPI編程接口,以幫助開發(fā)者實(shí)現(xiàn)跨不同計(jì)算體系結(jié)構(gòu)的軟件開發(fā)。
Ponte Vecchio有望整合到美國能源部(DOE)計(jì)劃于2021交付的下一代百億億次超級計(jì)算機(jī)Aurora中。據(jù)稱Aurora配備了兩個(gè)Intel Xeon Sapphire Rapids處理器和六個(gè)Intel Xe Ponte Vecchio圖形卡。
今年以來,AMD在高性能計(jì)算領(lǐng)域也吸引了一些新客戶,包括將負(fù)責(zé)打造世界最強(qiáng)超級計(jì)算機(jī)之一Frontier(同樣于2021年交付),以及亞馬遜AWS正在擴(kuò)大AMD Epyc處理器使用規(guī)模。在SC19上,AMD同樣宣布將超算能力帶到云上,將推出兩個(gè)新的Amazon Elastic Compute Cloud(Amazon EC2)計(jì)算優(yōu)化實(shí)例。
如今,GPU在這些大型計(jì)算機(jī)中越來越重要,正在成為完成大型計(jì)算任務(wù)的必需品。近日發(fā)布的最新一期全球超級計(jì)算機(jī)榜單top 500也顯示,有越來越多的超級計(jì)算機(jī)系統(tǒng)都配備了圖形處理加速芯片。
最新一期TOP 500榜單,美國超算的整體性能仍是第一,中國在數(shù)量上的領(lǐng)先優(yōu)勢進(jìn)一步擴(kuò)大
目前,全球排在前4位的超算為:橡樹嶺國家實(shí)驗(yàn)室的IBM超算Summit運(yùn)算速度148.6 petaflops;勞倫斯利物莫國家實(shí)驗(yàn)室的IBM超算Sierra運(yùn)算速度94.6 petaflops,中國的神威太湖之光第三運(yùn)算速度93 petaflops;天河二號A以61.4 petaflops排名第四。
Wells Fargo分析師在一份報(bào)告中寫道:“隨著核心增速的放緩,2019年11月的排行榜再次凸顯了GPU在保持計(jì)算機(jī)性能增長方面日益重要的作用,行業(yè)可以通過增加加速器的使用來保持計(jì)算機(jī)性能提升,目前加速器占所有部署核心的27%,而2018年11月這一比例為24%。”