與英偉達(dá)的NVlink相似,AMD則推出了其Infinity Fabric技術(shù),AMD Infinity 架構(gòu)與第二代 AMD EPYC處理器一同推出,使系統(tǒng)構(gòu)建者和云架構(gòu)師能夠釋放最新的服務(wù)器性能,同時又不犧牲功能、可管理性或幫助保護(hù)組織最重要資產(chǎn)(數(shù)據(jù))的能力。Infinity Fabric支持芯片間、芯片對芯片,以及即將推出的節(jié)點(diǎn)對節(jié)點(diǎn)的數(shù)據(jù)傳輸。
英特爾則是以太網(wǎng)的堅(jiān)實(shí)擁護(hù)者,英特爾的用于生成式AI的Gaudi AI芯片則一直沿用傳統(tǒng)的以太網(wǎng)互聯(lián)技術(shù)。Gaudi 2每個芯片使用了24個100Gb以太網(wǎng)鏈路;Gaudi 3也使用了24個200Gbps以太網(wǎng)RDMA NIC,但是他們將這些鏈路的帶寬增加了一倍,達(dá)到200Gb/秒,使芯片的外部以太網(wǎng)I/O總帶寬達(dá)到8.4TB/秒。
拼服務(wù)
諸如ChatGPT這樣的生成式AI開發(fā)任務(wù)極其復(fù)雜,大模型需要在多臺計(jì)算機(jī)上運(yùn)行數(shù)十億到數(shù)萬億個參數(shù),它需要在多個GPU上并行執(zhí)行工作,采用張量并行、流水線并行、數(shù)據(jù)并行等多種并行處理方式,以盡可能快地處理任務(wù)。
因此,如何能夠幫助用戶更快的開發(fā),提供良好的服務(wù)也是關(guān)鍵一役。
在這方面,英偉達(dá)推出了一種新型的軟件NIMS,即NVIDIA Inference Microservices(推理微服務(wù))。黃仁勛稱之為“盒子里的人工智能”,NIMS中包含了英偉達(dá)的CUDA、cuDNN、TensorRT、Triton。NIMS 不僅使部署 AI 變得更容易,只需幾分鐘而不是幾個月,它們還構(gòu)成了客戶可以創(chuàng)建新應(yīng)用程序和解決新問題的構(gòu)建塊。如果采用,NIMS 將有助于加速創(chuàng)新并縮短價值實(shí)現(xiàn)時間。Nvidia 還宣布,NIMS 現(xiàn)在可供開發(fā)人員和研究人員免費(fèi)使用。在生產(chǎn)中部署NIMS需要AI Enterprise許可證,每個GPU的價格為4500美元。
結(jié)語
下一場AI之戰(zhàn)已然打響,綜合來看,當(dāng)前AI芯片市場上,英偉達(dá)、AMD和英特爾等主要芯片巨頭正在展開激烈的競爭。他們不僅在速度、技術(shù)和工藝方面競相創(chuàng)新,還在互聯(lián)和服務(wù)等領(lǐng)域積極拓展,致力于為用戶提供更快、更強(qiáng)、更智能的AI解決方案。AI芯片爭霸戰(zhàn)仍在繼續(xù),誰能最終勝出?讓我們拭目以待。
(原標(biāo)題:下一代AI芯片,拼什么?)