預(yù)期目標(biāo):到2025年,智能算力集群節(jié)點(diǎn)擴(kuò)展規(guī)模不低于1024卡,與國內(nèi)外主流人工智能軟硬件環(huán)境完成兼容適配;總體算力規(guī)模超過500 PFLOPS,PUE不超過1.25。開發(fā)支持低響應(yīng)時延、動態(tài)擴(kuò)展等特性的集群云端運(yùn)維管理和調(diào)度系統(tǒng),針對基于Transformer的重點(diǎn)模型具備分鐘級斷點(diǎn)續(xù)訓(xùn)能力。
(三)高質(zhì)量數(shù)據(jù)集
揭榜任務(wù):建設(shè)大規(guī)模通用中文語料庫,加強(qiáng)主流中英文數(shù)據(jù)的清洗及過濾,構(gòu)建標(biāo)準(zhǔn)化語料資源池,整合文字、圖片、音視頻等多模態(tài)數(shù)據(jù)集,并實(shí)現(xiàn)對外開放。打造高質(zhì)量代碼、書籍、人類反饋指令數(shù)據(jù)、科學(xué)文獻(xiàn)等專業(yè)知識數(shù)據(jù)集。面向工業(yè)、醫(yī)藥、電信、金融、教育等重點(diǎn)行業(yè)匯聚高質(zhì)量、權(quán)威的行業(yè)訓(xùn)練數(shù)據(jù)資源,賦能行業(yè)發(fā)展。
預(yù)期目標(biāo):到2025年,實(shí)現(xiàn)通用文本數(shù)據(jù)集規(guī)模總量達(dá)到10TB、通用圖文數(shù)據(jù)集數(shù)據(jù)總量達(dá)到1億對、通用音視頻數(shù)據(jù)集數(shù)據(jù)總量達(dá)到100TB。面向編程代碼、科研文獻(xiàn)、百科教材等專業(yè)知識,以及工業(yè)、醫(yī)藥、電信、金融、教育等重點(diǎn)行業(yè),形成不少于3個高質(zhì)量數(shù)據(jù)集,各數(shù)據(jù)集賦能10個及以上專用模型訓(xùn)練或微調(diào)。
(四)人工智能風(fēng)險(xiǎn)管控軟件
揭榜任務(wù):針對人工智能訓(xùn)練數(shù)據(jù)投毒、算法模型漏洞、敏感有害生成內(nèi)容等重點(diǎn)風(fēng)險(xiǎn),研發(fā)多維度一體化的人工智能風(fēng)險(xiǎn)管控軟件產(chǎn)品。構(gòu)建人工智能安全風(fēng)險(xiǎn)測評數(shù)據(jù)集,提出相應(yīng)安全風(fēng)險(xiǎn)的檢測、防御方法,支持人工智能應(yīng)用服務(wù)、中間件與基礎(chǔ)依賴組件等對象的漏洞檢測與及時預(yù)警,識別生成內(nèi)容潛在偏見歧視、倫理、違規(guī)違法等風(fēng)險(xiǎn)。
預(yù)期目標(biāo):到2025年,構(gòu)建3個人工智能安全風(fēng)險(xiǎn)測評數(shù)據(jù)集,覆蓋偏見歧視、違規(guī)違法、惡意指令注入、倫理等多維度安全風(fēng)險(xiǎn),提出不少于10種面向人工智能數(shù)據(jù)安全風(fēng)險(xiǎn)的檢測、防御方法,組織不少于5個典型智能產(chǎn)品開展試點(diǎn)驗(yàn)證工作。
二、重點(diǎn)產(chǎn)品
(五)語言大模型產(chǎn)品
揭榜任務(wù):探索以知識為中心的大模型范式,通過上下文編碼、動態(tài)記憶機(jī)制等核心技術(shù),提升語言認(rèn)知大模型的智慧涌現(xiàn)水平。對標(biāo)國際先進(jìn)產(chǎn)品,提升中英雙語的語義理解、邏輯推理、代碼編程等能力,實(shí)現(xiàn)在線知識咨詢功能,能夠?qū)崟r融合基于互聯(lián)網(wǎng)的海量信息。開展大模型推理加速算法研究,提升語言大模型賦能智能產(chǎn)品的部署效率。
預(yù)期目標(biāo):到2025年,語言大模型在中英文均達(dá)到世界先進(jìn)水平,提升大模型泛化能力,零樣本或少樣本學(xué)習(xí)在超過30個基準(zhǔn)中達(dá)到優(yōu)異性能。中英雙語認(rèn)知能力全面提升,在模型常識性、專業(yè)性、邏輯性、推理能力方面取得重大突破。語言大模型在數(shù)字座艙、機(jī)器人或語音助手等領(lǐng)域?qū)崿F(xiàn)應(yīng)用。
(六)語音大模型產(chǎn)品
揭榜任務(wù):研究具有高通用性和高解釋性的通用語音表征理論和方法,突破語音數(shù)據(jù)依賴性強(qiáng)、領(lǐng)域適應(yīng)性弱等難題,實(shí)現(xiàn)超大規(guī)模語音表征訓(xùn)練、語音表征信息解耦合建模等關(guān)鍵技術(shù),支撐語音大模型的泛化性。構(gòu)建面向多個語種、多個語音任務(wù)共享的語音大模型,賦能語音助手、虛擬客服、數(shù)字人等智能產(chǎn)品的智能化升級。
預(yù)期目標(biāo):到2025年,語音大模型達(dá)到世界先進(jìn)水平,覆蓋語種超20個,其中漢語、英語、法語等5個以上重點(diǎn)語種的處理效果業(yè)界領(lǐng)先,可支撐語音識別、語音合成、聲紋識別、情感識別等10個以上語音任務(wù),性能較傳統(tǒng)模型實(shí)現(xiàn)顯著提升。
(七)視覺大模型產(chǎn)品
揭榜任務(wù):研究視覺大模型統(tǒng)一算法底層架構(gòu),創(chuàng)新視覺大模型訓(xùn)練路徑,構(gòu)建支持動態(tài)視覺理解和生成統(tǒng)一的底層基礎(chǔ)模型架構(gòu),突破靜態(tài)向動態(tài)視覺大模型的范式升級。視覺大模型能夠通過少樣本微調(diào)解決圖像、視頻等視覺任務(wù),生成式任務(wù)指標(biāo)達(dá)到國際先進(jìn)水平,解決視覺大模型的高效設(shè)計(jì)、有效訓(xùn)練、快速推理等關(guān)鍵技術(shù)問題。
預(yù)期目標(biāo):到2025年,訓(xùn)練超過千億級參數(shù)規(guī)模的通用視覺大模型,能夠通過少樣本微調(diào)方式解決超過30個視覺基礎(chǔ)任務(wù)(包括10個以上動態(tài)視覺或三維視覺任務(wù))并且表現(xiàn)出色,推理速度達(dá)到全球領(lǐng)先,具備在智能終端產(chǎn)品的部署能力。
(八)多模態(tài)大模型產(chǎn)品