揭榜任務:研制高速4D面部采集技術,研究并實現批量化、自動化的產業(yè)級面部模型處理與制作流程。基于多模態(tài)信息進行多樣化采集,建設人臉高精度4D模型數據庫,實現高逼真數字人面部和身體的快速構建。搭建基于大模型的多模態(tài)數字人交互系統,實現視覺、聽覺等多模態(tài)輸入信息的統一表征,實現基于預訓練模型的表情、動作推理。
預期目標:到2025年,數字人4D面部動態(tài)重建幀率≥30fps,綁定后生成表情誤差小于5mm,數字人的自然度、真實度等主觀體驗評分達到行業(yè)領先水平?;诙嗄B(tài)交互輸入結合大模型實現高準確度、低延遲的動作、表情、行為推理。
(七)虛擬空間創(chuàng)作平臺
揭榜任務:研究基于元宇宙虛擬空間的構建系統,實現低代碼快速構建虛擬空間。研究音視頻互動平臺,實現在元宇宙中進行語音、視頻交流。研究多人協作系統,實現數字孿生模型的多人交互協作。研究共享桌面技術,實現多人共享演示內容。研究元宇宙空間與云渲染方式的融合,實現手機或PC訪問元宇宙空間。研究人物換裝、捏臉功能,實現在虛擬空間中打造個性化的數字人。集成智能助手,提供專屬場景的業(yè)務問答與指令。
預期目標:到2025年,實現不少于5類場景的低代碼快速構建,支持會議元宇宙、展覽元宇宙、教育元宇宙、辦公元宇宙、園區(qū)元宇宙等場景,場景運行流暢不卡頓。支持在線人數、模型加載效率、延遲時間等核心指標達到國際先進水平。
(八)3D沉浸式實時通信系統
揭榜任務:研究基于多模態(tài)、多視角的三維視覺技術,實現對人、物、場的動態(tài)三維數據采集、建模和顯示。研制基于多傳感器的三維數據捕捉設備和基于裸眼3D顯示器的沉浸式實時通信系統,旨在提供身臨其境的沉浸感體驗,可應用于視頻會議和遠程協作,為遠程教育和培訓、遠程手術和醫(yī)學會診、游戲和文旅等領域提供新的技術手段。
預期目標:到2025年,3D沉浸式實時通信系統從采集到呈現端到端時延小于400ms,幀率大于25,三維重建平均誤差、結構相似性、感知損失指標達到行業(yè)領先水平。
(九)3D實景地圖平臺
揭榜任務:研究3D實景地圖平臺,突破3D實景地理實體在語義化、結構化等維度上的技術瓶頸。研究用時空數據編織與時空知識圖譜技術實現對地理實體自身屬性及實體間關系進行一致性描述,以實現地理實體的語義化,達到計算機可理解、可分析。研究用GeoAI方法識別分類技術,實現地理實體單體分割并獲取其幾何輪廓及組成結構。在城市規(guī)劃、應急防災、交通治理等場景下實現快速批量應用。
預期目標:到2025年,地理實體語義化覆蓋率、結構化準確率等核心指標達到行業(yè)領先。
(十)基于文本描述的3D場景生成系統
揭榜任務:研究基于文本描述的3D場景生成系統,突破傳統方法需要大量標記3D模型數據集的限制,解決當前基于文本描述的3D場景生成算法結果過飽和、過平滑、缺少細節(jié)等問題。研究多模態(tài)室內3D場景生成,實現高質量3D內容生成,包括復雜效果,基于文本生成多樣性3D內容和360°場景等。研究基于分布式云渲染實現多模態(tài)實時3D場景生成系統,實現高帶寬高質量內容實時傳輸,海量高質量3D內容實時云端生產、渲染、交互。
預期目標:到2025年,實現根據輸入的文本信息,對于實例輸入的文本生成特定實例圖像。實現基于文本或文本+圖像的室內3D場景的生成,生成場景的渲染視角圖像與文本一致性指標CLIP score、渲染圖像的感知指標Inception score等核心指標達到國際領先。
三、公共支撐
(十一)元宇宙數字身份標識技術解決方案
揭榜任務:研究元宇宙數字身份標識技術,構建跨平臺、跨設備、跨系統的元宇宙中數字身份及作品標識體系。研究數字身份映射體系,將元宇宙中數字身份與現實中人員身份關聯,確保元宇宙世界中數字身份活動的真實性。通過“嵌入式”標識服務,為每個數字身份及相關作品分配唯一數字標識,建立起可信賴、可查驗、可追溯的數字身份及標識管理體系。
預期目標:到2025年,實現元宇宙數字身份標識技術解決方案在至少1類行業(yè)領域開展應用試點;實現元宇宙數字身份及作品的唯一標識技術,數字身份標識可跨平臺、跨設備、跨系統互認互通;技術解決方案的安全性、創(chuàng)新性及實用性達到行業(yè)領先水平。
附:1.2023年未來產業(yè)創(chuàng)新任務揭榜單位推薦表-元宇宙方向