日前,國家數據集管理服務平臺在數字中國建設峰會上正式發布,并啟動試運行,標志著我國高質量數據集建設工作邁入集約化管理新階段。
據悉,國家數據集管理服務平臺由國家數據局指導、國家數據發展研究院建設和運營,以數據集目錄匯聚為基礎,構建“物理分散、邏輯集中”的數據集管理體系,提供覆蓋數據集全生命周期的公共服務能力,進一步促進高質量數據集有效供給,繁榮產業生態。
平臺服務三類核心用戶,一是向數據管理部門提供數據集目錄管理、建設情況監測等功能,提升數據集管理效能;二是向數據集供給方提供數據集發布、憑證申領、質量測評等功能,賦能高質量數據集建設;三是向數據集需求方提供查詢檢索、需求發布等功能,加快數據集流通利用。
目前,平臺已開放供需發布、全域檢索、憑證申領等基本功能,并與國家數據基礎設施以及安徽省等地方平臺完成對接。截至發布當日,平臺已認證供需主體200余家,發布數據集1000余個。
當前,人工智能正處于從“可用”邁向“好用”的關鍵躍升期,高質量數據集作為大模型訓練的“基石”,其供給規模和質量直接決定了人工智能創新高度和產業落地深度。
根據國家數據局發布的數據,目前我國高質量數據集建設工作取得顯著成效。截至2025年底,全國已建成的高質量數據集超過了10萬個,總體量超過890PB;到今年3月,我國日均Token的調用量超過140萬億。
國家數據發展研究院副院長袁軍在接受記者采訪時表示,我國高質量數據集客觀上仍面臨三大痛點:一是建設主體分散,導致數據管理部門難以全面掌握資源底數與建設進展;二是供給側信息不對稱,容易出現重復建設、質量參差不齊等問題;三是需求側獲取成本高、周期長,限制技術創新效率。
“此次發布的平臺既不是簡單的政府監管工具,也不是新的數據交易場所,而是一個覆蓋高質量數據集全生命周期的國家級公共服務基礎設施。”袁軍表示,平臺采用“物理分散、邏輯集中”的匯聚模式,構建全國統一的數據集資源目錄與管理體系,推動高質量數據集供得出、流得動、用得好,實現全國“底數一本賬、調度一盤棋、協作一張網”的工作格局,為人工智能國家戰略提供堅實的數據支撐。
袁軍表示,國家數據集管理服務平臺的正式發布,將有效破解高質量數據集建設痛點、打通供需流通堵點,為人工智能應用注入強勁動能。通過持續迭代優化、深化開放協同,全力服務國家人工智能戰略,讓數據要素更好賦能產業發展、支撐數字中國建設。
袁軍介紹,下一步,將持續擴大用戶規模,廣泛調動各類重點供需主體,快速提升用戶與資源規模。到2026年底,全面建成覆蓋數據集全生命周期、貫通各地區各部門的一體化管理服務體系,向人工智能核心領域與重點行業不斷延伸,并與地方和行業相關平臺全面對接,實現資源全域匯聚、供需高效匹配、管理精準智能、安全可信可控,打造質量可測、權益可保、供需可通的良性生態,成為數據要素賦能人工智能創新發展的國家級樞紐。
轉自:人民郵電報
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀