• 聚焦高質量數據集建設 行業數據智能標注聯合實驗室成立


    中國產業經濟信息網   時間:2025-05-05





      4月28日,在第八屆數字中國建設峰會期間,中國電信北京公司聯合北京郵電大學共同宣布成立“行業數據智能標注聯合實驗室”。據介紹,該聯合實驗室依托京津冀算力協同等優勢,構建從采集、存儲到加工的全流程治理環節,形成專屬工具集與行業標準,并將推動人形機器人、具身智能等領域的數據標注標準化,助力行業數據標準建設。


      行業數據智能標注是人工智能產業發展的核心支撐技術之一,通過智能化技術手段,對多模態數據進行分類、標記、注釋等加工處理,將其轉化為可供機器學習模型訓練和推理的高質量數據集。


      據介紹,聯合實驗室針對大模型數據集海量、多源、多模態且具高準確性、一致性和時效性要求的特點,構建了從采集、存儲到加工的全流程治理能力,為各行業打造高質量數據集。在采集環節,整合多源數據,獲取多模態信息并確保實時更新;存儲上,采用分布式架構與異構存儲方式;加工時,進行數據清洗、過濾及增強。


      據悉,聯合實驗室研究計劃分三階段推進:2025年度將聚焦北京電信大同數據標注基地,研發行業數據標注技術解決方案與智能輔助工具,構建可復用的標準化方法論體系,形成支撐多大型標注項目并發的技術服務能力;2026年度依托聯合實驗室與標注基地,系統建設覆蓋金融、醫療等關鍵領域的8個行業高質量數據集,同步開發數據可信空間技術實施方案,構建數據治理閉環框架;2027年度重點開展成果轉化與生態建設,發布10個高端數據標注示范案例,牽頭制定數據標注質量評估、可信數據空間構建等領域的行業技術標準,推動形成涵蓋數據采集、治理、應用的全鏈條評價體系。


      “聯合實驗室整合了中國電信數據標注技術、算力優勢、山西大同市大規模標注人才優勢、北京郵電大學強大的技術研發優勢,目前已形成文本、語音、圖像、視頻等7類模態數據提供50余種智能標注工具,為數據要素市場和人工智能產業建設不斷貢獻方案和力量。”北京電信總經理助理張康介紹。


      北京郵電大學經濟管理學院院長閆強說,數字經濟時代需要建立人才培養機制,將通過共建聯合實驗室、定向培養計劃、項目制實習基地等創新模式,實現“企業命題、高校解題”的良性互動。(記者 郭倩)


      轉自:經濟參考網

      【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。

    延伸閱讀

    ?

    版權所有:中國產業經濟信息網京ICP備11041399號-2京公網安備11010502035964

    www.色五月.com