• 教育部發布推進語言文字信息化發展新舉措


    中國產業經濟信息網   時間:2025-04-02





      3月31日,記者在教育部介紹深入貫徹落實《教育強國建設規劃綱要(2024—2035年)》,推進語言文字信息化發展情況的新聞發布會上獲悉,近日教育部、國家語委、中央網信辦共同印發了《關于加強數字中文建設 推進語言文字信息化發展的意見》(以下簡稱《意見》),部署應用關鍵新技術,構建資源數據新體系,實施賦能全局新行動,全力服務教育強國、科技強國和文化強國建設。


      根據《意見》要求,第一步,到2027年,國家數字中文建設行動取得重要成效,語言文字數據要素價值有效釋放。第二步,到2035年,中文在全球數字空間、網絡空間以及生成式人工智能等關鍵應用場景中的使用占比顯著提高;語言文字信息化有力支撐國家語言能力建設、語言文字事業和經濟社會高質量發展,整體水平位居世界前列。


      教育部語言文字信息管理司司長劉培俊指出,當前數字中國建設的大背景和世界大語言格局,對承載中華文化的中文數字化提出新的要求。


      “《意見》明確提出重點加強數字中文建設,著力推進中文數字化與數據中文化、創新應用與規范安全、新型中文服務體系構建與語言文字治理體系的完善,進一步提升中文在全球數字空間以及人工智能等關鍵應用場景的使用占比和價值引領,進一步提升在全球語言治理框架中中文參與度和在世界文明交流互鑒中的中文貢獻率,為教育強國、科技強國、文化強國建設發揮中文更大的作用。”劉培俊說。


      “加強數字中文建設將從三個維度重塑發展格局,推動中文信息處理技術發展進入新階段。一方面,語言文字要從重要資源轉化為數據要素價值。新形勢下,語言文字將實現從‘靜態符號’向‘動態數字資產’,從‘信息載體’向‘生產要素’的轉型,要重點推動語料庫、數據標注與評價等標準的研制,支持文本生成與理解、語言翻譯、情感分析等各種任務。同時,語言文字要從廣泛存在聚焦到關鍵領域應用,聚焦關鍵垂直領域建設語料基礎設施,構建支持大模型訓練的高質量中文數據集。此外,語言文字還要從基礎支撐提高到賦能全局發展。語言文字將實現與信息技術的深度融合,要形成‘技術突破—場景落地—生態繁榮’的良性循環。”北京大學王選計算機研究所所長湯幟表示。


      據教育部語言文字應用管理司副司長王暉介紹,目前教育部已經啟動布局了新型國家語料庫的建設工作。“一方面是規范引領,主要是加強制度的供給,研制語料庫建設規范,突出價值導向、應用導向、創新導向,統籌質量和安全,為語料庫建設提供基礎原則和方法指引。另一方面是示范引導,成熟先上,開發建設‘中華文脈新型語料庫’‘中華大閱讀體系語料庫’,以這兩個示范庫建設整體打造出標桿。在此基礎上,探索建設系列教育、語言文化國家新型語料庫群,服務教育強國、文化強國建設。”王暉表示。


      值得關注的是,科研院所和高校也在發力數字中文建設。


      “語言文字是文化的基礎要素和鮮明標志,是文化傳承發展的重要載體,是國家軟實力的重要組成部分。北京大學王選計算機研究所將以數字中文建設為契機,深化產學研用協同機制,進一步發揮在人工智能、文字信息處理和字體設計領域的優勢,以發揮中文數據的賦能作用為著力點,努力研發更多優質的中文字庫,滿足社會用字需求,助力中文發揮立德樹人的基礎作用、傳承中華文化的根脈作用、推進科技創新的支撐作用、賦能產業升級的關鍵作用,助力教育強國建設。”湯幟說。


      北京師范大學黨委常委、副校長康震則提到,為積極應對以大語言模型為代表的人工智能技術對教育變革帶來的新機遇、新挑戰,北京師范大學發揮古籍整理智能化關鍵技術優勢,針對古漢語信息處理任務“低資源”“富知識”的特點,以解決領域知識學習需求為核心任務,使用1.8B(18億)參數量,訓練出理解力強、準確率高、應用場景豐富的“AI太炎”古漢語大語言模型。


      “下一步,北京師范大學將認真貫徹落實《意見》,持續推動學科交叉融合和協同創新,強化有組織科研,加快培養復合型人才,推進國家關鍵領域語料庫和智能化關鍵技術研發,探索大語言模型創新應用新范式,為教育強國建設貢獻更多的智慧和力量。”康震表示。(記者 袁小康)


      轉自:經濟參考網

      【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。

    延伸閱讀

    ?

    版權所有:中國產業經濟信息網京ICP備11041399號-2京公網安備11010502035964

    www.色五月.com