近日,中國電信人工智能研究院(TeleAI)聯合北京智源人工智能研究院發布全球首個單體稠密萬億參數語義模型Tele-FLM-1T,成為國內首批發布稠密萬億參數大模型的機構。
針對大模型訓練算力消耗高的問題,TeleAI與智源基于模型生長和損失預測等關鍵技術聯合研發出Tele-FLM系列模型,僅使用了業界普通訓練方案9%的算力資源。雙方基于112臺A800服務器,用4個月完成3個模型總計2.3T tokens的訓練。模型訓練全程做到了零調整零重試,算力能效高且模型收斂性和穩定性好。Tele-FLM-1T版本即將開源,有望為社區訓練萬億稠密模型提供技術參考,避免萬億模型訓練收斂難等問題。
作為最早布局并首先開源大模型的央企機構,TeleAI在中國電信CTO、TeleAI院長李學龍的帶領下,堅持全鏈路完全自主研發創新,去年發布了千億參數星辰語義大模型,性能處于國內同級別參數模型的前列。今年2月,TeleAI自主研發的星辰大模型首次通過了境內深度合成服務算法備案。5月15日,根據北京市生成式人工智能服務備案信息公告,星辰大模型再次通過產品備案。“雙備案”標志著星辰大模型可正式對外提供生成式人工智能服務。
同時,TeleAI積極通過開源推動大模型技術進步和大模型國產化進程,加快研發創新,接連開源7B、12B、52B參數規模大模型,吸引國內外開源社區開發者廣泛討論和使用,開源模型下載量過萬,積累超40萬用戶。隨著TeleChat系列模型的發布,TeleAI同步對多個大模型落地項目進行了能力升級,顯著提升了項目交付質量。某市民生訴求場景項目引入TeleChat-52B模型能力,整體應用效果提升40%,達到行業領先水平。
目前,TeleAI攜手行業領軍者共同打造了面向教育、政務、應急等20多個行業的大模型,通過不斷升級的語音、視覺以及多模態大模型技術能力,共同推動大模型技術與各行業的深度融合,助力千行百業轉型升級。未來,TeleAI還將進一步為客戶、生態伙伴、開發者及個人用戶提供前沿的AI能力,切實推進國內AI技術進步及落地應用,加速全社會邁向通用人工智能時代。
轉自:人民郵電報
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀