2025年1月6日,昆侖萬維正式將「天工大模型4.0」o1版和4o版同步上線,并全量登陸天工網頁和APP,人人免費可用。
作為國內第一款中文邏輯推理能力的o1模型(Skywork o1),不僅包含上線即開源的模型,還有兩款性能更強的專用版本。經過全方位的技術棧升級和模型優化,由昆侖萬維自研的Skywork o1系列能熟練處理各種推理挑戰,包括數學、代碼、邏輯、常識、倫理決策等問題。
「天工大模型4.0」4o版(Skywork 4o)是由昆侖萬維自研的多模態模型,其賦能的實時語音對話助手Skyo,則是一個具備情感表達能力、快速響應能力、多語言流暢切換的智能語音對話工具。
當前,這兩款模型已正式登陸昆侖萬維旗下天工web與APP,全面向用戶開放。
天工AI官方地址:(進入后可直接體驗o1版)
01. Skywork o1為用戶帶來更極致的推理能力,正式上線天工web
相較于之前的版本,正式上線的Skywork o1進行了重磅升級,體現在以下三個方面:PRM優化,基于Q*算法的推理系統優化,創新性提出Step-DAPO算法,力爭解決訓練效果不穩定、計算資源開銷過大等問題。
全面升級且正式上線的Skywork o1 Lite / Skywork o1 Preview大幅提升了數學、代碼和邏輯推理能力。我們對其進行標準數學基準測試(包括GSM8k、MATH、OlympiadBench、AIME-24以及AMC-23),以及在HumanEval、MBPP、LiveCodeBench及BigCodeBench這四項代碼基準測試上評估了Skywork o1的代碼能力。
表1丨Skywork o1在數學基準評測上的表現
表2丨Skywork o1在代碼基準評測上的表現
*備注:對于BigCodeBench,我們采用它的instruct子集進行測試
可以看出,在數學、代碼基準測試中,Skywork o1的能力表現逼近o1-mini,顯著優于行業常規通用大模型。
02. Skywork 4o賦能的Skyo,已全面登陸天工APP
圖丨天工APP中Skyo入口與界面(來源:昆侖萬維)
為了達成“像和真人一樣說話聊天”的效果,Skyo 堅持采用更先進的創新路線,通過多模態 LLM 端到端建模,來解決這個難題。
圖丨Skyo所采用的語音對話框架(來源:昆侖萬維)
Skyo 的上線是昆侖萬維在智能語音交互技術方向,從“操縱機器”邁向“和真人交流”的重要一步。
03. 堅定邁向AGI時代
過去兩年,昆侖萬維已完成“算力基礎設施—大模型算法—AI應用”全產業鏈布局,并構建起由AI大模型、AI搜索、AI游戲、AI音樂、AI 社交、AI短劇組成的多元AI業務矩陣。我們堅信,所有在模型與產品上進化的每一小步,都是邁向實現通用人工智能的一大步。昆侖萬維仍會堅持以技術為底座,以產品為先鋒,給用戶帶來更好的使用體驗,為推動人工智能技術的發展和應用做出貢獻,立志成為一家小而大美的國際化人工智能企業。
轉自:中國網
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀