當前位置首頁 > 中國制造 > 創新 >

DeepSeek V4發布并開源百萬字上下文實現普惠

中國產業經濟信息網時間：2026-05-07

　　4月24日，DeepSeek V4預覽版本宣布正式上線并同步開源，全系列支持100萬token上下文。DeekSeek在公告中表示：“從現在開始，1M上下文將是DeepSeek所有官方服務的標配。”

　　根據DeepSeek的官方介紹，DeepSeek V4系列按大小分為兩個版本，分別是DeepSeek-V4-Pro（總參數1.6T、激活參數49B），以及DeepSeek-V4-Flash（總參數284B、激活參數13B）。

　　其中，DeepSeek-V4-Pro在Agent能力、世界知識和推理性能方面均迎來了巨大提升。DeepSeek官方表示，DeepSeek-V4-Pro據評測反饋使用體驗優于Sonnet 4.5，交付質量接近Opus 4.6非思考模式，但仍與Opus 4.6思考模型存在一定差距。同時，V4-Pro在世界知識測評中，大幅領先其他開源模型，僅稍遜于頂尖閉源模型Gemini-Pro-3.1。另外，在數學、STEM、競賽型代碼的測評中，V4-Pro超越當前所有已公開評測的開源模型，取得了比肩世界頂級閉源模型的優異成績。

　　V4-Flash版本則主打高性價比。在Agent測評中，就執行簡單任務方面與V4-Pro旗鼓相當，在世界知識儲備方面略遜于Pro，推理能力與Pro接近；且由于模型參數和激活參數更小，相較之下能夠提供更加快捷、經濟的API服務。根據DeepSeek官方定價文檔，V4-Pro每百萬token輸入1元（緩存命中）或12元（緩存未命中），輸出24元；V4-Flash則分別為0.2元、1元、2元。

　　值得注意的是，此次DeepSeek-V4開創了全新的注意力機制，結合了壓縮稀疏注意力（CSA）和高度壓縮注意力（HCA），顯著減少了計算復雜度，提升了長上下文處理的效率。具體而言，在1M token的上下文設置下，V4-Pro的單token推理FLOPs只有V3.2的27%，KV Cache只有10%；V4-Flash則分別壓縮到了10%和7%。

　　V4技術報告中還提到，“我們在英偉達GPU和華為昇騰NPU兩個平臺上均驗證了細粒度EP（專家并行）方案。”據悉，昇騰CANN在當天下午4點直播DeepSeek V4 在昇騰平臺的首發。

　　日前，成立3年一直未對外融資的DeepSeek傳出消息，稱將首次開放外部融資。據相關人士透露，騰訊、阿里巴巴等企業正與DeepSeek洽談相關事宜，可能把其估值推高至200億美元以上。此次DeepSeek V4預覽版的發布，或將影響其融資進程。當天，受V4版本發布作用，多支DeepSeek概念股已迎來漲停。（記者陳存）

　　轉自：中國電子報

返回產經網首頁 >>

　　【版權及免責聲明】凡本網所屬版權作品，轉載時須獲得授權并注明來源“中國產業經濟信息網”，違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊，僅代表作者個人觀點，不代表本網觀點和立場。版權事宜請聯系：010-65363056。

延伸閱讀

熱點視頻

科技賦能玫瑰產業升級校企合作共筑鄉村振興新篇章

熱點新聞

DeepSeek V4發布并開源 百萬字上下文實現普惠

熱點視頻

熱點新聞

微信公眾號

DeepSeek V4發布并開源百萬字上下文實現普惠