DeepSeek V4發布并開源 百萬字上下文實現普惠


    中國產業經濟信息網   時間:2026-05-07





      4月24日,DeepSeek V4預覽版本宣布正式上線并同步開源,全系列支持100萬token上下文。DeekSeek在公告中表示:“從現在開始,1M上下文將是DeepSeek所有官方服務的標配。”


      根據DeepSeek的官方介紹,DeepSeek V4系列按大小分為兩個版本,分別是DeepSeek-V4-Pro(總參數1.6T、激活參數49B),以及DeepSeek-V4-Flash(總參數284B、激活參數13B)。


      其中,DeepSeek-V4-Pro在Agent能力、世界知識和推理性能方面均迎來了巨大提升。DeepSeek官方表示,DeepSeek-V4-Pro據評測反饋使用體驗優于Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但仍與Opus 4.6思考模型存在一定差距。同時,V4-Pro在世界知識測評中,大幅領先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。另外,在數學、STEM、競賽型代碼的測評中,V4-Pro超越當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的優異成績。


      V4-Flash版本則主打高性價比。在Agent測評中,就執行簡單任務方面與V4-Pro旗鼓相當,在世界知識儲備方面略遜于Pro,推理能力與Pro接近;且由于模型參數和激活參數更小,相較之下能夠提供更加快捷、經濟的API服務。根據DeepSeek官方定價文檔,V4-Pro每百萬token輸入1元(緩存命中)或12元(緩存未命中),輸出24元;V4-Flash則分別為0.2元、1元、2元。


      值得注意的是,此次DeepSeek-V4開創了全新的注意力機制,結合了壓縮稀疏注意力(CSA)和高度壓縮注意力(HCA),顯著減少了計算復雜度,提升了長上下文處理的效率。具體而言,在1M token的上下文設置下,V4-Pro的單token推理FLOPs只有V3.2的27%,KV Cache只有10%;V4-Flash則分別壓縮到了10%和7%。


      V4技術報告中還提到,“我們在英偉達GPU和華為昇騰NPU兩個平臺上均驗證了細粒度EP(專家并行)方案。”據悉,昇騰CANN在當天下午4點直播DeepSeek V4 在昇騰平臺的首發。


      日前,成立3年一直未對外融資的DeepSeek傳出消息,稱將首次開放外部融資。據相關人士透露,騰訊、阿里巴巴等企業正與DeepSeek洽談相關事宜,可能把其估值推高至200億美元以上。此次DeepSeek V4預覽版的發布,或將影響其融資進程。當天,受V4版本發布作用,多支DeepSeek概念股已迎來漲停。(記者 陳存)


      轉自:中國電子報

      【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。

    延伸閱讀

    ?

    版權所有:中國產業經濟信息網京ICP備11041399號-2京公網安備11010502035964

    www.色五月.com