• 聯想將單臺服務器運行大模型性能推向新高


    中國產業經濟信息網   時間:2025-03-22





      3月17日,聯想宣布旗下首款AMD AI大模型訓練服務器聯想問天WA7785a G3在單機部署671B(滿血版) DeepSeek大模型時,可實現極限吞吐量6708token/s,將單臺服務器運行大模型的性能推向了新高。


      據悉,依托聯想萬全異構智算平臺,聯想通過訪存優化、顯存優化、PCIe 5.0全互聯架構創新以及精選SGLang框架中性能最優算子等諸多創新方式,對大模型從預訓練、后訓練到推理的全流程進行持續優化,在單臺部署DeepSeek 671B大模型的聯想問天WA7785a G3上實測最高吞吐量達6708 token/s。


      在模擬問題對話場景(上下文序列長度128/1K)時,最高可支持并發數158,TPOT 93毫秒, TTFT 2.01秒;而在模擬代碼生成(上下文序列長度512/4K )時,并發數可達140,TPOT 100毫秒, TTFT 5.53秒。意味著單臺聯想問天WA7785a G3可以支撐1500人規模企業的正常使用,是繼聯想問天WA7780 G3服務器單機部署滿血版DeepSeek大模型總吞吐量突破2500 token/s之后,單機部署該大模型推理性能的又一次突破。


      此次突破是聯想中國基礎設施業務群、聯想研究院ICI實驗室和AMD聯合設計、協同調優、共同實現的。此結果也并非最終結果,聯想與AMD還在持續嘗試深度調優新方法,實現更高調優突破。(記者 李方)


      轉自:中國經濟網

      【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。

    延伸閱讀

    ?

    版權所有:中國產業經濟信息網京ICP備11041399號-2京公網安備11010502035964

    www.色五月.com