今年以來一路走高的Token(詞元)價格迎來反轉。進入6月,全球多家大模型廠商開始重新調整Token價格,包括OpenAI在內,多家大廠先后被曝將下調Token價格,以回應企業用戶對AI成本暴漲的不滿。
然而,相較此前聲勢浩大的推廣潮,此次Token價格下調更像是行業新一輪殘酷競賽的序幕。多位市場人士分析稱,隨著OpenAI及Anthropic等一批頭部AI廠商陸續推進IPO,市場對AI公司的估值模型正在調整,能否用更低成本持續獲取更多用戶,成為每家公司必須面對的考驗。
競爭加劇 Token迎降價潮
進入6月,Token價格開始逆勢下跌。日前,頭部AI公司OpenAI被曝將于6月啟動新一輪調價,計劃大幅下調Token計費標準。對于此次降價,外界認為將是一場面向對標競品Anthropic的行動,目的在于爭奪企業級客戶。因此,不少業內人士預計,Anthropic或將跟進降價。
事實上,不僅是國際AI巨頭,本月初國產大模型DeepSeek正式執行V4系列模型調價,將Token價格下調至原標價的1/4。按照官方公告,DeepSeek-V4-Flash的輸入緩存命中價格是每百萬Token 0.02元;V4-Pro每百萬價格為0.025元。
“這成本幾乎比生產對應Token所需要的電費還便宜。”一位資深AI創業者告訴上海證券報記者,作為比較,在今年4月前,Open AI最新模型每百萬Token的綜合成本是30美元,“前者價格相當于后者的百分之一,是量級的差別了”。
緊隨其后,小米宣布MiMo-V2.5系列大模型完成調價,部分版本降幅高達99%,同時取消按上下文窗口分段計價的規則,并且Token Plan用量直接提升到原來的5倍至8倍,這意味著其每百萬Token成本基本看齊DeepSeek。
6月16日,字節跳動旗下火山引擎上線Seedance 2.0 mini視頻生成模型,其圖生視頻定價為每千Token 0.023元,視頻生視頻定價為每千Token 0.014元,這一定價較Seedance 2.0明顯降低。此外,近期騰訊云也發布公告,大模型服務平臺TokenHub將于6月15日起下調MiniMax-M3模型價格,推理輸入、推理輸出及緩存命中費用均下調50%。
有意思的是,今年4月,小米MiMo團隊負責人羅福莉曾公開反對打價格戰。她認為,低價賣Token并開發第三方框架的行為,看似吸引用戶,最終會損害用戶體驗。
不過,也有技術工程師告訴記者,此輪Token價格的下調與羅福莉的觀點并不矛盾:“她強調的是之前模型本身性能不足,不顧成本消耗Token的行為,但現在通過模型和上下文壓縮等技術,Token的效率有所提升。”
價格大考來臨 行業洗牌加速
從某種意義上講,此輪降價更像是行業即將面臨的一場商業大考。多位業內人士表示,隨著越來越多AI公司步入資本市場,用戶規模、實際效益等關鍵數據的分量越來越重。
“今年以來最明顯的變化就是,企業端對于AI的真實需求在變多,它構成了真實的商業訂單。”北京某AI大模型獨角獸公司公共事務負責人對記者表示,尤其是今年以來Cloud Code崛起,大模型“編程能力”被越來越多企業看到,催生了這一輪Token用量的暴增。
以Open AI披露的數據為例,該公司最大的Token消耗者每月使用量約為1000億Token,而在6年前,這一數據僅為10萬。然而,在企業真實需求增長的同時,Token價格高企的問題日益凸顯。據報道,不少美國互聯網巨頭在近幾個月紛紛收緊了對Token使用的預算限制。
記者注意到,不少國內頭部互聯網公司對Token使用的態度也開始轉向:從限制用量到對Token使用僅提供部分報銷,顯然高昂的成本讓不少大公司都有些吃不消。
“模型競賽基本到了頭部決勝階段,資本需要看到增長,這里面很重要的就是企業端用戶規模。”上海某券商計算機首席分析師告訴記者。另一位某頭部互聯網公司AI負責人對記者坦言,競爭走到這一步,性能之爭基本結束,性價比將成為重點。
但有意思的是,對不少頭部公司而言,這場降價并非突如其來,相反更像一場預言的兌現。多位技術人士告訴記者,當前影響Token價格的因素無外乎兩個:模型本身技術能力、硬件側成本控制。眼下,這兩個方面都在迅速突破。
在技術側,對稀疏注意力等技術的持續優化,正在讓Token消耗不斷降低。以DeepSeek為例,此次最新模型公布的技術突破中就包括壓縮稀疏注意力機制(CSA)和高壓縮注意力機制(HCA),這兩者都能大幅優化Token在單次任務中的使用。
記者注意到,包括月之暗面KiMi、小米MiMo在內,近期多款國內大模型披露的產品創新性論文中均有類似技術。
在硬件側,按照業內共識,Token在硬件端最終的變數取決于兩方面:芯片成本和電力成本。隨著國家“東數西算”工程的持續推進,在不少綠電能源豐富的節點城市,電價和機房租用的成本都在大幅下降。以內蒙古烏蘭察布為例,記者調研發現,包括華為、阿里、快手等國內廠商均在加快布局。
某算力中心當地運營負責人透露,由于廠商與算力中心的服務合約中電費占據大頭,且多為長年合同,隨著電價以及綜合服務成本的快速下降,廠商Token生產的實際成本明顯回落。此外,多位算力中心人士對記者表示,今年以來國產芯片產能逐步提升,其價格也在回落,帶動Token成本進一步下降。
但顯然,并非所有的大模型公司都能撐住此輪的價格沖擊。有AI行業資深觀察人士直言,部分企業實際上是在被動降價。(記者 羅茂林)
轉自:上海證券報
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀