像賣(mài)流量一樣賣(mài)Token,字節的新生意經(jīng)。
文|《中國企業(yè)家》記者 閆俊文
字節跳動(dòng)緊緊抓住了AI時(shí)代的流量——Token(詞元),就像計算機時(shí)代的存儲單位Byte(字節)一樣。也讓Token調用量多寡,成為衡量大模型競爭力、企業(yè)需求、商業(yè)化落地的重要指標。
字節跳動(dòng)旗下火山引擎披露,截至2025年12月,豆包大模型日均Token調用量已經(jīng)超過(guò)50萬(wàn)億,半年內增長(cháng)200%,比去年同期增長(cháng)了10倍,在全球僅次于OpenAI和Google。
火山引擎總裁譚待提及,不同于云計算時(shí)代的IaaS、PaaS以及SaaS架構,在A(yíng)I云原生架構中,模型是軟件的核心。大模型能力的持續提升,會(huì )解鎖新場(chǎng)景,帶動(dòng)Token使用量增長(cháng)。雖然目前火山引擎的Token消耗有相當比例來(lái)自于字節的“內循環(huán)”,但累計使用上萬(wàn)億Token的外部客戶(hù)已超過(guò)100家。
Token的消耗大戰,也讓字節更激進(jìn)地在算力和資本開(kāi)支上布局。12月23日,《金融時(shí)報》報道,字節計劃在2026年豪擲1600億元加碼AI,其中一半預算將用于采購AI芯片——這大概相當于字節2025年凈利潤的四分之一。
在應用端,字節也在極速拉升競爭水位。12月24日,數據顯示:豆包App的DAU(日活用戶(hù))已突破1億大關(guān)。同時(shí),豆包的用戶(hù)增長(cháng)、市場(chǎng)推廣費用,也是字節歷史上所有破億DAU產(chǎn)品中花費最低的。
近日據《晚點(diǎn)LatePost》報道,火山引擎將成為2026年中央廣播電視總臺春節聯(lián)歡晚會(huì )獨家AI云合作伙伴,豆包App也將配合上線(xiàn)多種互動(dòng)玩法??梢韵胍?jiàn),國內AI行業(yè)的競爭格局或將很快面臨新一輪改寫(xiě)。
字節Token消耗的快速增長(cháng),除了模型能力,很大程度上也倚仗于“鈔能力”之下,字節不惜代價(jià)地搶占市場(chǎng)。
金沙江創(chuàng )投董事總經(jīng)理朱嘯虎在接受采訪(fǎng)時(shí)稱(chēng),現在一個(gè)100萬(wàn)DAU的產(chǎn)品每天就可以消耗幾百億Token,這個(gè)量級很容易做到,增長(cháng)很快。
2025年下半年以來(lái),火山引擎開(kāi)啟了“甩賣(mài)”模式,AI硬件、AI玩具等高Token消耗產(chǎn)品,均是火山瞄準的重點(diǎn)銷(xiāo)售對象。
一位AI英語(yǔ)學(xué)習硬件公司員工告訴《中國企業(yè)家》,公司的硬件產(chǎn)品售價(jià)200多元。此前,他們曾花數百萬(wàn)元買(mǎi)了5臺服務(wù)器做本地適配,發(fā)現算不過(guò)來(lái)賬。后來(lái)發(fā)現他們只需要付給火山引擎幾十元,用戶(hù)就可以永久調用火山引擎的云端大模型。
據他估算,一個(gè)火山引擎用戶(hù)一年算力資源成本至少要50~80元?!暗F在火山算力資源利用不飽和,只能打折便宜賣(mài)給硬件廠(chǎng)商?!?/p>
當被問(wèn)到為什么不選擇阿里云呢?上述人士說(shuō):“阿里云產(chǎn)品太多,接口也太多,不如火山簡(jiǎn)單?!?/p>
另一家AI玩具廠(chǎng)商員工向《中國企業(yè)家》透露,用戶(hù)買(mǎi)完硬件之后,雖然可以永久免費調用大模型,但用戶(hù)不可能一天24小時(shí)對話(huà)。實(shí)際調用Token累積可能不過(guò)幾天時(shí)間,調用總量很低,這也讓云廠(chǎng)商有利可圖。
為了支持AI玩具和各類(lèi)AI硬件,火山引擎基于新推出的豆包大模型1.8系列模型,也推出了玩具AI框架、音頻AI框架等開(kāi)發(fā)套件,授權收費形式分為三個(gè)月、一年與終身使用不限量。
2025年6月,接入豆包大模型的AIoT產(chǎn)品數量是100萬(wàn)臺。半年之后,該數據已經(jīng)增長(cháng)至600萬(wàn)臺。
但火山引擎智能算法負責人吳迪透露,他在內部經(jīng)常跟團隊說(shuō),不要把2025年定義為AIoT元年,2026年、2027年可能也不是爆發(fā)元年,但每一年都比前一年更加重要、機會(huì )更大。比如一個(gè)臺燈搭配云端豆包大模型,成本不到100元,但附加值可能會(huì )超過(guò)專(zhuān)業(yè)的課外輔導老師。
在to C端的領(lǐng)先優(yōu)勢,也被字節不斷向云端反哺。豆包已經(jīng)是中國用戶(hù)量最高的AI原生應用,根據QuestMobile數據:2025年第三季度,豆包的月活躍用戶(hù)數為?1.72億?,超過(guò)了DeepSeek等對手。
《中國企業(yè)家》注意到,最近,字節跳動(dòng)正將豆包App的能力以“豆包助手API”形式開(kāi)放給各大開(kāi)發(fā)者和硬件廠(chǎng)商。目前,該API已經(jīng)開(kāi)放了日常溝通、聯(lián)網(wǎng)搜索等功能,未來(lái)還將陸續推出拍照識圖、實(shí)時(shí)翻譯等。
從成本側看,豆包助手API調用價(jià)格高于火山引擎的Token消耗價(jià)格。其采取“后付費”模式,日常溝通0.1元/次,聯(lián)網(wǎng)搜索0.2元/次,邊想邊搜0.5元/次,0.5元的單次調用價(jià)格已接近豆包大模型百萬(wàn)Token的輸入價(jià)格。
一位相關(guān)人士解釋稱(chēng):“賣(mài)Token是賣(mài)水,但豆包助手API相當于賣(mài)飲料,無(wú)需企業(yè)從零搭建?!倍拱諥PI打出的口號是“億級用戶(hù)驗證效果,企業(yè)快速享受穩定、高效的智能服務(wù)”。
字節跳動(dòng)不放過(guò)小機會(huì )、賺小錢(qián)的同時(shí),它亦瞄準大機會(huì )。豆包手機最近在市場(chǎng)上掀起軒然大波,也讓字節對手機這個(gè)用戶(hù)量最大硬件載體的野心昭然若揭。
2025年12月1日,豆包發(fā)布豆包手機助手,在中興nubia M153系列手機上,豆包手機助手獲得了操作系統層面的高權限,通過(guò)GUI(圖形用戶(hù)界面)手段,完成了跨平臺比價(jià)、點(diǎn)外賣(mài)等任務(wù),但很快遭到了微信、淘寶等超級App的“拉黑”狙擊。
但字節并未停下腳步。12月19日,媒體披露,字節跳動(dòng)正在推進(jìn)與vivo、聯(lián)想、傳音等硬件廠(chǎng)商開(kāi)展AI手機的合作,為其設備預裝插件,從而獲得用戶(hù)入口。
關(guān)于火山引擎每天Token調用量超過(guò)50萬(wàn)億,譚待在接受媒體采訪(fǎng)時(shí)表示:企業(yè)占了Token調用的80%,個(gè)人占20%。而此前云時(shí)代,企業(yè)和個(gè)人用量占比是8.5:1.5,現在A(yíng)I時(shí)代可能是7.5:2.5,“未來(lái)可能個(gè)人還會(huì )再高一點(diǎn)”。
相較于硬件和個(gè)人,Agent落地在企業(yè)端,Token消耗數量可達數十倍甚至百倍,這也需要更長(cháng)的上下文處理能力和更強的記憶能力。
火山引擎披露,有超過(guò)100家企業(yè)在火山引擎上累計Token的使用量超過(guò)了1萬(wàn)億。這個(gè)數字已經(jīng)可與國際對標。2025年10月,OpenAI曾披露Token調用量過(guò)萬(wàn)億的30家客戶(hù)(不包括要求匿名的客戶(hù)),它們集中在教育、銷(xiāo)售、Coding(編程)等場(chǎng)景。
隨著(zhù)大模型已經(jīng)進(jìn)入應用落地期,Token消耗成為衡量應用規?;暮诵闹笜?,已是不爭事實(shí)。昆侖萬(wàn)維董事長(cháng)方漢告訴《中國企業(yè)家》,用Token就是用大模型,程序員占整個(gè)公司員工數量三分之二,他們會(huì )考核程序員的Token調用量,“用Token少,證明不夠努力”。
但Token消耗更大規模的應用,還要依賴(lài)于多模態(tài)和Agent的繁榮。而當下,企業(yè)落地Agent仍然面臨挑戰。譚待提及,真正能開(kāi)發(fā)好Agent的企業(yè)并不多,能運營(yíng)好,被大規模使用的Agent就更少了,主要挑戰有兩點(diǎn):
第一,Agent身份與權限管理。在A(yíng)gent時(shí)代,不只要管理人,還要管理Agent、工具和系統之間的關(guān)系。
第二,模型的確定性和可解釋性問(wèn)題。Agent為什么這么決策,失敗發(fā)生在哪一步?沒(méi)有合理的評估和審計,Agent也難以被企業(yè)真正信任。
此外,企業(yè)已經(jīng)存在了大量業(yè)務(wù)系統、數據庫、消息系統、作業(yè)系統,它們是企業(yè)的核心資產(chǎn),但并不是為Agent設計的。如果這些系統不能被Agent安全、可控地調用,企業(yè)智能化就只能停留在表面。
“不是模型不夠強,而是缺少為Agent規?;\行而生的基礎設施?!弊T待說(shuō)。
為了解決上述問(wèn)題,火山引擎在“FORCE原動(dòng)力大會(huì )”上,一口氣發(fā)布了數款企業(yè)端應用:Trae企業(yè)版,支持10萬(wàn)文件、1.5億行代碼的容量;升級發(fā)布企業(yè)級Agent平臺Agentkit,和多模態(tài)數據湖打通。
以企業(yè)應用最廣的AI Coding場(chǎng)景為例,在字節跳動(dòng)內部,已經(jīng)有超過(guò)九成的工程師在使用Trae輔助開(kāi)發(fā);以抖音生活服務(wù)為例,目前有40%以上的代碼是通過(guò)AI生成。
雖然這其中,不免有許多“重復造輪子”的資源浪費。Trae的一位員工透露,為了檢查T(mén)rae的結果,“還要給它組建一個(gè)內部的知識庫”。但將“Token跳動(dòng)”的故事講下去,字節已經(jīng)表明了更堅定的決心。
在成本端,火山引擎推出了“AI節省計劃”。該計劃覆蓋所有按量后付費的大模型產(chǎn)品,通過(guò)階梯式折扣,幫助企業(yè)最高節省47%的成本。
火山引擎還推出了“方舟協(xié)作獎勵計劃”,截至2026年3月31日,參與的企業(yè)被贈送最多500萬(wàn)Token,個(gè)人200萬(wàn)Token。使用第二天,還將發(fā)送和采集量相等的有效Token數,消費多少返多少。
當火山引擎向硬件以及企業(yè)端進(jìn)發(fā),推銷(xiāo)自己的Token戰略時(shí),一個(gè)強勁的對手——阿里云也擋在眼前。2025年下半年開(kāi)始,究竟如何衡量AI云質(zhì)量,誰(shuí)才是AI云廠(chǎng)商第一,一直是業(yè)內爭論不休的話(huà)題。
一位云服務(wù)資深人士向《中國企業(yè)家》透露:目前關(guān)于A(yíng)I云市場(chǎng)份額,各家有不同的統計口徑??傮w來(lái)說(shuō),阿里云在包括PaaS、IaaS、MaaS在內的整體營(yíng)收規模位居第一?;鹕揭娴膬?yōu)勢則主要集中在MaaS,也就是“模型即產(chǎn)品”市場(chǎng)。
該人士也同時(shí)強調,模型質(zhì)量不能只用Token消耗一個(gè)標準來(lái)考量?!爱吘挂粋€(gè)視頻生成,可能就會(huì )消耗百萬(wàn)Token。而豆包背靠抖音,有大量的視頻創(chuàng )作者?!?/p>
2025年9月,阿里云相關(guān)員工對《中國企業(yè)家》表示:未來(lái)Token的消耗量會(huì )體現在超長(cháng)的上下文,其中引用多次工具,跟環(huán)境進(jìn)行多次交互、做多輪推理的能力?!拔覀兏嗟木?huì )放在技術(shù)架構創(chuàng )新,包括跟硬件的結合上?!?/p>
比起Token調用量,阿里云更強調“有效的Token調用”。9月,阿里云推出了Qwen3-Next系列架構模型,它在20萬(wàn)Token以上的推理速度更快。
前述員工談及:“今天技術(shù)上的很多創(chuàng )新會(huì )讓Token的成本下降,但我們希望減少無(wú)效的Token量。有的模型很笨,會(huì )給你輸出一大堆,但是結果很差,這是我們希望去避免的”。
但最近,在字節的兇猛攻勢下,阿里云大概不能一直如此“佛系”了。
媒體報道,阿里已經(jīng)著(zhù)手制定讓Token調用量快速提升的計劃,比如大力推廣C端應用。下半年,阿里先后推出AI助手千問(wèn)App、靈光、AI健康產(chǎn)品阿福等三款應用。其中千問(wèn)App公測一周,下載量已突破1000萬(wàn)次。
硬件也將成為未來(lái)的Token消耗大戶(hù)。11月底,阿里夸克AI眼鏡開(kāi)售,3天銷(xiāo)量破3000臺。12月23日,釘釘上線(xiàn)企業(yè)級AI Agent硬件——DingTalk Real。從C端應用到B端落地,從硬件到軟件,阿里與字節的Token之爭已經(jīng)一觸即發(fā)。