算力“黑洞”逼近:你的每一次AI对话,都暗中标好了价格
日期:2026-05-07 16:36:00  来源:stcn

当AI不再只是“回答问题”,而是开始“动手干活”,整个数字世界的账单正在被悄悄改写。

以OpenClaw为代表的智能体应用爆发,正推动大模型从对话引擎进化为任务引擎。而这一进化带来的直接连锁反应,是算力需求结构的根本性重塑——从过去的“集中式训练”,全面转向“高并发、长时段的推理”,并催生出一套全新的算力计价逻辑。

在这个新逻辑里,Token不再是一个藏在技术文档里的晦涩单位,而成了上下游每一方都不得不精打细算的战略资源。

一位开发者向记者晒出了她的算力账单:每一次通过API调用DeepSeek模型,后台都会精确记录下本次消耗的Token数量。

如果说开发者晒出的API账单是这场Token战争的“上游战报”,那么近期豆包上线付费订阅,则意味着这场战火终于烧到了普通用户头上。

当单月数亿活跃用户的Token消耗呈指数级增长,免费午餐难以为继,大模型行业开始从“跑马圈地”转向分层收费。这背后,正是智能体驱动的算力“黑洞”倒逼整条产业链重构的开端。

“黑洞”首当其冲:大厂成本雪崩

智能体应用爆发带来的Token调用量,不是线性增长,而是指数级跃升。

国家数据局发布的数据显示,中国日均Token调用量从2024年初的约1000亿飙升至2025年底的100万亿;2026年3月,进一步提升至140万亿,两年增长超千倍。

机构监测数据同样印证了这一趋势:过去一年,周度消耗Token数量从2.1T上升至24.5T,2026年以来周度Token消耗增加280%。

这种爆发式增长的根源,在于智能体完全不同于传统对话的运行方式。

传统AI对话中,一次用户请求对应一次模型推理,消耗的Token通常在几百到几千之间,用户问完即走,算力消耗是离散、短周期的。而智能体完成一个任务,需要模型自主规划、搜索信息、调用工具、执行步骤、验证结果,这个循环可能会重复几十轮甚至上百轮,从而让输入和输出Token都呈现指数级膨胀。

这也是当下市场的共识:推理对算力的消耗正在翻倍。其本质是智能体对低延迟、高并发推理的需求激增。据第三方统计,当前训推算力比例已从早期的“倒挂”演变为4:6,部分场景甚至达到3:7,且推理占比有望继续提升。

Token需求的指数级增长,正在深刻重塑云厂商的B端定价逻辑与计费模式。传统上,云厂商按vCPU/GPU时长、带宽或存储容量计费,本质是“资源租赁”;而Token成为新一代计价单位后,计费逻辑转向“按智能消耗量”收费——客户只需为模型实际生成的Token数买单。

“定价会采用更细的颗粒度,加入cache、batch等计费条目,打破了计量计费的传统体系。”云计算厂商优刻得的一位产品负责人告诉记者。这对客户的成本结构造成根本改变:“过去企业购买整张GPU卡或算力集群,成本固定且存在闲置浪费;现在按Token付费后,成本与业务用量完全挂钩,小型AI应用门槛大幅降低。但大客户也面临新的挑战:Token消耗量激增可能导致‘成本雪崩’。月度Token费用可达数十万元甚至数百万元。”

这并非危言耸听。OpenAI联合创始人兼总裁布罗克曼在近期证词中表示,公司2026年将在算力方面投入500亿美元。随着OpenAI开发更先进的AI模型并向更广泛用户提供服务,其计算成本已从2017年的约3000万美元激增至今年的数百亿美元。

500亿美元这个数字,既见证了顶尖大模型研发的惊人能耗,也暴露了AI行业财务门槛以几何级数飙升的现实。

无独有偶,海外巨头包括微软、亚马逊、Meta、谷歌,国内包括阿里、腾讯、字节跳动等平台企业,总资本支出与AI资本支出占比也在逐渐提高,且各家上调2026年资本开支指引,无一不指向算力核心。

涨价不止的Token:硬件全线承压

一边,Token激增吞噬大厂成本;另一边,中外大厂齐掀算力与大模型涨价潮。

据不完全统计,自今年以来,腾讯云、阿里云、百度云等云服务厂商纷纷涨价,智谱AI、字节跳动、MiniMax、月之暗面也上调了模型API价格。Claude母公司Anthropic调整了旗下企业级产品Claude Enterprise订阅模式,从每月每用户最高200美元的固定费用,转变为按照实际算力消耗收费,且加收每月基础费20美元,对于重度用户而言,新定价或导致成本提升两到三倍。

对普通人而言,涨价或许还比较远,但对于AI工具的使用者而言,这是一场生存之战。

有AI漫剧从业者公开表示,“现在一部合格的120分钟AI剧,API等多渠道混用,算力成本已经普遍往2万元以上走。有些没做好API成本控制的,一部剧消耗10多万元的算力。”而市场上一部普通的AI漫剧报价才6万块,因此许多团队的生存空间被大幅压缩。

记者注意到,AI工具的使用成本在显著上升。以视频生成工具即梦为例,目前其基础会员、高级会员分别每月有725分、6160分,而之前是1080分、15000分。这意味着,用户花同样的钱,到账积分却大幅缩水,相当于变相涨价。且有创作者反映,原先会员价首年5折优惠,现在则将首年优惠折扣调整为6折。

然而,Token计价的上调,只是冰山浮出水面的部分。水面之下,真正的成本地基——硬件,正在经历一场更为剧烈的涨价潮。

GPU方面,英伟达H100的一年期租赁价格已从2025年10月的低点约1.70美元/小时,涨至2026年3月的2.35美元/小时,涨幅近40%;Blackwell系列芯片的单小时租金更高达4.08美元,较两个月前上涨48%。按需租赁容量在所有GPU类型中均已售罄。即便是消费级显卡,如英伟达RTX 5090,也一卡难求,溢价数倍。

“GPU的成本确实决定了算力的成本,也就间接掌握了算力定价权。”GPU厂商砺算科技的一位资深产品经理对记者表示,“以DeepSeek-V4 Pro为例,每百万输出Token收费三块多美元,这个价格就是主要由数据中心的建设成本决定的,这里面包含三块成本:数据中心租赁及托管费用,服务器费用和能耗费用,其中GPU属于服务器费用里比较大的一部分,如果是每张10万元的数据中心级GPU,那么其成本大约占到了总成本的近一半。”

存储方面,HBM(高带宽内存)是AI训练与推理的核心瓶颈之一。据TrendForce数据,2026年第一季度HBM价格同比翻倍,供应持续紧张。三星、SK海力士、美光虽在扩产,但产能爬坡速度远跟不上智能体驱动的需求爆发。

服务器与网络组件同样面临成本上行。先进封装产能吃紧,光模块、交换机等互联部件也在供需失衡中涨价。

这意味着,算力成本上涨,并非仅由“模型调用更频繁”驱动,而是从芯片、存储到数据中心整条供应链的价格重估。Token单价的调高,成了这条成本传导链路的最后一站。而这些,最终都会写进消费者的订阅费里。

AI产业链重构:效率决胜

算力计价从粗放到精算的转折,不只影响云厂商和企业的账单,更在深层改写整个AI产业链的成本结构与竞争逻辑。新的游戏规则已经清晰:效率和性价比,才是智能体时代的生存法则。

“我们虽然没有设立‘Token Hub’这样的事业群,但已从技术架构与产品矩阵全面拥抱这一变化。”优刻得产品负责人表示。他透露,客户在选择推理服务时,除了价格,还会紧盯三个硬指标:首Token延迟(TTFT)、端到端吞吐量(TPM)以及推理稳定性——延迟抖动与错误率直接决定了AI应用的用户留存和运维成本。

在他看来,在Token洪流中,胜出的云厂商必须具备三大特质:一是全栈自研优化能力,从底层算力调度到上层模型服务实现系统性提效;二是中立开放的生态,不被单一模型或框架绑定,让客户自由选择最佳方案;三是产品灵活性,提供公有云按Token计费、混合云一体机、私有化部署等多元模式。优刻得正通过智能资源调度、vLLM框架深度优化及模型级加速机制,实现KV缓存卸载等能力,以系统性降低总体拥有成本(TCO)。

然而,任何过于火爆的行情都暗藏风险。砺算科技资深产品经理直言:“Token需求暴涨是一把双刃剑。短期Token不愁销路,但长期看,智能体热潮能持续多久?GPU需求是否会突变?会不会出现新的XPU?这些都是未知数。”他算了一笔账:GPU采购后需保证四至五年的使用期才能有利润空间,其间任何变化都可能冲击营收模型。

更深刻的挑战来自下游的成本压力——用户正疯狂寻找更廉价的推理方案,这可能催生一批“XPU”企业,用性价比更高的推理芯片撕开市场。英伟达收购Groq已被视为一个标志性信号。如果LPU、TPU等产品在性价比上远超传统GPU/GPGPU,这个市场将被快速拆分。“芯片公司每代产品周期至少两年,投入以十亿人民币计,传统GPU厂商能做的应对其实有限。”前述产品经理说。

另一个关键战场在存储。“AI推理工作负载的需求持续攀升,这对存储芯片与加速硬件提出了更高需求,以边缘侧AI大语言模型或小语言模型为例,其需要高带宽、低延迟、低功耗存储产品,才能支撑每秒超过一万个Token的高性能生成目标。”内存大厂华邦电子相关负责人对记者解释。他举例道,AI眼镜、机器人等端侧设备空间受限,存储芯片必须在功耗控制和尺寸体积上精益求精,以延长待机时间并支持轻量化设计。

当算力成为制约智能体普及的最硬约束,这场由Token引爆的“算力黑洞”正在重塑产业链的权力版图。它不是一次短暂的供需错配,而是一轮强制性的效率筛选。无论云厂商、芯片设计公司还是存储巨头,最终的考卷只有一道题:谁能用更低的单位Token成本,完成更复杂、更可靠的任务?答案的获得者,将掌握下一个时代的核心权力。

本文版权归原作者所有,择尔裕【智慧+】APP仅为传播更多有价值的信息,若您发现文章内容有版权问题,请把相关链接提交至邮箱:mssj@ytfjr.com,我们将及时进行处理。文章内容不构成投资建议,市场有风险,投资需谨慎!

阅读 7170
转发 1176
相关推荐
涨价预期持续升温 全球存储芯片龙头齐创新高
行业
05-07 08:26
阅读 7110 转发 1152
掀涨停潮!存储芯片早盘领涨 38股一季度利润翻倍
行业
05-06 13:21
阅读 1.0w 转发 1332
刚刚!暴涨 熔断!重大利好来袭 芯片巨头飙涨
行业
05-06 09:25
阅读 1.1w 转发 1428
盘前必看!5月券商金股来了(附名单)
A股
05-06 08:22
阅读 1.1w 转发 1392
超7000亿美元AI豪赌:美股六巨头交卷 AI竞赛进入下半场
行业
05-01 21:21
阅读 1.5w 转发 2664