根据OpenRouter最新数据,截至本周,DeepSeek-V4-Flash已正式登顶OpenRouter全球AI大模型调用量榜单,以每周3.43万亿Token的调用规模,将其他所有竞争对手甩在身后。环比涨幅高达66%。

五周连涨,中国连续四周居首

上周(5月18日至5月24日),全球AI大模型总调用量达28.9万亿Token,较前一周增长7.4%,这已是连续第五周上涨。

AI Agent(智能体)应用的爆发是上涨最直接的推手之一。自主完成任务、多步骤推理、调用外部工具,这些Agent工作流背后是数以亿计的Token消耗。与此同时,代码生成、长文档处理、企业级知识库检索等场景的规模化落地,同样在持续拉动基础模型的调用量。

上周,上榜AI大模型中,中国模型周调用量达9.223万亿Token,环比增长19.89%;同期美国模型的调用量为4.93万亿Token,环比增长16.27%。中国大模型周调用量已连续四周超越美国,稳居全球首位。

这一格局的形成并非偶然。排名前二的模型均来自中国:DeepSeek-V4-Flash以3.43万亿Token位列榜首,腾讯混元Hy3 Preview以3.07万亿Token紧随其后,涨幅16%。在前九名模型中,深度求索一家独占三席:除V4-Flash外,DeepSeek-V4-Pro与DeepSeek-V3.2亦同时在列。多型号矩阵的协同布局,使DeepSeek得以在高、中、低不同价格带和任务场景中分层覆盖全球开发者,形成难以替代的规模优势。

DeepSeek-V4-Flash登顶,为什么是它?

DeepSeek-V4-Flash的崛起,有其清晰的技术与商业逻辑。

从参数规模看,V4-Flash采用混合专家(MoE)架构,总参数量284B,激活参数仅13B,支持高达100万Token的超长上下文窗口。MoE架构的本质优势在于:推理时只激活少数专家网络,在保持高性能的同时大幅压低计算成本,使其能以极低的延迟处理高并发请求。

在价格层面,V4-Flash在OpenRouter上的定价为每百万输入Token 0.1美元、每百万输出Token 0.2美元。对比市场同类产品,这一价格具有显著优势。对于规模化调用的开发者和企业而言,当性能差距缩小到可接受范围内,价格往往成为决定选择的最大因素。

促销常态化,低价成为长期战略

就在榜单数据发布前三天,深度求索官方宣布了一项意味深长的定价调整:DeepSeek-V4-Pro API此前实行的2.5折限时优惠,将于2026年5月31日到期后,正式转为原定价四分之一的永久定价。

在AI大模型商业化的早期阶段,低价往往被解读为用补贴换市场份额的短期策略,待用户形成依赖后再逐步抬价。但深度求索将低价锁定为长期商业模式。对全球竞争对手而言,这意味着价格维度的压力将长期存在,而非阶段性的扰动。

如果说2025年初DeepSeek凭借R1在推理能力上震动业界,是一次令人侧目的技术亮相,那么此刻V4-Flash登顶全球调用量榜单,则是商业落地层面的实质性胜利。

文|记者 扶贝贝

图|来源OpenRouter

责编: 校对: 审签:
版权申明

羊城晚报·羊城派原创,未经授权不得转载