DeepSeek登顶全球大模型调用榜，中国AI周调用量连续四周压倒美国

DeepSeek登顶全球大模型调用榜，中国AI周调用量连续四周压倒美国｜热财经

原创羊城晚报•羊城派 2026-05-25 20:37:42

打开App听新闻

2026-05-25 20:37:42

全文个字阅读约需分钟

根据OpenRouter最新数据，截至本周，DeepSeek-V4-Flash已正式登顶OpenRouter全球AI大模型调用量榜单，以每周3.43万亿Token的调用规模，将其他所有竞争对手甩在身后。环比涨幅高达66%。

五周连涨，中国连续四周居首

上周（5月18日至5月24日），全球AI大模型总调用量达28.9万亿Token，较前一周增长7.4%，这已是连续第五周上涨。

AI Agent（智能体）应用的爆发是上涨最直接的推手之一。自主完成任务、多步骤推理、调用外部工具，这些Agent工作流背后是数以亿计的Token消耗。与此同时，代码生成、长文档处理、企业级知识库检索等场景的规模化落地，同样在持续拉动基础模型的调用量。

上周，上榜AI大模型中，中国模型周调用量达9.223万亿Token，环比增长19.89%；同期美国模型的调用量为4.93万亿Token，环比增长16.27%。中国大模型周调用量已连续四周超越美国，稳居全球首位。

这一格局的形成并非偶然。排名前二的模型均来自中国：DeepSeek-V4-Flash以3.43万亿Token位列榜首，腾讯混元Hy3 Preview以3.07万亿Token紧随其后，涨幅16%。在前九名模型中，深度求索一家独占三席：除V4-Flash外，DeepSeek-V4-Pro与DeepSeek-V3.2亦同时在列。多型号矩阵的协同布局，使DeepSeek得以在高、中、低不同价格带和任务场景中分层覆盖全球开发者，形成难以替代的规模优势。

DeepSeek-V4-Flash登顶，为什么是它？

DeepSeek-V4-Flash的崛起，有其清晰的技术与商业逻辑。

从参数规模看，V4-Flash采用混合专家（MoE）架构，总参数量284B，激活参数仅13B，支持高达100万Token的超长上下文窗口。MoE架构的本质优势在于：推理时只激活少数专家网络，在保持高性能的同时大幅压低计算成本，使其能以极低的延迟处理高并发请求。

在价格层面，V4-Flash在OpenRouter上的定价为每百万输入Token 0.1美元、每百万输出Token 0.2美元。对比市场同类产品，这一价格具有显著优势。对于规模化调用的开发者和企业而言，当性能差距缩小到可接受范围内，价格往往成为决定选择的最大因素。

促销常态化，低价成为长期战略

就在榜单数据发布前三天，深度求索官方宣布了一项意味深长的定价调整：DeepSeek-V4-Pro API此前实行的2.5折限时优惠，将于2026年5月31日到期后，正式转为原定价四分之一的永久定价。

在AI大模型商业化的早期阶段，低价往往被解读为用补贴换市场份额的短期策略，待用户形成依赖后再逐步抬价。但深度求索将低价锁定为长期商业模式。对全球竞争对手而言，这意味着价格维度的压力将长期存在，而非阶段性的扰动。

如果说2025年初DeepSeek凭借R1在推理能力上震动业界，是一次令人侧目的技术亮相，那么此刻V4-Flash登顶全球调用量榜单，则是商业落地层面的实质性胜利。

文｜记者扶贝贝

图｜来源OpenRouter

责编：校对：审签：

版权申明

羊城晚报·羊城派原创，未经授权不得转载

投票

附件

请复制稿件链接到浏览器中下载附件

本文记者

收起

热门评论