2月井喷！中国AI调用量首超美国，四款大模型霸榜全球前五

历史性时刻：中国AI首次超越美国

2026年2月，中国AI大模型迎来了历史性突破。全球最大的AI模型API聚合平台OpenRouter数据显示，在2月9日至15日这一周，中国模型以4.12万亿Token的调用量，首次超过同期美国模型的2.94万亿Token，实现了历史性赶超。

这一势头并未停止。到2月16日至22日当周，中国模型的周调用量更是冲高至5.16万亿Token，三周时间调用量增长127%，将领先优势进一步扩大。而同期美国模型调用量则跌至2.7万亿Token。

2026年2月16日至22日的周榜单显示，全球调用量排名前五的模型中，有四款来自中国厂商，分别为：

这四款模型合计贡献了Top5总调用量的85.7%，展现出中国AI厂商集群式崛起的强大动能。

月之暗面于1月27日发布的Kimi K2.5模型，凭借其原生的多模态架构和强大的Agent并行处理能力，调用量实现了连续跳涨。该模型能调度多达100个”Agent分身”并行工作，将复杂任务处理效率提升3到10倍。

据媒体报道，Kimi在发布Kimi K2.5后不到一个月的累计收入，已超过其2025年全年的总收入，增长主要由全球付费用户及API调用量大涨共同推动。

中国模型之所以能在短时间内席卷全球开发者，除了性能上比肩甚至超越国际顶尖模型外，其极具竞争力的成本是另一个无可争议的核心优势。

以OpenRouter平台公示的价格为例：

输入环节：MiniMax M2.5与智谱GLM-5均为0.3美元/百万Token，而Claude Opus4.6高达5美元/百万Token，是中国模型的约16.7倍
输出环节：MiniMax M2.5为1.1美元/百万Token，智谱GLM-5为2.55美元/百万Token，而Claude Opus4.6飙升至25美元/百万Token

弗若斯特沙利文中国总监李庆分析指出，以”混合专家（Mixture-of-Experts, MoE）”架构为代表的技术路线，是中国模型能够大幅降低推理成本的核心原因之一。

MoE架构将一个巨大的模型拆分为多个相对较小的”专家网络”和一个”门控网络”。在实际处理任务时，门控网络会智能地判断任务性质，并只激活其中一小部分最相关的专家网络参与计算。

数据显示，采用MoE架构可以直接让推理时的显存占用降低60%，推理吞吐量提升高达19倍。

摩根大通在其研报中对中国市场做出极为乐观的预测，预计从2025年到2030年，中国Token消耗量的年复合增长率将达到惊人的330%，在短短5年间实现370倍的增长。

Token正在从互联网时代的”流量”，成为AI时代的”燃料”。随着AI从”问答”工具向”干活”的生产力工具转变，企业将更愿意为直接的”成果”付费。

这一系列数据和趋势表明，中国AI产业正在进入一个全新的发展阶段，从技术追赶转向引领全球。

相关文章推荐：