历史性时刻:中国AI首次超越美国
2026年2月,中国AI大模型迎来了历史性突破。全球最大的AI模型API聚合平台OpenRouter数据显示,在2月9日至15日这一周,中国模型以4.12万亿Token的调用量,首次超过同期美国模型的2.94万亿Token,实现了历史性赶超。
这一势头并未停止。到2月16日至22日当周,中国模型的周调用量更是冲高至5.16万亿Token,三周时间调用量增长127%,将领先优势进一步扩大。而同期美国模型调用量则跌至2.7万亿Token。
四款中国模型霸榜全球前五
2026年2月16日至22日的周榜单显示,全球调用量排名前五的模型中,有四款来自中国厂商,分别为:
- MiniMax的M2.5 – 上线不足一周便迅速登顶周调用量榜首
- 月之暗面的Kimi K2.5 – 调用量实现连续跳涨
- 智谱的GLM-5 – 凭借200K超长上下文窗口赢得用户青睐
- DeepSeek的V3.2 – 在开源模型领域表现突出
这四款模型合计贡献了Top5总调用量的85.7%,展现出中国AI厂商集群式崛起的强大动能。
Kimi K2.5:Agent能力的突破
月之暗面于1月27日发布的Kimi K2.5模型,凭借其原生的多模态架构和强大的Agent并行处理能力,调用量实现了连续跳涨。该模型能调度多达100个”Agent分身”并行工作,将复杂任务处理效率提升3到10倍。
据媒体报道,Kimi在发布Kimi K2.5后不到一个月的累计收入,已超过其2025年全年的总收入,增长主要由全球付费用户及API调用量大涨共同推动。
成本优势:不到美国AI的1/10
中国模型之所以能在短时间内席卷全球开发者,除了性能上比肩甚至超越国际顶尖模型外,其极具竞争力的成本是另一个无可争议的核心优势。
以OpenRouter平台公示的价格为例:
- 输入环节:MiniMax M2.5与智谱GLM-5均为0.3美元/百万Token,而Claude Opus4.6高达5美元/百万Token,是中国模型的约16.7倍
- 输出环节:MiniMax M2.5为1.1美元/百万Token,智谱GLM-5为2.55美元/百万Token,而Claude Opus4.6飙升至25美元/百万Token
技术路线:混合专家架构
弗若斯特沙利文中国总监李庆分析指出,以”混合专家(Mixture-of-Experts, MoE)”架构为代表的技术路线,是中国模型能够大幅降低推理成本的核心原因之一。
MoE架构将一个巨大的模型拆分为多个相对较小的”专家网络”和一个”门控网络”。在实际处理任务时,门控网络会智能地判断任务性质,并只激活其中一小部分最相关的专家网络参与计算。
数据显示,采用MoE架构可以直接让推理时的显存占用降低60%,推理吞吐量提升高达19倍。
未来展望:Token消耗量将增长370倍
摩根大通在其研报中对中国市场做出极为乐观的预测,预计从2025年到2030年,中国Token消耗量的年复合增长率将达到惊人的330%,在短短5年间实现370倍的增长。
Token正在从互联网时代的”流量”,成为AI时代的”燃料”。随着AI从”问答”工具向”干活”的生产力工具转变,企业将更愿意为直接的”成果”付费。
这一系列数据和趋势表明,中国AI产业正在进入一个全新的发展阶段,从技术追赶转向引领全球。