小智资讯百科 AI前沿 2月井喷!中国AI调用量首超美国,四款大模型霸榜全球前五

2月井喷!中国AI调用量首超美国,四款大模型霸榜全球前五

历史性时刻:中国AI首次超越美国

2026年2月,中国AI大模型迎来了历史性突破。全球最大的AI模型API聚合平台OpenRouter数据显示,在2月9日至15日这一周,中国模型以4.12万亿Token的调用量,首次超过同期美国模型的2.94万亿Token,实现了历史性赶超。

这一势头并未停止。到2月16日至22日当周,中国模型的周调用量更是冲高至5.16万亿Token,三周时间调用量增长127%,将领先优势进一步扩大。而同期美国模型调用量则跌至2.7万亿Token。

四款中国模型霸榜全球前五

2026年2月16日至22日的周榜单显示,全球调用量排名前五的模型中,有四款来自中国厂商,分别为:

  • MiniMax的M2.5 – 上线不足一周便迅速登顶周调用量榜首
  • 月之暗面的Kimi K2.5 – 调用量实现连续跳涨
  • 智谱的GLM-5 – 凭借200K超长上下文窗口赢得用户青睐
  • DeepSeek的V3.2 – 在开源模型领域表现突出

这四款模型合计贡献了Top5总调用量的85.7%,展现出中国AI厂商集群式崛起的强大动能。

Kimi K2.5:Agent能力的突破

月之暗面于1月27日发布的Kimi K2.5模型,凭借其原生的多模态架构和强大的Agent并行处理能力,调用量实现了连续跳涨。该模型能调度多达100个”Agent分身”并行工作,将复杂任务处理效率提升3到10倍。

据媒体报道,Kimi在发布Kimi K2.5后不到一个月的累计收入,已超过其2025年全年的总收入,增长主要由全球付费用户及API调用量大涨共同推动。

成本优势:不到美国AI的1/10

中国模型之所以能在短时间内席卷全球开发者,除了性能上比肩甚至超越国际顶尖模型外,其极具竞争力的成本是另一个无可争议的核心优势。

以OpenRouter平台公示的价格为例:

  • 输入环节:MiniMax M2.5与智谱GLM-5均为0.3美元/百万Token,而Claude Opus4.6高达5美元/百万Token,是中国模型的约16.7倍
  • 输出环节:MiniMax M2.5为1.1美元/百万Token,智谱GLM-5为2.55美元/百万Token,而Claude Opus4.6飙升至25美元/百万Token

技术路线:混合专家架构

弗若斯特沙利文中国总监李庆分析指出,以”混合专家(Mixture-of-Experts, MoE)”架构为代表的技术路线,是中国模型能够大幅降低推理成本的核心原因之一。

MoE架构将一个巨大的模型拆分为多个相对较小的”专家网络”和一个”门控网络”。在实际处理任务时,门控网络会智能地判断任务性质,并只激活其中一小部分最相关的专家网络参与计算。

数据显示,采用MoE架构可以直接让推理时的显存占用降低60%,推理吞吐量提升高达19倍。

未来展望:Token消耗量将增长370倍

摩根大通在其研报中对中国市场做出极为乐观的预测,预计从2025年到2030年,中国Token消耗量的年复合增长率将达到惊人的330%,在短短5年间实现370倍的增长。

Token正在从互联网时代的”流量”,成为AI时代的”燃料”。随着AI从”问答”工具向”干活”的生产力工具转变,企业将更愿意为直接的”成果”付费。

这一系列数据和趋势表明,中国AI产业正在进入一个全新的发展阶段,从技术追赶转向引领全球。

上一篇
下一篇

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

返回顶部