
1858年的夏天,一根铜芯电缆横穿大西洋海底,把伦敦和纽约连在了一起。这件事的意义从来不在于传输速度,而在于权力结构——谁铺设了海底电缆,谁就能在信息流动中“抽水”。大英帝国靠着这张全球电报网,把殖民地的情报、棉花的价格、战争的消息都攥在手里。帝国的强大不仅是有舰队,还有那根电缆。
一百六十多年后,这个逻辑正在以一种意想不到的方式重演。2026年,中国大模型正在悄悄吃掉全球开发者市场。OpenRouter最新数据显示,平台前十模型的Token消耗中,中国模型独占61%,前三名清一色来自中国。旧金山、柏林、新加坡的开发者每天发出的API请求,正穿越太平洋海底光缆抵达中国数据中心,算力在那里消耗,电力在那里流动,结果传回来。电力从未离开中国电网,但它的价值通过Token完成了跨境交付。
一、AI模型大迁徙:中国模型凭什么抢占全球市场?
2026年2月24日,OpenRouter发布的周度数据显示:平台前十模型的总Token消耗约8.7万亿,中国模型独占5.3万亿,占比61%。MiniMax M2.5以2.45万亿Token空降榜首,Kimi K2.5、智谱GLM-5紧随其后,前三名清一色来自中国。这并非偶然,一根名为OpenClaw的“导火索”,点燃了全球开发者向中国模型迁徙的浪潮。
今年初,OpenClaw横空出世——这是一个让AI真正开始“干活”的开源工具,可直接控制电脑、执行命令、并行完成复杂工作流,GitHub星标数周内突破21万。金融从业者John第一时间安装OpenClaw,并接入了Anthropic API,用于自动监控股市信息、推送交易信号,可几个小时后,他盯着账户余额愣住了:几十美元凭空消失。
这就是OpenClaw带来的新现实:过去与AI聊天,一次对话仅消耗几千个Token,费用几乎可以忽略;而OpenClaw接入后,AI会在后台同时运行十几个子任务,反复调用上下文、循环迭代,Token消耗不再是线性增长,而是呈指数级飙升。账单像开着引擎盖的汽车加速消耗,根本停不下来。
为了节省成本,开发者社群里流传出一个“妙招”:用OAuth令牌将Anthropic或Google的订阅账户直接接入OpenClaw,把月费制的“无限”额度变成AI Agent的免费燃料。但官方的反制很快到来:2月19日,Anthropic更新协议,明确禁止将Claude订阅凭证用于OpenClaw等第三方工具,接入必须走API计费通道;Google更是大面积封禁了通过OpenClaw接入Antigravity和Gemini AI Ultra的订阅账号。
“天下苦秦久矣”,John随即转向了国产大模型。在OpenRouter上,国产大模型MiniMax M2.5在软件工程任务上的得分是80.2%,与Claude Opus 4.6的80.8%差距几乎可以忽略,但价格却天差地别——前者输入端每百万Token仅0.3美元,后者高达5美元,差距约17倍。切换到国产模型后,John的工作流依然正常运转,账单却缩水了一个数量级。这种迁徙,正在全球范围内同步发生。
OpenRouter的COO Chris Clark直言,中国开源模型之所以能拿下大量市场份额,核心原因是它们在美国开发者运行的代理工作流中占比异常之高——性价比优势,成为中国模型破局的关键。
二、电力出海:Token背后的物理真相
要理解Token出海的本质,必须先拆解一个Token的成本结构。它看起来轻如鸿毛:一个Token大约等于0.75个英文单词,一次普通的AI对话,消耗的也不过几千个Token。但当这些Token以万亿为单位堆叠,背后的物理现实就变得沉甸甸——Token的核心成本,只有两项:算力和电力。
算力成本,本质是GPU的折旧摊销:一块英伟达H100售价约3万美元,它的寿命分摊到每一次推理,就是算力的折旧成本。而电力,是数据中心持续运转的“燃料”:GPU满载时每块耗电约700瓦,加上冷却系统的开销,一个大型AI数据中心的年电力账单,轻松就能超过数亿美元。
把这个物理过程映射到地图上,画面清晰可见:一个美国开发者在旧金山发出一条API请求,数据从加利福尼亚出发,经由太平洋海底光缆抵达中国某地的数据中心,GPU集群随即启动工作,电从中国的电网流向这些芯片,推理完成后,结果再沿原路回传。整个过程,不过一两秒。
关键在于:电力从未离开中国的电网,但电力的价值,却通过Token完成了跨境交付。这是普通贸易无法企及的优势:Token没有形体,不需要经过海关,不会被关税壁垒阻挡,甚至不在任何现行的贸易统计口径里。中国出口了大量算力与电力服务,但在官方的商品贸易数据上,它几乎是隐形的。
换句话说,Token成为了电力的衍生品,Token出海的本质,就是电力出海。而这一切,离不开中国得天独厚的成本优势:中国综合电价比美国低约40%,这种物理层面的差距,是竞争对手难以轻易复制的。
除此之外,中国AI大模型还有算法和“内卷”带来的双重优势。算法上,DeepSeek V3的MoE架构让推理时只激活部分参数,独立测试显示其推理成本比GPT-4o低约36倍;MiniMax M2.5同样采用类似架构,229B总参数仅激活10B,大幅降低消耗。而“内卷”层面,阿里、字节、百度、腾讯、月之暗面、智谱、MiniMax等十几家企业在同一条赛道上激烈竞争,价格早已跌破合理利润区间,“赔本赚吆喝”成为行业常态——这和中国制造出海的逻辑如出一辙,凭借供应链优势和行业内卷,将Token价格狠狠压低,形成不可替代的竞争力。
三、从比特币到Token:电力出海的两次迭代
在Token出海之前,中国电力其实已经有过一次“跨境之旅”。大约2015年前后,四川、云南和新疆的电站管理者,开始迎来一批奇怪的客人:他们租下废弃厂房,装满密密麻麻的机器,24小时通电运转。这些机器不生产任何实物,只是不停地计算一道无穷无尽的数学题,偶尔,会从这道题里“算”出一枚比特币。
这是电力出海的第一代形态:把廉价的水电、风电,经由矿机的哈希运算,兑换成全球流通的数字资产(比特币),再在交易所变现为美元。电力没有穿越任何边境,但电力的价值,以比特币为载体,流向了全球市场。那几年,中国算力一度占到全球比特币挖矿算力的70%以上,中国的水电和煤电,以这种迂回的方式,参与了全球资本的重新分配。
2021年,监管重锤落下,比特币挖矿被全面整治,矿工四散而去,算力迁徙到了哈萨克斯坦、美国德克萨斯和加拿大。但电力出海的核心逻辑从未消失,它只是在等待一个新的“外壳”——直到ChatGPT横空出世,大模型群雄逐鹿,曾经的比特币矿场摇身一变成为AI数据中心,矿机变成了算力GPU,曾经生产的比特币变成了Token,不变的,依然是背后流动的电力。
尽管底层逻辑同构,但Token出海与比特币出海,有着本质区别,且Token的商业价值远高于比特币。其一,价值来源不同:矿机挖矿是纯粹的数学计算,比特币的价值来自稀缺性和市场共识,与“计算内容”无关,算力本身没有生产性,只是信任机制的副产品;而大模型推理产出的是真实的认知服务——代码、分析、翻译、创意,Token的价值直接来自于对使用者的效用,是实实在在的服务价值。其二,嵌入深度不同:Token承载的服务会深度融入开发者的工作流,一旦形成依赖,切换成本会随时间积累呈指数级上升。其三,选择逻辑不同:比特币挖矿是被中国主动驱逐的,而Token出海,是全球开发者基于性价比和实用性的主动选择。
四、Token战争:中美战略博弈的新战场
1858年铺设的那根海底电缆,代表的是大英帝国对信息高速公路的主权——谁拥有基础设施,谁就能定义游戏规则。今天的Token出海,同样是一场没有宣战的战争,阻力重重,但更大的战场,才刚刚拉开序幕。
数据主权,是第一道壁垒。一个美国开发者的API请求经由中国数据中心处理,意味着数据物理上流经了中国。这对个人开发者和小型应用来说无关紧要,但涉及企业敏感数据、金融信息、政府合规场景时,就成了无法逾越的硬伤——这也是中国模型在开发工具和个人应用领域渗透率极高,却几乎无法进入企业核心系统的关键原因。
芯片禁令,是第二道壁垒。中国AI发展面临英伟达高端GPU的出口管制,尽管MoE架构和算法优化能部分抵消这一劣势,但算力天花板依然存在,制约着中国大模型向更高性能、更大规模突破。
但这些眼前的阻力,都只是序章。Token和AI模型,已经成为中美之间新的战略博弈维度,其重要性不亚于20世纪的半导体、互联网,甚至更接近一个更古老的比喻——太空争霸。1957年,苏联发射斯普特尼克一号,美国举国震惊,随即启动阿波罗计划,砸下相当于今天数千亿美元的资源,誓要在太空竞赛中不落败。
AI争霸的逻辑与此惊人相似,但激烈程度远超太空竞赛:太空毕竟是物理空间,与普通人的生活距离遥远;而AI渗透的是经济的毛细血管,每一行代码、每一份合同、每一个政府决策系统背后,都可能运行着某个国家的大模型。谁的模型成为全球开发者的基础设施默认选项,谁就无形中获得了对全球数字经济的结构性影响力——这正是中国Token出海让华盛顿真正感到不安的地方。
当一个开发者的代码库、Agent工作流、产品逻辑都围绕某个中国模型的API构建起来,迁移成本会随时间指数级上升。届时,即便美国立法限制,开发者也会用脚投票抵制,就像今天没有程序员能抛弃GitHub一样。
今天的Token出海,也许只是这场漫长博弈的开篇。中国大模型没有宣称要颠覆什么,它们只是以更低的价格,把可靠的服务送到了全球每一个有API Key的开发者手里。这一次,铺设“信息电缆”的,不再是帝国舰队,而是那些在杭州、北京、上海写代码的工程师团队,和在南方某个省份昼夜运转的GPU集群。
这场争霸没有倒计时,它每天24小时都在进行,单位是Token,战场是每一个开发者的终端。