중국의 하루 평균 토큰 호출량이 2년 만에 천 배 이상 증가
전문가 해설
"Token"은 AI 업계의 뜨거운 화제가 되었으며, 2026 중관촌 포럼 연례 회의에서 널리 주목을 받았습니다. Kimi 창립자 양즈린은 Token을 미래의 GDP로 정의했으며, 즈푸 CEO 장펑은 저가 경쟁이 업계 발전에 불리하다고 생각합니다. 텐센트의 수석 부사장 탕다오셩과 부사장 리창도 Token의 비용 문제에 대해 논의하며, 서로 다른 디자인이 비용 차이를 크게 만들고 고객의 충성도가 약하게 만들 수 있다고 지적했습니다. OpenClaw 등 스마트 기기의 부상과 함께 토큰 소비량이 기하급수적으로 증가하여 2024년 초의 하루 평균 1,000억 위안에서 2026년 3월의 140조 위안으로 증가했습니다.
바이두 첸판 플랫폼 제품 책임자 장팅은 Token이 AI 대형 모델의 정보 처리 기본 단위로, 글자와 단어 사이에 있다고 설명했습니다. 국가데이터국의 데이터에 따르면, 중국의 하루 평균 토큰 호출량이 2년 만에 천 배 이상 증가했습니다.
바이두 첸판 플랫폼 제품 책임자 장팅은 Token이 AI 대형 모델의 정보 처리 기본 단위로, 글자와 단어 사이에 있다고 설명했습니다. 국가데이터국의 데이터에 따르면, 중국의 하루 평균 토큰 호출량이 2년 만에 천 배 이상 증가했습니다.
💡 Token은 인공지능 대형 모델이 정보를 처리하는 최소 단위를 말하며, 언어의 문자나 어휘 간의 전환 개념과 유사합니다. AI 기술의 발전에 따라, 특히 OpenClaw와 같은 인공지능이 부상한 후, 토큰 소비량이 급격히 증가하여 2024년 초의 하루 평균 1,000억 위안에서 2026년 3월의 140조 위안으로 증가했습니다. 이는 AI 산업의 빠른 발전과 자원 수요 급증을 반영합니다.
요약
“Token”成为AI行业的热门话题,在2026中关村论坛年会上受到广泛关注。Kimi创始人杨植麟将Token定义为未来的GDP,智谱CEO张鹏则认为低价竞争不利于行业发展。腾讯高级执行副总裁汤道生和副总裁李强也讨论了Token的成本问题,指出不同的设计会导致成本差异巨大且客户黏性弱。随着OpenClaw等智能体的兴起,Token消耗量呈指数级增长,从2024年初的日均1000亿上升至2026年3月的140万亿。 百度千帆平台产品负责人张婷解释称,Token是AI大模型处理信息的基本单元,介于字和词之间。国家数据局数据显示,中国日均Token调用量在两年内增长超过一千倍。
“Token”正在成为AI行业最热的词。近日召开的2026中关村论坛年会上,Kimi创始人兼CEO杨植麟、智谱CEO张鹏的话题绕不开它。杨植麟将Token定义为未来的GDP,张鹏直言“Token长期靠低价竞争不利于行业发展”。1000多公里外,腾讯高级执行副总裁汤道生和副总裁李强也分别谈及Token,前者称“同样模型能力下,不同的Harness(脚手架)设计,Token成本相差很大”,后者认为Token切换很容易,黏性弱、补贴一停客户很容易流失。当OpenClaw(网友昵称“龙虾”)们让Token消耗呈指数级爆发,Token不再只是技术名词,而是关乎商业模式的关键变量。
龙虾掀起的智能体热潮,让Token消耗量呈指数级爆发。Token是什么?国家数据局的定义是AI大模型处理信息的最小单元,Token可计量、可定价、可交易。
百度千帆平台产品负责人张婷向北京商报记者解释,“它既不完全等于一个字,也不完全等于一个词,而是介于两者之间的一种‘语言碎片’。比如汉字‘我’是一个Token,‘今天’可能是一个Token,但‘国际化’可能被拆成‘国际’和‘化’两个Token。因为大模型面对的语言是全球性的,Token是一种通用的‘最大公约数’,让模型可以用统一的方式处理所有语言和符号”。
根据国家数据局消息,2024年初,中国日均Token调用量为1000亿;至2025年底,跃升至100万亿;2026年3月,已突破140万亿,两年增长超千倍。
云厂商与AI大模型企业的反应从2月开始,智谱取消对GLM Coding Plan的首购优惠,套餐价格整体涨幅30%起。3月上旬,腾讯云已上调两款自研模型价格,其中Tencent HY2.0 Instruct模型涨幅达463%,下旬阿里云、百度智能云同日宣布AI算力涨价,最高涨幅34%。
对于智能体火爆到Token消耗增长的逻辑链路,张鹏近日做了详细解释:Agent在面临复杂任务时,模型思考的链路很长,Token消耗量非常大,模型推理的成本也相应地提高,因此把Token的价格回归到正常的商业价值。长期靠低价竞争也不利于整个行业的发展。
在接受北京商报记者等媒体采访时,李强表示,“Token的经济性很快也会被所有的客户关注到,如果只考虑消耗量不考虑经济性,可能你在用户端的价格或成本会更高,这将对公司的长远健康发展带来负面影响”。
Token到底是怎样定价的?张婷向北京商报记者举例拆解,“比如‘今天北京天气怎么样’,加上AI的回答,大概消耗50—100个Token。你让AI写一篇800字的作文,算上你的提示词和完整输出,大概消耗1000—1500个Token”。“换算成钱:目前百度千帆平台上主流模型的价格,每百万Token几毛钱的水平。也就是说,1块钱可以让AI写大约1000篇800字作文。”张婷表示。
但当Token消耗量以指数级增长,一个更深层的问题浮出水面:这些Token并非都花在了“刀刃”上。“Token像汽油,Agent像汽车引擎。如果只关注油耗,不关注引擎的经济性和输出能力,客户最终也会舍弃。”李强用油耗来解读Token的效率。
Nextie(明日新程)创始人、“小冰之父”李笛也向北京商报记者表示,“Token消耗热指向了一个有趣的现象:Tokenmaxxing(即Token刷量大赛),现在很多开发者和公司在疯狂刷高Token消耗量,甚至将其视为一种‘算力肌肉’的展示。但这种无节制的燃烧会带来巨大的ROI(投资回报率)失衡”。
在以上背景下,另一个概念Harness在硅谷和国内技术圈快速出圈。
李笛向北京商报记者详细解释,Harness的直译是“马具”或“缰绳”。如果说大模型是一匹力大无穷但方向不定的野马,Harness就是那套能让它在既定轨道上奔跑的约束系统。
“AI落地不只是算法题,更是工程题,”汤道生抛出这个判断,“在同样的模型能力下,不同的脚手架或Harness的设计,比如给模型调用什么工具、有层次的上下文工程、长记忆的管理、工作流的实现等,都对实际使用效果与Token成本有很大的影响。”
小米MiMo大模型负责人罗福莉在解读OpenClaw价值时也提到这个名词,“OpenClaw把国内那些‘次闭源’水平模型的上限拉得很高,同时可以靠一套Harness(约束控制体系)等诸多设计,保证模型的任务完成度和准确率,把下限保证得很好”。
具体到工程层面,腾讯云智能体开发平台ADP,通过RAG(检索增强生成)、知识库等能力给智能体连接上“图书馆”,让行业专家永远在线。然后是Claw跑在Agent Runtime的安全沙箱:Claw作为智能系统的神经中枢,通过从技能库发现与下载Skills,不断学习与积累连接外部系统的能力,借助大模型来对外收发指令,触发行动;AgentRuntime的沙箱方案还能用于大模型强化学习的程序结果验证,提升强化学习的训练效率。
“算力的尽头可能就是电力。”李强在采访中透露,腾讯两年前开始探索算电协同,“与合作伙伴在内蒙古利用当地的风电和光储直接为数据中心供电,结合氢能和储能平衡清洁能源的波峰波谷,同时协调算力的高峰期与低谷期,一方面大幅度降低用电成本,另一方面降低碳排放。”
另一层的变化发生在调度机制。“当前云计算时代的基础设施是为服务人类工程师设计的,而不是为AI设计的。长远来看,基础设施应该是一个整体,这一整套应该能够自我进化、自我迭代,能够形成一个自主的组织,相当于整套基础设施由一个被认可的CEO来管理,它可能是一个Claw,根据它的AI客户需求,自主迭代自己的基础设施”,无问芯穹联合创始人兼CEO夏立雪解释道。
值得注意的是,目前头部云厂商拥有双重身份,阿里云、腾讯云、百度智能云都既是Token供给方,也是Token消耗方。
根据阿里云最近公布的目标,未来五年,云和AI商业化年收入将突破1000亿美元。同时,阿里集团向员工提供Token额度,鼓励员工在工作中使用先进的AI模型与工具。
李强称,“Token肯定是腾讯云非常重要的管理指标之一,但没有把Token放在最高优先级,且用极端奖励政策来推动,腾讯更愿意把精力放在研发更好的引擎上,通过提供好用的AI产品产生真实的Token消耗”。2025年腾讯云实现规模化盈利,“2026年我们不想太激进”,李强直言。
当140万亿Token冲击产业,又一轮较量已经开始。
A股已经进入价值投资时代,对择股能力要求...
3月25日,在2026中关村论坛年会开幕式上,2...
一个“机器人餐吧”成了2026中关村论坛年会...
3月25日,多名2026款问界M7车主向北京商报...
以“科技创新与产业创新深度融合”为主题,...
3月26日,2026中关村论坛年会——第九届中...
3月26日,日本政府时隔四年再次开始释放国...
3月26日,在博鳌亚洲论坛2026年年会期间,...
破解“一人失能、全家失衡”难题,到2028年...
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 版权合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
网上有害信息举报违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn
ICP备案编号:京ICP备08003726号-1京公网安备11010502045556号互联网新闻信息服务许可证11120220001号
龙虾掀起的智能体热潮,让Token消耗量呈指数级爆发。Token是什么?国家数据局的定义是AI大模型处理信息的最小单元,Token可计量、可定价、可交易。
百度千帆平台产品负责人张婷向北京商报记者解释,“它既不完全等于一个字,也不完全等于一个词,而是介于两者之间的一种‘语言碎片’。比如汉字‘我’是一个Token,‘今天’可能是一个Token,但‘国际化’可能被拆成‘国际’和‘化’两个Token。因为大模型面对的语言是全球性的,Token是一种通用的‘最大公约数’,让模型可以用统一的方式处理所有语言和符号”。
根据国家数据局消息,2024年初,中国日均Token调用量为1000亿;至2025年底,跃升至100万亿;2026年3月,已突破140万亿,两年增长超千倍。
云厂商与AI大模型企业的反应从2月开始,智谱取消对GLM Coding Plan的首购优惠,套餐价格整体涨幅30%起。3月上旬,腾讯云已上调两款自研模型价格,其中Tencent HY2.0 Instruct模型涨幅达463%,下旬阿里云、百度智能云同日宣布AI算力涨价,最高涨幅34%。
对于智能体火爆到Token消耗增长的逻辑链路,张鹏近日做了详细解释:Agent在面临复杂任务时,模型思考的链路很长,Token消耗量非常大,模型推理的成本也相应地提高,因此把Token的价格回归到正常的商业价值。长期靠低价竞争也不利于整个行业的发展。
在接受北京商报记者等媒体采访时,李强表示,“Token的经济性很快也会被所有的客户关注到,如果只考虑消耗量不考虑经济性,可能你在用户端的价格或成本会更高,这将对公司的长远健康发展带来负面影响”。
Token到底是怎样定价的?张婷向北京商报记者举例拆解,“比如‘今天北京天气怎么样’,加上AI的回答,大概消耗50—100个Token。你让AI写一篇800字的作文,算上你的提示词和完整输出,大概消耗1000—1500个Token”。“换算成钱:目前百度千帆平台上主流模型的价格,每百万Token几毛钱的水平。也就是说,1块钱可以让AI写大约1000篇800字作文。”张婷表示。
但当Token消耗量以指数级增长,一个更深层的问题浮出水面:这些Token并非都花在了“刀刃”上。“Token像汽油,Agent像汽车引擎。如果只关注油耗,不关注引擎的经济性和输出能力,客户最终也会舍弃。”李强用油耗来解读Token的效率。
Nextie(明日新程)创始人、“小冰之父”李笛也向北京商报记者表示,“Token消耗热指向了一个有趣的现象:Tokenmaxxing(即Token刷量大赛),现在很多开发者和公司在疯狂刷高Token消耗量,甚至将其视为一种‘算力肌肉’的展示。但这种无节制的燃烧会带来巨大的ROI(投资回报率)失衡”。
在以上背景下,另一个概念Harness在硅谷和国内技术圈快速出圈。
李笛向北京商报记者详细解释,Harness的直译是“马具”或“缰绳”。如果说大模型是一匹力大无穷但方向不定的野马,Harness就是那套能让它在既定轨道上奔跑的约束系统。
“AI落地不只是算法题,更是工程题,”汤道生抛出这个判断,“在同样的模型能力下,不同的脚手架或Harness的设计,比如给模型调用什么工具、有层次的上下文工程、长记忆的管理、工作流的实现等,都对实际使用效果与Token成本有很大的影响。”
小米MiMo大模型负责人罗福莉在解读OpenClaw价值时也提到这个名词,“OpenClaw把国内那些‘次闭源’水平模型的上限拉得很高,同时可以靠一套Harness(约束控制体系)等诸多设计,保证模型的任务完成度和准确率,把下限保证得很好”。
具体到工程层面,腾讯云智能体开发平台ADP,通过RAG(检索增强生成)、知识库等能力给智能体连接上“图书馆”,让行业专家永远在线。然后是Claw跑在Agent Runtime的安全沙箱:Claw作为智能系统的神经中枢,通过从技能库发现与下载Skills,不断学习与积累连接外部系统的能力,借助大模型来对外收发指令,触发行动;AgentRuntime的沙箱方案还能用于大模型强化学习的程序结果验证,提升强化学习的训练效率。
“算力的尽头可能就是电力。”李强在采访中透露,腾讯两年前开始探索算电协同,“与合作伙伴在内蒙古利用当地的风电和光储直接为数据中心供电,结合氢能和储能平衡清洁能源的波峰波谷,同时协调算力的高峰期与低谷期,一方面大幅度降低用电成本,另一方面降低碳排放。”
另一层的变化发生在调度机制。“当前云计算时代的基础设施是为服务人类工程师设计的,而不是为AI设计的。长远来看,基础设施应该是一个整体,这一整套应该能够自我进化、自我迭代,能够形成一个自主的组织,相当于整套基础设施由一个被认可的CEO来管理,它可能是一个Claw,根据它的AI客户需求,自主迭代自己的基础设施”,无问芯穹联合创始人兼CEO夏立雪解释道。
值得注意的是,目前头部云厂商拥有双重身份,阿里云、腾讯云、百度智能云都既是Token供给方,也是Token消耗方。
根据阿里云最近公布的目标,未来五年,云和AI商业化年收入将突破1000亿美元。同时,阿里集团向员工提供Token额度,鼓励员工在工作中使用先进的AI模型与工具。
李强称,“Token肯定是腾讯云非常重要的管理指标之一,但没有把Token放在最高优先级,且用极端奖励政策来推动,腾讯更愿意把精力放在研发更好的引擎上,通过提供好用的AI产品产生真实的Token消耗”。2025年腾讯云实现规模化盈利,“2026年我们不想太激进”,李强直言。
当140万亿Token冲击产业,又一轮较量已经开始。
A股已经进入价值投资时代,对择股能力要求...
3月25日,在2026中关村论坛年会开幕式上,2...
一个“机器人餐吧”成了2026中关村论坛年会...
3月25日,多名2026款问界M7车主向北京商报...
以“科技创新与产业创新深度融合”为主题,...
3月26日,2026中关村论坛年会——第九届中...
3月26日,日本政府时隔四年再次开始释放国...
3月26日,在博鳌亚洲论坛2026年年会期间,...
破解“一人失能、全家失衡”难题,到2028年...
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 版权合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
网上有害信息举报违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn
ICP备案编号:京ICP备08003726号-1京公网安备11010502045556号互联网新闻信息服务许可证11120220001号