중국 기업들 춘절 AI 신제품 경쟁, 토큰 수요 급증
전문가 해설
중국 인터넷 대기업들이 춘절 ‘홍바오 전쟁’과 함께 대규모 AI 신제품을 잇달아 출시하며 멀티모달 경쟁을 본격화했고, 그 결과 Token 수요가 폭증하며 산업 전반의 가격 체계와 수익 모델이 재편되고 있다는 내용입니다. 2026년 춘절을 맞아 Baidu는 5억 위안, Tencent의 Yuanbao는 10억 위안, Alibaba는 30억 위안 면제 이벤트를 내세우며 트래픽 확보전에 나섰습니다. 그러나 진짜 승부는 AI 신제품이었습니다. Bytedance는 Doubao 2.0을 발표했고, 앞서 Seedance 2.0(영상), Seedream 5.0 Lite(이미지)를 공개했습니다. Zhipu는 GLM-5를, MiniMax는 M2.5를 오픈소스로 출시했으며, DeepSeek도 버전 업데이트에 나섰습니다. Alibaba는 Qwen3-Coder-Next를 발표했고 Qwen 3.5 공개도 예고했습니다. 텍스트를 넘어 영상·이미지까지 확장된 멀티모달 경쟁 속에서 연산량이 급증하고 있으며, 10초짜리 1080p 영상 생성에 약 35만 Token이 소모되는 등 추론 비용이 폭발적으로 증가하고 있습니다. 이에 따라 글로벌 클라우드 업체와 중국 로컬 클라우드 기업들이 잇달아 가격을 인상했고, Zhipu는 GLM Coding Plan 가격을 30% 이상 인상했습니다. 중국 전체 일평균 Token 소비량은 2024년 초 1000억에서 2026년 2월 180만억(180조) 수준으로 급증한 것으로 집계되었습니다.
요약
중국 춘제 기간 바이트댄스, 알리바바 등 빅테크 기업들이 차세대 AI 모델을 잇달아 출시하며 치열한 경쟁을 벌이고 있다. 멀티모달 AI 모델의 확산으로 토큰 소비량이 급증하고 있으며, 중국의 일평균 토큰 소비량이 2026년 2월 180조 개 수준에 달했다. 공급 부족과 수요 급증으로 지푸AI가 30% 가격 인상을 단행하며 AI 모델 업계의 가격 상승 신호탄을 쐈다. 토큰이 새로운 계량 단위가 되면서 클라우드 컴퓨팅과 AI 모델 기업들의 수익성 개선이 기대된다.
《科创板日报》2月15日讯
2026年马年春节,互联网大厂的“红包战”如期上演。百度撒下5亿,腾讯元宝豪掷10亿,阿里更是祭出30亿免单的“钞能力”。不过“撒钱”只是“开胃菜”,紧随而来的则是参与者更多、频率更密集的国产AI新品“春节档”:
2月14日,字节跳动发布豆包大模型2.0系列,这是继Seedance 2.0视频模型和Seedream 5.0 Lite图像模型之后打出的春节“第三弹”。智谱已在2月11日发布“系统架构师”级别的底座模型GLM-5;MiniMax紧随其后,于2月12日上线并开源文本模型M2.5;连一向低调的DeepSeek,也在几天前进行版本更新。在此之前,阶跃星辰发布Step 3.5 Flash,阿里发布Qwen3-Coder-Next,且有望在春节期间发布Qwen 3.5。
每一次发布都是一次卡位,每一次迭代都是一次重塑行业格局的尝试。这一波覆盖文本、图像、视频多模态的AI“最强春节档”已经拉开大幕。
▌多模态大模型接连面世 Token需求出现“通胀”
一年多前,字节内部曾判断,AI对话类产品可能只是AI产品的“中间态”,长期更理想的产品形式,大概率需要更视觉化的用户体验、更低的用户使用门槛。因此彼时的字节选择提升即梦的产品优先级,尝试打造“AI时代的抖音”。
或许也正是因此,一年多以后,在字节的这次春节档“三连弹”中,最先出场的不是最为大众所熟悉的豆包,而是视频模型Seedance 2.0。
而从曾经和文本大模型的“聊几秒”到如今视频大模型的“看几秒”,算力消耗规模正在快速膨胀——从单条视频来看,Seedance 2.0 生成一条10秒、1080p的视频,大致要消耗35万token。
Seedance 2.0的算力消耗增长并非孤例。春节档的这轮密集发布,对各家厂商而言不仅是品牌宣传的窗口期,也是一场对底层算力储备的极限压力测试。随着越来越多的多模态和长文本大模型面世,势必将进一步推高Token需求。
国联民生证券指出,
Token需求正在发生“通胀”
。这种“通胀”并非是指Token本身变贵,而是指单位时间内、单位用户的Token消耗结构性上升。
数据显示,火山引擎的大模型日均Token调用量已从2024年底的2万亿增长至2025年底的63万亿;阿里云外部客户2025年日均Token调用也已接近5万亿,2026年目标至少15-20万亿,内部业务日均调用则计划从16-17万亿拉到100万亿。从全行业看,中国整体日均Token消耗2024年初为1000亿,2025年中突破30万亿,
2026年2月主流大模型合计日均Token消耗已到180万亿级别。
图|不同模型token调用量(来源:海通国际证券)
摩根大通指出,春节AI应用推广战仅是表面,在这背后更深层的趋势在于,消费者获取信息和消费内容的方式正在经历结构性变革,这一进程实际上推升了推理量,将驱动Token消耗量步入一个长达数年的高速增长期。
其预测,
中国的AI推理Token消耗量预计将从2025年的约10千万亿增长至2030年的约3900千万亿,五年间增长约370倍。
▌Token成为“计量单位” 产业链开启涨价
今年以来,全球云计算市场进入密集涨价周期。先是亚马逊云宣布上调EC2机器学习容量块价格约15%;之后谷歌云宣布北美、欧洲、亚洲地区全部涨价;国内厂商迅速跟进:优刻得宣布全线产品与服务价格上浮。
随后,智谱打响了年内大模型涨价“第一枪”。2月12日,其宣布GLM Coding Plan套餐价格体系结构性调整,取消首购优惠,保留按季按年订阅优惠,套餐价格整体涨幅30%起。官方解释是“市场需求持续强劲增长,用户规模与调用量快速提升,为保障高负载下的稳定性与服务质量,同步加大算力与模型优化投入”。之后GLM Coding Plan上线即售罄。
国联民生证券指出,智谱此前正因为用户增长导致算力阶段性紧张,对Coding Plan做过“限量发售”安排,这与其后续涨价形成了一个非常典型的“供需链条”:需求在短期内大幅增长→资源呈现刚性约束(导致限流/限量)→涨价。
在分析师看来,当行业依旧处在“模型价格战”时,智谱给出的涨价信号,
意味着大模型时代的“计量单位”从流量(DAU/时长)转向Token(推理消耗),而Token消耗在越来越多场景里是刚需。综合来看,Token需求“通胀”不仅利好云端算力,也让模型厂商拥有了议价权
;同时产业定价逻辑也发生改变,当推理消耗变成生产资料,模型厂商有机会把“算力稀缺”通过分层定价与订阅化产品转化为毛利与现金流。
落实到投资方向上,券商建议关注:
第一,云厂商与算力基础设施:AI拉动的IT支出与基础设施投入仍处上行周期,云侧将受益于GPU算力、存储与网络I/O等“伴随型消耗”的持续增长。
第二,大模型厂商:当它们能在编程、Agent、企业流程等高ROI场景中维持订阅留存与企业席位扩张,能把“Token用量”稳定转成“省人省时省返工”的交付价值时,就具备了穿越开源与价格战的能力。
第三,安全治理与运行时的防护工具:随着企业把AI嵌入工作流,数据泄露、代理越权等风险将推动“AI安全平台/治理平台”成为刚需层。
2026年马年春节,互联网大厂的“红包战”如期上演。百度撒下5亿,腾讯元宝豪掷10亿,阿里更是祭出30亿免单的“钞能力”。不过“撒钱”只是“开胃菜”,紧随而来的则是参与者更多、频率更密集的国产AI新品“春节档”:
2月14日,字节跳动发布豆包大模型2.0系列,这是继Seedance 2.0视频模型和Seedream 5.0 Lite图像模型之后打出的春节“第三弹”。智谱已在2月11日发布“系统架构师”级别的底座模型GLM-5;MiniMax紧随其后,于2月12日上线并开源文本模型M2.5;连一向低调的DeepSeek,也在几天前进行版本更新。在此之前,阶跃星辰发布Step 3.5 Flash,阿里发布Qwen3-Coder-Next,且有望在春节期间发布Qwen 3.5。
每一次发布都是一次卡位,每一次迭代都是一次重塑行业格局的尝试。这一波覆盖文本、图像、视频多模态的AI“最强春节档”已经拉开大幕。
▌多模态大模型接连面世 Token需求出现“通胀”
一年多前,字节内部曾判断,AI对话类产品可能只是AI产品的“中间态”,长期更理想的产品形式,大概率需要更视觉化的用户体验、更低的用户使用门槛。因此彼时的字节选择提升即梦的产品优先级,尝试打造“AI时代的抖音”。
或许也正是因此,一年多以后,在字节的这次春节档“三连弹”中,最先出场的不是最为大众所熟悉的豆包,而是视频模型Seedance 2.0。
而从曾经和文本大模型的“聊几秒”到如今视频大模型的“看几秒”,算力消耗规模正在快速膨胀——从单条视频来看,Seedance 2.0 生成一条10秒、1080p的视频,大致要消耗35万token。
Seedance 2.0的算力消耗增长并非孤例。春节档的这轮密集发布,对各家厂商而言不仅是品牌宣传的窗口期,也是一场对底层算力储备的极限压力测试。随着越来越多的多模态和长文本大模型面世,势必将进一步推高Token需求。
国联民生证券指出,
Token需求正在发生“通胀”
。这种“通胀”并非是指Token本身变贵,而是指单位时间内、单位用户的Token消耗结构性上升。
数据显示,火山引擎的大模型日均Token调用量已从2024年底的2万亿增长至2025年底的63万亿;阿里云外部客户2025年日均Token调用也已接近5万亿,2026年目标至少15-20万亿,内部业务日均调用则计划从16-17万亿拉到100万亿。从全行业看,中国整体日均Token消耗2024年初为1000亿,2025年中突破30万亿,
2026年2月主流大模型合计日均Token消耗已到180万亿级别。
图|不同模型token调用量(来源:海通国际证券)
摩根大通指出,春节AI应用推广战仅是表面,在这背后更深层的趋势在于,消费者获取信息和消费内容的方式正在经历结构性变革,这一进程实际上推升了推理量,将驱动Token消耗量步入一个长达数年的高速增长期。
其预测,
中国的AI推理Token消耗量预计将从2025年的约10千万亿增长至2030年的约3900千万亿,五年间增长约370倍。
▌Token成为“计量单位” 产业链开启涨价
今年以来,全球云计算市场进入密集涨价周期。先是亚马逊云宣布上调EC2机器学习容量块价格约15%;之后谷歌云宣布北美、欧洲、亚洲地区全部涨价;国内厂商迅速跟进:优刻得宣布全线产品与服务价格上浮。
随后,智谱打响了年内大模型涨价“第一枪”。2月12日,其宣布GLM Coding Plan套餐价格体系结构性调整,取消首购优惠,保留按季按年订阅优惠,套餐价格整体涨幅30%起。官方解释是“市场需求持续强劲增长,用户规模与调用量快速提升,为保障高负载下的稳定性与服务质量,同步加大算力与模型优化投入”。之后GLM Coding Plan上线即售罄。
国联民生证券指出,智谱此前正因为用户增长导致算力阶段性紧张,对Coding Plan做过“限量发售”安排,这与其后续涨价形成了一个非常典型的“供需链条”:需求在短期内大幅增长→资源呈现刚性约束(导致限流/限量)→涨价。
在分析师看来,当行业依旧处在“模型价格战”时,智谱给出的涨价信号,
意味着大模型时代的“计量单位”从流量(DAU/时长)转向Token(推理消耗),而Token消耗在越来越多场景里是刚需。综合来看,Token需求“通胀”不仅利好云端算力,也让模型厂商拥有了议价权
;同时产业定价逻辑也发生改变,当推理消耗变成生产资料,模型厂商有机会把“算力稀缺”通过分层定价与订阅化产品转化为毛利与现金流。
落实到投资方向上,券商建议关注:
第一,云厂商与算力基础设施:AI拉动的IT支出与基础设施投入仍处上行周期,云侧将受益于GPU算力、存储与网络I/O等“伴随型消耗”的持续增长。
第二,大模型厂商:当它们能在编程、Agent、企业流程等高ROI场景中维持订阅留存与企业席位扩张,能把“Token用量”稳定转成“省人省时省返工”的交付价值时,就具备了穿越开源与价格战的能力。
第三,安全治理与运行时的防护工具:随着企业把AI嵌入工作流,数据泄露、代理越权等风险将推动“AI安全平台/治理平台”成为刚需层。