텐센트의 최신 언어 모델 Hy3 preview 토큰 호출량 1위
전문가 해설
5월 7일, 세계 최대 API 통합 플랫폼 OpenRouter가 발표한 주간 순위에 따르면, 텐센트의 최신 언어 모델인 Hy3 preview의 Token 호출량과 시장 점유율이 모두 1위를 차지했습니다. 텐센트는 이 새로운 모델이 출시된 지 2주 만에 이전 세대의 Hy2 호출량이 10배를 넘어섰으며, 자사 CodeBuddy, WorkBuddy 등 스마트 기기 애플리케이션에서의 토큰 호출량은 16.5배 증가했다고 밝혔습니다. 같은 날 텐센트 주가는 3% 이상 급등했습니다.
4월 23일, 텐센트는 하이브리드 Hy3 preview 모델을 공개하며 이를 "믹스 재구성 후 훈련된 첫 번째 모델"이자 지금까지 가장 스마트한 모델이라고 언급했습니다. 이 모델은 빠른 사고와 느린 사고가 융합된 MoE(혼합 전문가) 아키텍처를 사용하며, 총 매개변수 수는 295B, 활성화된 매개변수 수는 21B, 최대 256K 컨텍스트 길이를 지원합니다.
야오순위는 텐센트 'CEO/총재실'의 수석 AI 과학자로 취임한 후, 혼원 대모델의 중대한 업데이트를 추진했습니다. 그는 여러 제품과의 공동 디자인(co-design)이 유일한 경로임을 강조하며, 텐센트가 최고의 제품 생태계와 팀 문화를 보유하고 있다고 밝혔습니다. 이전에 텐센트는 야오순위를 OpenAI에서 영입하여 기술 대기업 간의 치열한 AI 경쟁에서 우위를 점하고자 했습니다.
야오순위는 출근 후 회사의 AI 발전 전략을 개혁하는 데 전념했으며, 여기에는 내부 장벽을 허물고 지도부를 간소화하며 모델 작업을 통합하는 것이 포함됩니다. 또한 1월 말에 Hy3 모델 훈련 작업을 시작했습니다. 텐센트는 AI Infra 부서, AI Data 부서 및 데이터 컴퓨팅 플랫폼 부서를 새로 설립하여 대규모 모델의 연구 개발 체계와 핵심 역량을 강화했습니다.
혼원 팀은 실용성을 추구하는 원칙을 확립하고, 더 이상 '차트 조작'에 집착하지 않으며, 복잡한 비즈니스 시나리오의 적합성과 실제 실행 효율성에 대한 평가로 전환했습니다. 연구 개발 팀은 산업 등급 시나리오에서 모델의 실제 가용성을 평가하고, 제품 측의 실제 사용 데이터를 통해 모델 반복을 역방향으로 구동하기 위해 50개 이상의 맞춤형 테스트 벤치마크(Benchmarks)를 구축했습니다.
4월 23일, 텐센트는 하이브리드 Hy3 preview 모델을 공개하며 이를 "믹스 재구성 후 훈련된 첫 번째 모델"이자 지금까지 가장 스마트한 모델이라고 언급했습니다. 이 모델은 빠른 사고와 느린 사고가 융합된 MoE(혼합 전문가) 아키텍처를 사용하며, 총 매개변수 수는 295B, 활성화된 매개변수 수는 21B, 최대 256K 컨텍스트 길이를 지원합니다.
야오순위는 텐센트 'CEO/총재실'의 수석 AI 과학자로 취임한 후, 혼원 대모델의 중대한 업데이트를 추진했습니다. 그는 여러 제품과의 공동 디자인(co-design)이 유일한 경로임을 강조하며, 텐센트가 최고의 제품 생태계와 팀 문화를 보유하고 있다고 밝혔습니다. 이전에 텐센트는 야오순위를 OpenAI에서 영입하여 기술 대기업 간의 치열한 AI 경쟁에서 우위를 점하고자 했습니다.
야오순위는 출근 후 회사의 AI 발전 전략을 개혁하는 데 전념했으며, 여기에는 내부 장벽을 허물고 지도부를 간소화하며 모델 작업을 통합하는 것이 포함됩니다. 또한 1월 말에 Hy3 모델 훈련 작업을 시작했습니다. 텐센트는 AI Infra 부서, AI Data 부서 및 데이터 컴퓨팅 플랫폼 부서를 새로 설립하여 대규모 모델의 연구 개발 체계와 핵심 역량을 강화했습니다.
혼원 팀은 실용성을 추구하는 원칙을 확립하고, 더 이상 '차트 조작'에 집착하지 않으며, 복잡한 비즈니스 시나리오의 적합성과 실제 실행 효율성에 대한 평가로 전환했습니다. 연구 개발 팀은 산업 등급 시나리오에서 모델의 실제 가용성을 평가하고, 제품 측의 실제 사용 데이터를 통해 모델 반복을 역방향으로 구동하기 위해 50개 이상의 맞춤형 테스트 벤치마크(Benchmarks)를 구축했습니다.
💡 MoE(혼합전문가)는 다양한 작업에 적합한 여러 전문 모델을 하나의 시스템 내에서 효율적으로 공유하고 활용하는 기술로, 텐서플로우나 파이토치와 같은 딥러닝 프레임워크에서도 지원됩니다.
21世纪经济报道记者 彭新
5月7日,在全球最大的API聚合平台OpenRouter公布的周榜上,腾讯最新语言模型混元Hy3 preview的Token(词元)调用量与市场占有率双双登顶。腾讯方面同日披露,上线两周,这款新模型的调用量已超过其上一代Hy2的10倍,在自家CodeBuddy、WorkBuddy等智能体应用中Token调用量高涨16.5倍。两份来之不易的成绩,成为过去一年腾讯AI叙事中少有的高光,同日腾讯股价大涨超3%。
此前在4月23日,腾讯发布并开源混元Hy3 preview模型,将其称之为“混元重建后训练的第一个模型”,也是混元迄今最智能的模型。Hy3 preview是一个快慢思考融合的MoE(混合专家)架构模型,总参数295B,激活参数21B,最大支持256K上下文长度,提升的方向包括复杂推理、指令遵循、上下文学习、代码、改进工具使用和规划能力等。
内驱动力重构
Hy3 preview也是姚顺雨上任后混元大模型首次重大更新,模型发布当天,姚顺雨在社交媒体上写道,腾讯的目标是做出超越公开榜单、具备全面能力的实用模型,唯一的路径是与多产品共同设计(co-design),同时稳健地扩规模。他说:“腾讯拥有最好的产品生态和扎实、不张扬(low-ego)的团队文化,我们才刚刚起步。”
此前腾讯重金将姚顺雨从OpenAI挖过来,让他以腾讯“CEO/总裁办公室”首席AI科学家的身份,接管腾讯的大语言模型研发,试图打赢科技巨头之间的激烈AI竞赛。
姚顺雨到岗后,一直致力于改革公司的AI发展战略,包括打破内部壁垒、精简领导层以及整合模型方面的工作,并于1月底启动了Hy3模型的训练工作。
其间,腾讯新成立了AI Infra部、AI Data部、数据计算平台部,强化大模型的研发体系与核心能力。其中,AI基础设施(Infra)涵盖训练算力集群、分布式训练框架、推理优化系统等大模型研发的底层支撑,其稳定性与效率直接决定了模型迭代速度,此前腾讯对算力投入相对保守,资源受限,姚顺雨重构了AI Infra团队,搭建预训练、模型精调、后训练、推理等团队,确定了资源优先级。随后,腾讯又撤销了AI实验室AI Lab,部分人员调整至混元团队,向姚顺雨汇报。
混元团队也确立了模型追求实用性的原则,即模型能力要体系化,并不再执着于“刷榜”,模型评价也转向对复杂商业场景的适配度与真实落地效能。这一战略转向体现在两个维度:在评估(Eval)体系上,研发团队内部搭建了超过50个定制化测试基准(Benchmarks),评估模型在工业级场景下的实际可用性,而非追求公开榜单成绩;在迭代路径上,混元贴合腾讯庞大的内部业务,让模型在实际应用中学习进化,即co-design。
Co-design的核心要义并非新建模型再寻找产品适配场景,而是模型与产品从设计阶段同步推进,由产品端的真实使用数据反向驱动模型迭代。这套方法论的成立前提,是腾讯长期积累的分发入口资产。
腾讯首席战略官詹姆斯·米歇尔曾在3月18日的全年财报电话会上称,腾讯搭建AI团队不只靠薪酬激励,还在于合理规划了内部职责分工以及与腾讯其他业务板块的协作:“我们为团队提供充足算力,以及腾讯独有的、差异化的AI产品应用场景。”
据腾讯披露,Hy3 preview在研发阶段与元宝产品团队建立了co-design协作机制。模型团队基于元宝既有的评测体系,针对意图理解、文本创作、深度搜索等指标做了定向训练;同时,元宝积累的用户反馈数据被用于训练数据的优化,调优方向集中在文风、内容组织与专业度等维度。腾讯方面表示,这一机制提升了模型响应在自然度上的表现。
随后在Hy3 preview上线后的产品布局中,腾讯混元已嵌入微信的消息总结功能、元宝的问答交互、智能体应用WorkBuddy和Qclaw,构成覆盖消费者与企业的高频使用场景。此外,腾讯旗下还有浏览器、输入法、搜索引擎、游戏、广告等服务和应用,底层有云、算力等基础设施服务。
值得注意的是,Hy3 preview的发布节奏,也反映出混元团队在重整后加快了模型迭代。按业界惯例,一个完整大模型版本的上线,涵盖架构探索、高质量数据准备、预训练、后训练、强化学习与精调、评测优化等环节,通常需要6至12个月。Hy3 preview从混元研发架构升级、AI基础设施重建到正式发布,前后不到三个月。这一速度在国内头部大模型厂商中属于罕见。
下半场后发制人
实际上,Hy3 preview的技术方向选择,酝酿已久。
姚顺雨在加入腾讯前一年发表的博客文章《The Second Half》(下半场)中,已经系统地表达了这套思路。他在博客中指出“强化学习终于实现了泛化”,仅在一年前,如果告诉研究者一个统一的“配方”能同时处理软件工程、IMO(国际数学奥林匹克竞赛)级数学、鼠标键盘操作、长篇问答等一系列截然不同的任务,对方会嘲笑这是幻觉,许多研究者花费整个博士生涯钻研的细分方向,正在被同一套方法批量解决。
在姚顺雨的判断中,AI的“配方”已基本成型,即大规模语言预训练、数据与算力的规模化、推理,意味着上半场依赖“开发新方法击败基准测试”的游戏规则正在失效,下半场AI开始转向“重新定义评估基准”和真实世界效用问题。
观察2026年初以来,国内外头部大模型厂商在战略方向上出现明显的收敛,从拼基准跑分转向拼真实场景的应用落地。Hy3 preview发布后一天,即与业界翘首以待的DeepSeek V4发布撞上档期,而后者也给出类似方向:支持更复杂的智能体应用落地,进一步打开AI应用规模化的空间。
腾讯云与智慧产业事业群CEO汤道生近期就在腾讯云上海城市峰会上表示,AI落地不只是一道算法题,更是一道工程题。他进一步称,随着行业发展,主流大模型的能力差距正在逐步缩小,企业的核心需求已经不再是拥有最好的模型,而是如何通过系统工程把模型的能力最大程度发挥出来。即模型能力会趋同,真正拉开差距的是工程化交付能力。
而Hy3 preview总参数295B、激活参数21B。这一规模在头部MoE模型中属中等量级,既高于面向终端、边缘场景部署的70B级别开源模型,又显著低于 DeepSeek V4等千亿激活参数以上的旗舰模型。据记者了解,腾讯方面将其定位为兼顾性能与推理成本的平衡选择。伴随此次在OpenRouter登顶,腾讯方面透露,将延续Hy3 preview在该平台的低价API接入策略,并计划通过Token Plan订阅及模型开源等多元化模式,持续服务全球开发者生态。
考虑到295B参数规模的Hy3 preview仍属预览版本,混元团队的方法论需在更大参数规模的Hy3正式版上接受验证,并与其他顶尖大模型正面较量。高盛发表研报称,Hy3 preview发布是混元团队全面重组后的关键进展,其维持对腾讯买入评级,目标价700港元。
虽然在新一轮人工智能浪潮中被视为“后来者”,意识到智能体时代机不可失的腾讯,正持续积极布局。
腾讯总裁刘炽平曾在前述业绩说明会上表示,去年腾讯在AI新产品上投入了180亿元,今年至少翻倍。他认为,AI的应用形态已经从聊天机器人、编码、多模态依次演进,智能体突然出现,进一步将整个AI生态推向去中心化,“如果只参与一场竞赛,后来者确实很难追赶,但如果将AI视为多场并行的竞赛,那么行业里就总会不断出现新的机会和新前沿。”
刘炽平还介绍,多模态方面,腾讯的优势是庞大的自研数据和丰富的业务场景,在3D模型和文生图模型方面比较领先,也会继续研发视频和世界模型。
“我更担心的是如果我们不够创新,不够快速该怎么办。”刘炽平说。
5月7日,在全球最大的API聚合平台OpenRouter公布的周榜上,腾讯最新语言模型混元Hy3 preview的Token(词元)调用量与市场占有率双双登顶。腾讯方面同日披露,上线两周,这款新模型的调用量已超过其上一代Hy2的10倍,在自家CodeBuddy、WorkBuddy等智能体应用中Token调用量高涨16.5倍。两份来之不易的成绩,成为过去一年腾讯AI叙事中少有的高光,同日腾讯股价大涨超3%。
此前在4月23日,腾讯发布并开源混元Hy3 preview模型,将其称之为“混元重建后训练的第一个模型”,也是混元迄今最智能的模型。Hy3 preview是一个快慢思考融合的MoE(混合专家)架构模型,总参数295B,激活参数21B,最大支持256K上下文长度,提升的方向包括复杂推理、指令遵循、上下文学习、代码、改进工具使用和规划能力等。
内驱动力重构
Hy3 preview也是姚顺雨上任后混元大模型首次重大更新,模型发布当天,姚顺雨在社交媒体上写道,腾讯的目标是做出超越公开榜单、具备全面能力的实用模型,唯一的路径是与多产品共同设计(co-design),同时稳健地扩规模。他说:“腾讯拥有最好的产品生态和扎实、不张扬(low-ego)的团队文化,我们才刚刚起步。”
此前腾讯重金将姚顺雨从OpenAI挖过来,让他以腾讯“CEO/总裁办公室”首席AI科学家的身份,接管腾讯的大语言模型研发,试图打赢科技巨头之间的激烈AI竞赛。
姚顺雨到岗后,一直致力于改革公司的AI发展战略,包括打破内部壁垒、精简领导层以及整合模型方面的工作,并于1月底启动了Hy3模型的训练工作。
其间,腾讯新成立了AI Infra部、AI Data部、数据计算平台部,强化大模型的研发体系与核心能力。其中,AI基础设施(Infra)涵盖训练算力集群、分布式训练框架、推理优化系统等大模型研发的底层支撑,其稳定性与效率直接决定了模型迭代速度,此前腾讯对算力投入相对保守,资源受限,姚顺雨重构了AI Infra团队,搭建预训练、模型精调、后训练、推理等团队,确定了资源优先级。随后,腾讯又撤销了AI实验室AI Lab,部分人员调整至混元团队,向姚顺雨汇报。
混元团队也确立了模型追求实用性的原则,即模型能力要体系化,并不再执着于“刷榜”,模型评价也转向对复杂商业场景的适配度与真实落地效能。这一战略转向体现在两个维度:在评估(Eval)体系上,研发团队内部搭建了超过50个定制化测试基准(Benchmarks),评估模型在工业级场景下的实际可用性,而非追求公开榜单成绩;在迭代路径上,混元贴合腾讯庞大的内部业务,让模型在实际应用中学习进化,即co-design。
Co-design的核心要义并非新建模型再寻找产品适配场景,而是模型与产品从设计阶段同步推进,由产品端的真实使用数据反向驱动模型迭代。这套方法论的成立前提,是腾讯长期积累的分发入口资产。
腾讯首席战略官詹姆斯·米歇尔曾在3月18日的全年财报电话会上称,腾讯搭建AI团队不只靠薪酬激励,还在于合理规划了内部职责分工以及与腾讯其他业务板块的协作:“我们为团队提供充足算力,以及腾讯独有的、差异化的AI产品应用场景。”
据腾讯披露,Hy3 preview在研发阶段与元宝产品团队建立了co-design协作机制。模型团队基于元宝既有的评测体系,针对意图理解、文本创作、深度搜索等指标做了定向训练;同时,元宝积累的用户反馈数据被用于训练数据的优化,调优方向集中在文风、内容组织与专业度等维度。腾讯方面表示,这一机制提升了模型响应在自然度上的表现。
随后在Hy3 preview上线后的产品布局中,腾讯混元已嵌入微信的消息总结功能、元宝的问答交互、智能体应用WorkBuddy和Qclaw,构成覆盖消费者与企业的高频使用场景。此外,腾讯旗下还有浏览器、输入法、搜索引擎、游戏、广告等服务和应用,底层有云、算力等基础设施服务。
值得注意的是,Hy3 preview的发布节奏,也反映出混元团队在重整后加快了模型迭代。按业界惯例,一个完整大模型版本的上线,涵盖架构探索、高质量数据准备、预训练、后训练、强化学习与精调、评测优化等环节,通常需要6至12个月。Hy3 preview从混元研发架构升级、AI基础设施重建到正式发布,前后不到三个月。这一速度在国内头部大模型厂商中属于罕见。
下半场后发制人
实际上,Hy3 preview的技术方向选择,酝酿已久。
姚顺雨在加入腾讯前一年发表的博客文章《The Second Half》(下半场)中,已经系统地表达了这套思路。他在博客中指出“强化学习终于实现了泛化”,仅在一年前,如果告诉研究者一个统一的“配方”能同时处理软件工程、IMO(国际数学奥林匹克竞赛)级数学、鼠标键盘操作、长篇问答等一系列截然不同的任务,对方会嘲笑这是幻觉,许多研究者花费整个博士生涯钻研的细分方向,正在被同一套方法批量解决。
在姚顺雨的判断中,AI的“配方”已基本成型,即大规模语言预训练、数据与算力的规模化、推理,意味着上半场依赖“开发新方法击败基准测试”的游戏规则正在失效,下半场AI开始转向“重新定义评估基准”和真实世界效用问题。
观察2026年初以来,国内外头部大模型厂商在战略方向上出现明显的收敛,从拼基准跑分转向拼真实场景的应用落地。Hy3 preview发布后一天,即与业界翘首以待的DeepSeek V4发布撞上档期,而后者也给出类似方向:支持更复杂的智能体应用落地,进一步打开AI应用规模化的空间。
腾讯云与智慧产业事业群CEO汤道生近期就在腾讯云上海城市峰会上表示,AI落地不只是一道算法题,更是一道工程题。他进一步称,随着行业发展,主流大模型的能力差距正在逐步缩小,企业的核心需求已经不再是拥有最好的模型,而是如何通过系统工程把模型的能力最大程度发挥出来。即模型能力会趋同,真正拉开差距的是工程化交付能力。
而Hy3 preview总参数295B、激活参数21B。这一规模在头部MoE模型中属中等量级,既高于面向终端、边缘场景部署的70B级别开源模型,又显著低于 DeepSeek V4等千亿激活参数以上的旗舰模型。据记者了解,腾讯方面将其定位为兼顾性能与推理成本的平衡选择。伴随此次在OpenRouter登顶,腾讯方面透露,将延续Hy3 preview在该平台的低价API接入策略,并计划通过Token Plan订阅及模型开源等多元化模式,持续服务全球开发者生态。
考虑到295B参数规模的Hy3 preview仍属预览版本,混元团队的方法论需在更大参数规模的Hy3正式版上接受验证,并与其他顶尖大模型正面较量。高盛发表研报称,Hy3 preview发布是混元团队全面重组后的关键进展,其维持对腾讯买入评级,目标价700港元。
虽然在新一轮人工智能浪潮中被视为“后来者”,意识到智能体时代机不可失的腾讯,正持续积极布局。
腾讯总裁刘炽平曾在前述业绩说明会上表示,去年腾讯在AI新产品上投入了180亿元,今年至少翻倍。他认为,AI的应用形态已经从聊天机器人、编码、多模态依次演进,智能体突然出现,进一步将整个AI生态推向去中心化,“如果只参与一场竞赛,后来者确实很难追赶,但如果将AI视为多场并行的竞赛,那么行业里就总会不断出现新的机会和新前沿。”
刘炽平还介绍,多模态方面,腾讯的优势是庞大的自研数据和丰富的业务场景,在3D模型和文生图模型方面比较领先,也会继续研发视频和世界模型。
“我更担心的是如果我们不够创新,不够快速该怎么办。”刘炽平说。