북전수지, 산업·기업·정책 전문가 중심의 제2회 주선교포럼 개최
전문가 해설
2025년, AI 산업의 발전은 실질적인 추세를 보일 것입니다. DeepSeek, 텐센트, 샤오미 등 회사들은 새로운 모델을 집중적으로 발표하여 인공지능이 기술 소란에서 산업 심층에서의 실용적 탐색으로 전환하도록 추진하고 있습니다. 북전수지(北电数智)가 주최한 제2회 주선교 포럼(第二届酒仙桥论坛)에서 참석한 전문가와 산업 관계자들은 스마트 비용과 엔지니어링 실현 능력에 주목했습니다.
지난 2년 동안 매개변수 규모와 차트 능력은 한때 대형 모델의 실력을 측정하는 중요한 기준으로 여겨졌지만, 오늘날 업계는 기술의 실제 적용 안정성을 더욱 중시하고 있습니다. 인공지능은 가상 경제가 아니라 국가 경제와 민생에 관련된 실물 산업입니다. "셰둥(谢東) 북전수지 최고기술책임자가 지적했습니다. 중국공정원 원사 정위민은 AI가 '지능체 시대'에 접어들면서 경쟁의 핵심이 컴퓨팅 파워 클러스터 규모에서 와트당 토큰 생산 효율성, 서비스 안정성 및 단위 비용 산출로 전환되었다고 밝혔습니다.
2024년, 중국의 하루 평균 토큰 소비량은 천억 위안이며, 2025년에는 140조 위안으로 급증하였습니다. 그러나 현재의 컴퓨팅 파워 인프라는 주로 대규모 모델 훈련에 사용되며, 실제 토큰 생산 능력은 시스템 최적화가 부족하여 높은 에너지 소비와 낮은 생산 문제를 초래하고 있습니다. 북전수지는 '디지털 계산 모듈용'의 전 스택 공정화 혁신을 통해 국산 칩의 '사용 가능'에서 '사용 용이'로의 문제를 해결하고, 고품질 서비스를 보장하기 위해 시스템급 추론 최적화 방안을 출시했습니다.
지능형 '랍스터'의 대중화와 함께 '토큰 경제학'이 등장했습니다. Token은 텍스트 및 다중 모드 정보를 처리하는 대형 모델의 기본 측정 단위로, 기본 컴퓨팅 파워, 명시적 저장 등의 비용에 대응합니다. 북전수지 CMO 양전은 현재 관심사가 모델 속도에서 안정적인 서비스의 비용 대비 효과로 전환되었다고 밝혔습니다. 회사가 출시한 시스템급 추론 최적화 솔루션은 높은 동시성 환경에서 요청 대기 문제를 해결하여 사용자가 고품질의 API 호출 경험을 얻을 수 있도록 보장합니다.
전반적으로 AI 산업은 기술 탐색에서 대규모 구현 및 체계화 구축까지의 과정을 겪고 있으며, 실제 적용 효과와 비용 통제의 중요성을 강조하고 있습니다.
지난 2년 동안 매개변수 규모와 차트 능력은 한때 대형 모델의 실력을 측정하는 중요한 기준으로 여겨졌지만, 오늘날 업계는 기술의 실제 적용 안정성을 더욱 중시하고 있습니다. 인공지능은 가상 경제가 아니라 국가 경제와 민생에 관련된 실물 산업입니다. "셰둥(谢東) 북전수지 최고기술책임자가 지적했습니다. 중국공정원 원사 정위민은 AI가 '지능체 시대'에 접어들면서 경쟁의 핵심이 컴퓨팅 파워 클러스터 규모에서 와트당 토큰 생산 효율성, 서비스 안정성 및 단위 비용 산출로 전환되었다고 밝혔습니다.
2024년, 중국의 하루 평균 토큰 소비량은 천억 위안이며, 2025년에는 140조 위안으로 급증하였습니다. 그러나 현재의 컴퓨팅 파워 인프라는 주로 대규모 모델 훈련에 사용되며, 실제 토큰 생산 능력은 시스템 최적화가 부족하여 높은 에너지 소비와 낮은 생산 문제를 초래하고 있습니다. 북전수지는 '디지털 계산 모듈용'의 전 스택 공정화 혁신을 통해 국산 칩의 '사용 가능'에서 '사용 용이'로의 문제를 해결하고, 고품질 서비스를 보장하기 위해 시스템급 추론 최적화 방안을 출시했습니다.
지능형 '랍스터'의 대중화와 함께 '토큰 경제학'이 등장했습니다. Token은 텍스트 및 다중 모드 정보를 처리하는 대형 모델의 기본 측정 단위로, 기본 컴퓨팅 파워, 명시적 저장 등의 비용에 대응합니다. 북전수지 CMO 양전은 현재 관심사가 모델 속도에서 안정적인 서비스의 비용 대비 효과로 전환되었다고 밝혔습니다. 회사가 출시한 시스템급 추론 최적화 솔루션은 높은 동시성 환경에서 요청 대기 문제를 해결하여 사용자가 고품질의 API 호출 경험을 얻을 수 있도록 보장합니다.
전반적으로 AI 산업은 기술 탐색에서 대규모 구현 및 체계화 구축까지의 과정을 겪고 있으며, 실제 적용 효과와 비용 통제의 중요성을 강조하고 있습니다.
**북전수지**는 중국에서 등장한 AI·디지털 인프라 및 지능형 컴퓨팅 분야 기업입니다.
중국어 명칭은 **北电数智(베이뎬수즈)**로, 직역하면 “북쪽 전자(北电) + 디지털 지능(数智)” 정도의 의미입니다.
21世纪经济报道记者孔海丽
AI行业热闹非凡。近日,DeepSeek、腾讯、小米等密集发布新模型,与此同时,人工智能的浪潮正从技术喧嚣,转向产业深处的务实探索。
在北电数智近期举办的第二届酒仙桥论坛上,这一转变成为与会专家、产业人士关注的核心。不少人士指出,AI的焦点已从实验室的“炫技”全面走向产业端的“算账”,智能成本与工程化落地能力,将成为决定下一轮竞争格局的关键。
“模型崇拜”已成过去式
过去两年,参数规模和榜单能力一度被视为衡量大模型实力的重要标尺。但是当前,行业的关注点正在从“模型能力有多大”转向“技术落地有多稳”。
“人工智能不是虚拟经济,而是关乎国计民生的实体产业。”北电数智首席技术官谢东指出,当前产业落地的核心堵点,在于传统架构无法适配AI时代的生产需求,“AI的产业落地不是单点技术的堆叠,而是一项需要全栈协同的复杂系统工程。”
这一观点得到了中国工程院院士郑纬民的呼应。在他看来,随着人工智能迈入“智能体时代”,产业竞争的核心标准已经发生了根本性转变,从比拼算力集群规模,正在转向更加关注每瓦Token生产效率、服务稳定性和单位成本产出。
所谓“每瓦Token生产效率”,本质上是衡量单位能耗下系统能够稳定输出多少有效Token,它不只取决于芯片算力,还取决于模型结构、显存利用、批处理策略、KV Cache管理、跨节点通信、调度系统和推理框架优化。
郑纬民提出,行业正在从以模型调用为中心的MaaS,进一步走向以Token产能、Token成本和Token服务质量为核心计量对象的TaaS。模型仍是能力基础,但产业竞争的评价单位,正在从“模型参数与榜单能力”转向“单位成本下稳定生产高质量Token 的能力”。
“未来,TaaS作为智能体时代生产智能的新型工业级服务体系,其目标是让智能生成能力像水电一样被稳定调度与供给。”他同时透露,我国Token消耗已从2024年的日均千亿级飙升至如今的日均140万亿级,但当前的算力基础设施主要服务于大模型训练,实际Token产能受限于系统优化不足,陷入高耗能、低产出等困局。
这意味着,单纯堆砌芯片和算力已无法解决现实问题。谢东以北电数智的实践为例介绍,他们正在通过“数算模用”的全栈工程化创新,解决国产芯片从“能用”到“好用”的工程难题,以及模型部署、推理加速和规模化部署、工程化落地的问题。
每一分成本都要算清楚
随着智能体“龙虾”的爆火,巨大的成本消耗催生了“Token经济学”。
Token是大模型处理文本与多模态信息的基本计量单元,既对应信息输入输出,也映射到底层算力、显存、时延和服务成本。无论是用户的一句提问,还是智能体执行的一次复杂任务,背后都转化为Token的实际消耗。
北电数智CMO杨震拆解了一个更务实的商业逻辑。“现在大家关心的不是模型跑得多快,而是花同样的钱,能不能享受最稳定的服务。” 杨震谈到,针对Token生产的不稳定性,北电数智推出了系统级的推理优化方案。
其核心逻辑是解决在高并发推理场景下,系统容易出现的请求排队、尾延迟升高、显存抖动、上下文重建、任务重试和服务降级等问题,确保在异构集群中,用户能获得高质量、无间断的API调用体验。
杨震进一步解释称,异构算力调度和推理优化的难点,是“前进”和“宝塔”要解决的核心命题。“前进”把不同集群变成整体系统,从算力层、数据层到智能体层做到系统融合;“宝塔”是做系统级的推理适配,让单卡或多芯集群提供高质量的API调用,不会出现请求失败、响应超时、长队列等待、上下文中断、任务重试等问题。
目前,AI行业已从早期技术探索阶段,进入规模化落地、体系化运营的深水区,企业和产业对AI成本可控、服务稳定、工程化落地的要求进一步放大,“算得清成本、跑得稳服务、落得透场景”成为行业刚需。谢东称:“AI不能只停留在模型层,必须进入真实世界的生产系统,形成可落地、可复制、可持续的能力体系。”
未来,AI行业的核心竞争力不再是模型参数与算力堆砌,而是能否将算力、数据、模型转化为稳定、高效、可规模化的真实生产力,这也是人工智能从技术概念走向实体产业、赋能千行百业的必由之路。
AI行业热闹非凡。近日,DeepSeek、腾讯、小米等密集发布新模型,与此同时,人工智能的浪潮正从技术喧嚣,转向产业深处的务实探索。
在北电数智近期举办的第二届酒仙桥论坛上,这一转变成为与会专家、产业人士关注的核心。不少人士指出,AI的焦点已从实验室的“炫技”全面走向产业端的“算账”,智能成本与工程化落地能力,将成为决定下一轮竞争格局的关键。
“模型崇拜”已成过去式
过去两年,参数规模和榜单能力一度被视为衡量大模型实力的重要标尺。但是当前,行业的关注点正在从“模型能力有多大”转向“技术落地有多稳”。
“人工智能不是虚拟经济,而是关乎国计民生的实体产业。”北电数智首席技术官谢东指出,当前产业落地的核心堵点,在于传统架构无法适配AI时代的生产需求,“AI的产业落地不是单点技术的堆叠,而是一项需要全栈协同的复杂系统工程。”
这一观点得到了中国工程院院士郑纬民的呼应。在他看来,随着人工智能迈入“智能体时代”,产业竞争的核心标准已经发生了根本性转变,从比拼算力集群规模,正在转向更加关注每瓦Token生产效率、服务稳定性和单位成本产出。
所谓“每瓦Token生产效率”,本质上是衡量单位能耗下系统能够稳定输出多少有效Token,它不只取决于芯片算力,还取决于模型结构、显存利用、批处理策略、KV Cache管理、跨节点通信、调度系统和推理框架优化。
郑纬民提出,行业正在从以模型调用为中心的MaaS,进一步走向以Token产能、Token成本和Token服务质量为核心计量对象的TaaS。模型仍是能力基础,但产业竞争的评价单位,正在从“模型参数与榜单能力”转向“单位成本下稳定生产高质量Token 的能力”。
“未来,TaaS作为智能体时代生产智能的新型工业级服务体系,其目标是让智能生成能力像水电一样被稳定调度与供给。”他同时透露,我国Token消耗已从2024年的日均千亿级飙升至如今的日均140万亿级,但当前的算力基础设施主要服务于大模型训练,实际Token产能受限于系统优化不足,陷入高耗能、低产出等困局。
这意味着,单纯堆砌芯片和算力已无法解决现实问题。谢东以北电数智的实践为例介绍,他们正在通过“数算模用”的全栈工程化创新,解决国产芯片从“能用”到“好用”的工程难题,以及模型部署、推理加速和规模化部署、工程化落地的问题。
每一分成本都要算清楚
随着智能体“龙虾”的爆火,巨大的成本消耗催生了“Token经济学”。
Token是大模型处理文本与多模态信息的基本计量单元,既对应信息输入输出,也映射到底层算力、显存、时延和服务成本。无论是用户的一句提问,还是智能体执行的一次复杂任务,背后都转化为Token的实际消耗。
北电数智CMO杨震拆解了一个更务实的商业逻辑。“现在大家关心的不是模型跑得多快,而是花同样的钱,能不能享受最稳定的服务。” 杨震谈到,针对Token生产的不稳定性,北电数智推出了系统级的推理优化方案。
其核心逻辑是解决在高并发推理场景下,系统容易出现的请求排队、尾延迟升高、显存抖动、上下文重建、任务重试和服务降级等问题,确保在异构集群中,用户能获得高质量、无间断的API调用体验。
杨震进一步解释称,异构算力调度和推理优化的难点,是“前进”和“宝塔”要解决的核心命题。“前进”把不同集群变成整体系统,从算力层、数据层到智能体层做到系统融合;“宝塔”是做系统级的推理适配,让单卡或多芯集群提供高质量的API调用,不会出现请求失败、响应超时、长队列等待、上下文中断、任务重试等问题。
目前,AI行业已从早期技术探索阶段,进入规模化落地、体系化运营的深水区,企业和产业对AI成本可控、服务稳定、工程化落地的要求进一步放大,“算得清成本、跑得稳服务、落得透场景”成为行业刚需。谢东称:“AI不能只停留在模型层,必须进入真实世界的生产系统,形成可落地、可复制、可持续的能力体系。”
未来,AI行业的核心竞争力不再是模型参数与算力堆砌,而是能否将算力、数据、模型转化为稳定、高效、可规模化的真实生产力,这也是人工智能从技术概念走向实体产业、赋能千行百业的必由之路。