중국 교육부 주도, AI 언어 표준·음성 합성 평가 기준 발표
전문가 해설
핵심 키워드인 ‘AI 언어 표준·음성 합성 평가·데이터(코퍼스) 규범’을 중심으로, 중국이 인공지능 시대에 맞춰 중국어 표준 체계를 디지털·지능화 방향으로 본격 정비하기 시작했다는 점이 이번 뉴스의 핵심입니다. 중국 교육부와 국가언어문자공작위원회는 최근 「기계 합성 표준어(보통화) 수준 평가 등급 기준 및 평가 대강」과 「인공지능 코퍼스(语料库) 기초 용어」 두 가지 언어 규범을 공식 발표했습니다. 이 규범은 교육부 산하 언어문자응용연구소가 주도해 마련되었으며, 국가 차원의 심의를 거쳐 정식 출판되었습니다. 첫 번째 규범은 AI 음성 합성 기술이 생성한 표준어의 정확성과 수준을 평가하기 위한 기준을 제시하고, 기술 개발·제품 개선·응용 평가 등에 활용될 수 있도록 설계되었습니다. 두 번째 규범은 인공지능 학습의 핵심 기반인 코퍼스 구축과 활용에 필요한 기본 개념과 용어를 정리해 데이터 구축, 관리, 평가, 연구 전반에 적용할 수 있도록 했습니다. 이번 조치는 국가 공용어의 디지털화·정보화·지능화를 추진하겠다는 법적·정책적 방향에 따른 것으로, 중국어 데이터 체계의 표준화를 통해 AI 산업 발전을 뒷받침하려는 목적을 갖고 있습니다.
요약
인공 지능 시대를 맞아 언어 문헌의 실제 필요에 부응하여 언어 문헌 표준 체계 구축을推進하기 위해 최근에 교육부, 국가어문위원회가《机器合成普通话水平测评等级标准及测评大纲》와《人工智能 语料库 基础术语》를 발표했다. 이 두 가지 규정은 언어 문헌의 등급 표준과 측정 지침을 설정하며, 기계 합성 普通话의 수준을 측정하고 인공 지능 분야에서 언어 문헌의 구축, 사용, 관리, 측정, 연구 등의 작업에 활용할 수 있다.
为积极回应人工智能时代对语言文字的现实需求,推进语言文字规范标准体系建设,近日,教育部、国家语言文字工作委员会发布《机器合成普通话水平测评等级标准及测评大纲》和《人工智能 语料库 基础术语》两项语言文字规范。两项规范由教育部语言文字应用研究所(国家语委普通话与文字应用培训测试中心)组织研制,经国家语委语言文字规范(标准)审定委员会审定通过,目前已由语文出版社正式出版。
《机器合成普通话水平测评等级标准及测评大纲》规定了机器合成普通话水平的等级标准和测评大纲,适用于机器合成语音的普通话水平测评,可用于技术研发、产品优化及应用评价。《人工智能 语料库 基础术语》界定了语料库在属性、建设和应用方面的常用术语和定义,适用于人工智能领域语料库的建设、使用、管理、测评和研究等工作。
两项规范的发布,是落实《中华人民共和国国家通用语言文字法》有关“推进国家通用语言文字信息化、数字化、智能化建设”要求,落实《关于加强数字中文建设 推进语言文字信息化发展的意见》有关部署,推动中文数字化和数据中文化的重要举措,标志着我国语言文字标准体系建设向数字化、智能化方向迈出坚实步伐。
《机器合成普通话水平测评等级标准及测评大纲》规定了机器合成普通话水平的等级标准和测评大纲,适用于机器合成语音的普通话水平测评,可用于技术研发、产品优化及应用评价。《人工智能 语料库 基础术语》界定了语料库在属性、建设和应用方面的常用术语和定义,适用于人工智能领域语料库的建设、使用、管理、测评和研究等工作。
两项规范的发布,是落实《中华人民共和国国家通用语言文字法》有关“推进国家通用语言文字信息化、数字化、智能化建设”要求,落实《关于加强数字中文建设 推进语言文字信息化发展的意见》有关部署,推动中文数字化和数据中文化的重要举措,标志着我国语言文字标准体系建设向数字化、智能化方向迈出坚实步伐。