| T/CES 157-2022《电力智能交互命名实体标注规范》 - 中国电工技术学会
中国电工技术学会团体标准T/CES 157-2022《电力智能交互命名实体标注规范》由中国电工技术学会提出,国网信息通信产业集团有限公司等单位起草编制完成。该标准规定了电力智能交互命名实体标注规范方面技术要求。
1. 标准起草单位及主要起草人
(1)起草单位
国网信息通信产业集团有限公司、四川中电启明星信息技术有限公司、国网重庆市电力公司
(2)主要起草人
李强、宋卫平、邓芷珊、周孔均、张捷、赵峰、田鹏、李炳森、李欢欢、杨帆、王刚强、杨智、谷波、胡州明、王红蕾、田富强、李立。
2. 标准制定背景
针对新型电力系统的非线性、不确定性、强耦合性、多变量等特性,国家着力建设电力新一代人工智能开放创新平台。面向新型电力系统人工智能开放创新平台用户输入复杂多变的特性,研究用户多意图识别技术、智能交互关键技术,构造智能对话机器人,通过与业务深度融合,为用户提供智能、友好、易用的交互能力,提升智能化水平及工作效率,扩大用户流量,增强应用资源服务能力。其中,对电力智能交互关键技术对命名实体模块制定标注规范,有助于解决打造人工智能平台、提升技术创新研发实力和基础软硬件开放共享服务能力的过程中涉及的资源整合、全流程开放等问题。统一命名实体标注的规范有助于实现电力人工智能技术资源要素的高效整合,促进电力人工智能创新创业及成果转化平台的全环节、全要素对接和资源优化配置,进行全产业链聚合,全流程开放。
3. 标准主要内容
(1)范围
本标准规定了电力智能交互命名实体标注规范方面技术要求。
本标准适用于各单位进行电力智能交互命名实体模型开发时的样本标注和样本入库的统一管理,包括样本的质量管控、样本标注的技术管控和流程管控。
(2)规范性引用文件
本标准主要引用的文件主要包括:
GB/T 5271.28 信息技术 词汇 第28部分 人工智能 基本概念与专家系统
GB/T 18521 我国地名分类与分类代码编制规则
(3)术语及定义
对本指导性技术文件中会使用的术语进行定义,对后续内容描述提供了术语支持。包括命名实体、样本数据、标注、标签、分词、标注工具等。
(4)缩略语
XML
(5)样本基本要求
对文本文件存储格式、命名要求、质量要求、描述文件进行规定,以保证电力智能交互命名实体样本数据的规范性。
(6)样本标注要求
对单类词词性样本、多类词词性样本、实体抽取样本、实体关系抽取样本、事件抽取样本进行规范要求,以及确定标注文件命名与存储要求。
(1)样本标注流程
样本标注应包含样本检查、安全管控、标注工具选择、标注任务开展、标注结果收集和标注结果检查环节。对不同环节进行阐述。
(2)标注任务开展
应根据业务需求和命名实体分类进行标注,包括:人名、职名、地名、组织机构名、产品名、事件、时间结构、数量结构、时间结构、数码标注规范。
4. 标准制定效益
本标准批准发布后,将为电力智能交互命名实体标注提供统一明确的技术规范,进而推动电力智能交互命名实体的标准化、规范化管理,有利于实现数据信息共享、融合,对于推进电力智能交互领域融合具有引领意义,有效推动能源企业业务模式创新和数字化转型。