由于国家电网各类信息化系统的大规模应用,公司积累了大量的文本数据。为了挖掘其蕴含的重要价值,更好地支撑业务应用开展,需要有一套语言处理基础软件系统。因此,中国电力科学研究院有限公司采购九瑞的语言处理基础软件系统,软件系统功能包括:
1、对非结构化文本进行分词、词性标注、实体识别、实体消歧、句法分析。
2、提供电力词表管理工具。
3、提供文本信息抽取、关键信息抽取、实体抽取及部分关系抽取。
1、系统提供多数据源管理功能,支持txt、xml、excel和关系数据库等类型;系统利用分布式任务调度程序可实现对数据的解析与处理功能。
2、支持对不同数据处理任务流程定义功能,每个流程节点可设置自然语言处理算法,支持对数据处理任务灵活配置功能,支持对开源算法和互联网独立产品组合功能,工作流工具支持在线可视化设计。
3、系统提供普通词表和叙词表管理功能,满足电力词表加工、持续更新等需求。
4、一套完善的语言处理基础工具,提供分词、词性标注、实体识别、消歧、句法分析等功能。
5、基于项目文本数据,能够实现项目关键信息的抽取,构建项目的标签,其中准确率高于80%。
6、基于电力文本数据,能够实现实体自动抽取、关系抽取等功能,提供实体及关系的可视化展示功能,其中实体抽取准确率高于75%。
合作热线:010-58246699 转 258