广东快乐十分


一种基于电力技术杂志论文非结构化数据提取的方法及系统

作者:亓富军 刊名: 上传者:胡娟

【摘要】本发明属于数据处理技术领域,公开了一种基于电力技术杂志论文非结构化数据提取的方法及系统,数据提取系统包括:输入模块、搜索模块、大数据分析模块、提取模块、数据存储模块。本发明通过搜索模块根据属性参数对应的实体标识生成新的搜索结果并提供,即由于属性参数可作为一个实体,通过将实体转换为实体标识,根据实体标识的唯一性,获得与其对应的搜索结果,彻底解决了实体重名、长搜索词的部分匹配等的问题,提高了搜索结果的精确度,提升了数据提取效率;同时通过大数据分析模块可以有效地减少查询的响应时间,可以快速的分析论文数据元素,提高数据提取速度。

参考文献

引证文献

问答

我要提问