杭州中焯信息技术股份有限公司朱永蕾获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州中焯信息技术股份有限公司申请的专利一种基于关键词的资讯提取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120542418B 。
龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510622771.2,技术领域涉及:G06F40/284;该发明授权一种基于关键词的资讯提取方法及系统是由朱永蕾;孙杰;陈加良设计研发完成,并于2025-05-15向国家知识产权局提交的专利申请。
本一种基于关键词的资讯提取方法及系统在说明书摘要公布了:本发明涉及一种基于关键词的资讯提取方法及系统,涉及资讯提取的领域,其包括接收资讯文本;基于预设的提取算法从资讯文本提取关键词;基于关键词确定资讯文本所属的信息领域;基于预设的算法获取关键词的语境类别及上下文关联关系;基于语境类别及上下文关联关系,将关键词填充至预设的空白语境模块内,以得到关键词语境模块;将关键词语境模块构建场景模拟,以得到符合实际场景的关键内容,并进行输出。本申请具有通过构建关键词语境关联网络,结合语义连接强度与统计特征,有效捕捉深层语义关联,避免传统权重分析中语义缺失导致的偏差的效果。
本发明授权一种基于关键词的资讯提取方法及系统在权利要求书中公布了:1.一种基于关键词的资讯提取方法,其特征在于,包括: 步骤1:接收资讯文本; 步骤2:基于预设的提取算法从所述资讯文本提取关键词; 步骤3:基于所述关键词确定资讯文本所属的信息领域; 步骤4:基于预设的关联算法获取所述关键词的语境类别; 步骤5:基于所述语境类别将关键词填充至预设的空白语境模块内,以得到关键词语境模块; 步骤6:将所述关键词语境模块构建场景模拟,以得到符合实际场景的关键内容,并进行输出; 其中,步骤5之后至步骤6之前的步骤还包括: 步骤50:基于任意一个所述关键词语境模块内的所述关键词与其它的所述关键词从预设的关键词数据库中查找到对应的关联性; 步骤51:基于所述关联性对所述关键词进行构建以形成语境关联网络; 步骤52:分析所述语境关联网络中所述关键词的连接边数以及对应的连接强度; 步骤53:基于预设的遍历算法获取所述关键词于资讯文本中的出现次数与位置参数; 步骤54:基于所述连接边数、所述连接强度、所述出现次数与所述位置参数确定所述关键词的关键词重要值; 步骤55:筛选所述关键词重要值低于预设的重要性阈值的所述关键词,将其从所述关键词语境模块中舍弃以得到修正关键词语境模块,将所述修正关键词语境模块剩余的所述关键词定义为修正关键词; 步骤56:将所述修正关键词语境模块作为所述关键词语境模块进行输出; 步骤57:于所述修正关键词的数量小于预设的数量临界值,输出预设的模块警报信号; 其中,将所述关键词语境模块构建场景模拟的方法包括: 步骤60:基于所述关键词语境模块确定模块属性; 步骤61:基于所有的所述模块属性和所述信息领域从预设的场景模拟库查找对应的场景模拟方案和场景模拟方案可信度与场景模拟方案可信度阈值; 步骤610:于所述场景模拟方案可信度大于所述场景模拟方案可信度阈值,则将所述关键词语境模块对应的所述关键词于所述场景模拟方案中进行模拟; 步骤611:于所述场景模拟方案可信度小于所述场景模拟方案可信度阈值,则输出预设的信息缺失警报信号; 其中,将所述关键词语境模块对应的所述关键词于所述场景模拟方案中进行模拟的方法包括: 步骤6100:基于所述场景模拟方案将所述关键词语境模块拼接为完整语句; 步骤6101:对所述完整语句的逻辑性进行定量分析,以获得所述完整语句的逻辑值; 步骤6102:基于所述逻辑值对所述完整语句进行排序以得到所述完整语句的可信度排序; 步骤6103:基于所述可信度排序,将所述逻辑值最高的所述完整语句作为所述关键内容输出,从剩余的所述完整语句中按所述可信度排序选取预设数量的完整语句作为所述关键内容的补充内容输出; 其中,基于所述可信度排序,将可信度最高的完整语句作为所述关键内容输出,从剩余完整语句中按所述可信度排序选取预设数量的完整语句作为所述关键内容的补充内容输出的方法包括: 步骤61030:基于所述完整语句判断所述资讯文本的内容关联性; 步骤61031:于所述内容关联性高于预设的合理关联阈值时,则将预设数量的所述可信度最高的完整语句作为所述关键内容输出,从剩余的所述完整语句中按所述可信度排序选取预设数量的所述完整语句作为所述关键内容的补充内容输出; 步骤61032:于所述内容关联性低于预设的合理关联阈值时,并将所述资讯文本基于内容关联性分割,获得次级资讯文本; 步骤61033:基于所述次级资讯文本对所述完整语句进行分类以得到次级完整语句; 步骤61034:将各自的预设数量的可信度最高的所述次级完整语句作为各自的所述关键内容输出,从剩余的所述次级完整语句中按所述可信度排序选取预设数量的所述次级完整语句作为所述关键内容的补充内容输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州中焯信息技术股份有限公司,其通讯地址为:310012 浙江省杭州市西湖区西斗门路3号天堂软件园D幢16楼ABCD座;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励