杭州码全信息科技有限公司卢煜航获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州码全信息科技有限公司申请的专利应用于社会治理场景下的复杂文本相似度计算方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117076948B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311078788.3,技术领域涉及:G06F18/22;该发明授权应用于社会治理场景下的复杂文本相似度计算方法是由卢煜航;马汉杰;宗佳敏;俞健;王昶庆设计研发完成,并于2023-08-25向国家知识产权局提交的专利申请。
本应用于社会治理场景下的复杂文本相似度计算方法在说明书摘要公布了:本发明公开了一种应用于社会治理场景下的复杂文本相似度计算方法,其针对基层治理工作人员统一上报至平台的数据存在格式类似、事件背景占比高的问题,提出了将事件背景与完整文本先分离提取再计算相似度及构建困难负样本对的方法,解决了难以甄别事件背景占比过大且事件背景相同的不同事件的问题。对于民众自主上报的数据存在信息大量冗余、对同一事件的描述出入较大的问题,本发明提出了使用词重复算法构建困难正样本对的方法,解决了长短不一相似文本匹配的问题。在使用本发明后,其相似度算法的正确率得到较大提高,特别是对于困难样本的正确率得到显著提升。
本发明授权应用于社会治理场景下的复杂文本相似度计算方法在权利要求书中公布了:1.一种应用于社会治理场景下的复杂文本相似度计算方法,包括如下步骤: 1获取大量文本相似度训练数据和实体识别训练数据; 2获取实体识别预训练模型以及文本相似度预训练模型; 3利用实体识别训练数据对实体识别预训练模型进行微调,得到实体识别模型; 4对于文本相似度训练数据中长度近似的正样本对,使用词重复算法重构这类正样本对,使其句子对长度不一; 5对文本相似度训练数据中的负样本对进行数据增强; 6利用经过步骤4和5后的文本相似度训练数据对文本相似度预训练模型进行微调,得到文本相似度模型; 7通过矛盾调解平台接入数据,利用文本相似度模型对每一接入数据进行编码得到相应的句向量并形成事件数据存入语料库中; 对于任一接入数据,首先利用实体识别模型提取其事件背景文本,所述接入数据为描述矛盾纠纷事件的文本,然后利用文本相似度模型对该接入数据的事件背景文本和完整文本分别进行编码对应生成两个句向量并形成事件数据存入语料库中,所述语料库中每一组事件数据包含了事件编号、事件完整文本、事件背景文本、完整文本句向量、背景文本句向量; 8接收矛盾调解数据,将矛盾调解数据与语料库中事件数据的句向量进行相似度计算,并将计算结果同步至事件监控数据库中,从而对相应的事件进行预警。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州码全信息科技有限公司,其通讯地址为:311100 浙江省杭州市临平区南苑街道余之城3幢13层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励