北京智慧星光信息技术有限公司王兆元获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京智慧星光信息技术有限公司申请的专利一种文本相关性识别模型的调优方法、系统和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115374785B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211016261.3,技术领域涉及:G06F40/295;该发明授权一种文本相关性识别模型的调优方法、系统和存储介质是由王兆元;龚浩;李青龙设计研发完成,并于2022-08-24向国家知识产权局提交的专利申请。
本一种文本相关性识别模型的调优方法、系统和存储介质在说明书摘要公布了:本发明涉及网络模型技术领域,具体涉及一种文本相关性识别模型的调优方法、系统和存储介质。本发明首先根据数据预处理规则对输入文本进行切分,并将切分后的文本输入至TD‑LSTM模型,得到实体词在输入文本中的相关性分值A,同时,将文本的字面匹配信息和实体在文本中的分布规则信息输入至机器学习模型GBDT中,得到实体词在输入文本中的相关性分值B,最后,根据相关性分值A、相关性分值B和预设的处理规则,计算得到实体相关性程度的最终结果,本发明更改了输入至TD‑LSTM模型的规则,在实体词出现了大于等于一次时,选择尽可能处于中间的实体词位置,并提供文本的字面匹配信息和实体在文本中的分布规则信息,通过分析提高了判断文本相关性模型方法的准确性。
本发明授权一种文本相关性识别模型的调优方法、系统和存储介质在权利要求书中公布了:1.一种文本相关性识别模型的调优方法,其特征在于,包括: 根据数据预处理规则对输入文本进行切分并筛选,将筛选后的文本输入至TD-LSTM模型,得到实体词在输入文本中的相关性分值A; 将文本的字面匹配信息和实体在文本中的分布规则信息输入至机器学习模型GBDT中,得到实体词在输入文本中的相关性分值B; 根据所述相关性分值A、所述相关性分值B和预设的处理规则,计算得到实体相关性程度的最终结果; 根据数据预处理规则对输入文本进行切分,包括:当实体词在输入文本中出现了大于等于一次,则在输入文本中,从文本的左边往右边做实体词的字符串匹配,得到实体词命中位置序列;选择实体词命中位置序列中位于第X位的实体词命中位置对输入文本进行切分;X为实体词命中次数加1的和与2进行整除的结果; 所述文本的字面匹配信息,包括:实体词词频;全文词数;实体词词频全文词数;实体词是否在标题中; 所述实体在文本中的分布规则信息,包括: 实体词第一次出现的位置相对于输入文本中第一个词的偏移量; 实体词第一次出现的位置相对于输入文本中最后一个词的偏移量; 实体词最后一次出现的位置相对于输入文本中第一个词的偏移量; 实体词最后一次出现的位置相对于输入文本中最后一个词的偏移量; 实体词最后一次出现的位置与第一次出现的位置的间隔;所述间隔为实体词最后一次出现的位置相对于实体词第一次出现的位置的偏移量; 实体词多次出现时的平均间隔;所述平均间隔为实体词最后一次出现的位置相对于实体词第一次出现的位置的偏移量实体词命中位置序列长度减一,其中,表示除以。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京智慧星光信息技术有限公司,其通讯地址为:100089 北京市海淀区海淀大街8号A座22层A区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励