中国电子科技集团公司第二十八研究所孙斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电子科技集团公司第二十八研究所申请的专利一种军事场景下文本语义检索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116150335B 。
龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211630251.9,技术领域涉及:G06F16/3329;该发明授权一种军事场景下文本语义检索方法是由孙斌;韩立斌;赵文成;袁翔;郑少秋;王静;周宇;黎健设计研发完成,并于2022-12-19向国家知识产权局提交的专利申请。
本一种军事场景下文本语义检索方法在说明书摘要公布了:本发明公开了一种军事场景下文本语义检索方法。一是基于军用预训练模型,构建对偶式语义检索模型,在军用语义检索数据集上训练微调,形成问答对语言表示模型,并离线获取军事文本数据语义向量库,通过向量聚类方式构建二级倒排索引;二是基于军用预训练模型,构建文本检索精排模型,在军用语义检索精排数据集上微调训练。面对实时检索任务,利用问句语言表示模型获取问句语义向量表示,通过向量相似度计算并检索,召回符合用户需求的文本集合,并使用文本检索精排模型,精准定位特定文本数据并反馈给用户。该方法能够从海量军事文本数据中实时精准定位用户所需数据,在军事场景下海量文本搜索、检索式问答场景下均可使用。
本发明授权一种军事场景下文本语义检索方法在权利要求书中公布了:1.一种军事场景下文本语义检索方法,其特征在于,包括如下步骤: 步骤1、军用预训练模型离线构建:构建军用文本语料数据集;选用开源预训练模型,在军用文本语料数据集中训练,形成军用预训练模型; 步骤2、对偶式语义检索模型离线构建:构建军用语义检索数据集;基于军用预训练模型,构建对偶式语义检索模型,在军用语义检索数据集上训练微调,生成问答对语言表示模型,包括问句语言表示模型和答案语言表示模型;收集待检索军事数据文本集合,针对待检索军事数据文本集合,利用答案语言表示模型离线生成军事文本数据语义向量库,并利用聚类算法构建二级倒排索引; 步骤3、文本检索精排模型离线构建:构建军用语义检索精排数据集,基于军用预训练模型,构建多分类精排模型,并在军用语义检索精排数据集训练微调,生成文本检索精排模型; 步骤4、面向实时任务的文本语义检索:输入用户数据需求,首先采用步骤2中生成的问句语言表示模型,获取问句语义表示向量;然后通过向量相似度计算和检索,获得与用户需求强相关的文本集合;最后使用步骤3中文本检索精排模型获得符合要求的文本答案,并反馈给用户。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司第二十八研究所,其通讯地址为:210046 江苏省南京市栖霞区灵山南路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。