海看网络科技(山东)股份有限公司程亚辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉海看网络科技(山东)股份有限公司申请的专利一种基于知识库的SVN跨模态检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120372065B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510874807.6,技术领域涉及:G06F16/907;该发明授权一种基于知识库的SVN跨模态检索方法及系统是由程亚辉;周筱婷;王光耀;王宗杨设计研发完成,并于2025-06-27向国家知识产权局提交的专利申请。
本一种基于知识库的SVN跨模态检索方法及系统在说明书摘要公布了:本发明公开了一种基于知识库的SVN跨模态检索方法及系统,主要涉及自然语言处理技术领域。包括以下步骤:捕获变更数据,当有文件提交到SVN版本库时,获取到SVN版本变更信息;根据SVN版本变更信息获取对应的变更文档;将变更文档转换为相应的向量检索和全文检索;根据用户输入,通过向量检索和全文检索得到符合条件的文档;对检索到的多个文档进行重排,找到符合用户检索条件的文档;重排后得到的文件名输入SVN版本库进行检索,得到文件版本相关项,对相关项进行计算,得到最终的召回结果。本发明的有益效果在于:它实现了查准率与查全率的平衡,同时显著提升了检索的准确性和适用性。
本发明授权一种基于知识库的SVN跨模态检索方法及系统在权利要求书中公布了:1.一种基于知识库的SVN跨模态检索方法,其特征在于,包括以下步骤: 步骤S1:捕获变更数据,当有文件提交到SVN版本库时,获取到SVN版本变更信息; 步骤S2:根据SVN版本变更信息获取对应的变更文档,对新增的文档和更新的文档按照文件类型进行分类,对于音频类文档通过ASR模型识别音频中信息得到文本内容;对于图片文件与视频文件使用多模态视觉识别大模型进行内容理解,输出图片视频对应的画面描述文本;对于文本类文档使用文本处理工具直接提取其中内容得到文本; 步骤S3:将变更文档转换为相应的向量检索和全文检索; 步骤S4:根据用户输入,通过向量检索和全文检索得到符合条件的文档; 步骤S5:对检索到的多个文档进行重排,找到符合用户检索条件的文档; 步骤S6:重排后得到的文件名输入SVN版本库进行检索,得到文件版本相关项,对相关项进行计算,得到最终的召回结果,所述对相关项进行计算包括: 根据返回的提交信息计算文件召回得分,得到最终的Top-k个检索结果,得到的指标数据可以进行时间、提交者、版本差异度的计算,计算过程如下: ,其中t为发布天数; 使用SVN进行项目文档管理,其文档版本通常会快速更新,其中,为文档的时间衰减系数; ; 当用户输入的查询条件中包含提交者信息时,对匹配上提交者的候选文件给予1的权重,否则为0,其中为候选文件是否与提交者匹配的标志位,采用行变更比例来计算文本文档的版本差异度: ; 其中为新增行数,为删除行数,为文件总行数,当新增行数和删除行数的总和占文件总行数的比例低时,差异度得分趋近于1,表明文件内容的稳定性或一致性更强,综合评分公式为: ; Score的值区间为[0,3]之间,Score的值越高代表候选文档的日期新、作者匹配且文件内容的稳定性强;反之文档的日期老、作者不匹配且文件内容改动较大,根据Score的得分对混合检索后的文档进行召回,返回Top-K个最佳的内容相关且符合用户查询的文档。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人海看网络科技(山东)股份有限公司,其通讯地址为:250000 山东省济南市历下区经十路18567号新广电中心大楼六楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。