北京九恒星科技股份有限公司周震获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京九恒星科技股份有限公司申请的专利基于大语言模型的音频和视频检索方法、系统及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119336944B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411292411.2,技术领域涉及:G06F16/732;该发明授权基于大语言模型的音频和视频检索方法、系统及存储介质是由周震;陶建宇设计研发完成,并于2024-09-14向国家知识产权局提交的专利申请。
本基于大语言模型的音频和视频检索方法、系统及存储介质在说明书摘要公布了:本发明提供了一种基于大语言模型的音频和视频检索方法、系统及存储介质,涉及计算机信息技术领域,方法包括以下步骤:获取与音频和视频检索内容相关的自然语言请求信息;根据大语言模型工具对请求信息进行向量化处理,提取出请求信息的检索信息;采用向量空间搜索算法在向量数据库中进行检索,筛选出其中与检索信息相匹配的向量;通过匹配向量的索引信息,在关系型数据库中进行检索,获取向量对应的关联信息,关联信息包括视频名称、文字内容和起止时间;将向量对应的目标视频或目标音频及其关联信息发送至客户端,并能够从起止时间内选择指定时间点播放目标视频或目标音频。
本发明授权基于大语言模型的音频和视频检索方法、系统及存储介质在权利要求书中公布了:1.一种基于大语言模型的音频和视频检索方法,其特征在于,包括以下步骤: 获取与音频和视频检索内容相关的自然语言请求信息; 根据大语言模型工具对所述请求信息进行向量化处理,提取出所述请求信息的检索信息; 采用向量空间搜索算法在向量数据库中进行检索,筛选出其中与所述检索信息相匹配的向量; 通过匹配所述向量的索引信息,在关系型数据库中进行检索,获取所述向量对应的关联信息,所述关联信息包括名称、文字内容和起止时间; 将所述向量对应的目标视频或目标音频及其所述关联信息发送至客户端,并能够从所述起止时间内选择指定时间点播放所述目标视频或目标音频; 所述向量数据库和所述关系型数据库的构建过程包括: 文件分离与识别,针对视频文件运用开源软件工具先从中提取音频文件,而后通过语音识别模型对提取的音频文件进行解析,针对音频文件直接通过语音识别模型对其进行解析;获取文件关联信息,演讲者、音频内容对应的文字内容以及所述文字内容在所述音频文件中对应的起止时间信息;对识别结果进行初步合并,并生成与合并文字内容对应的起止时间信息; 内容合并与修正,对初步合并内容进行二次合并,形成合并段落内容;采用大语言模型进行语义处理,删除非实质性内容;在对生成结果进行三次合并,形成预设文本长度的段落,进行人工修正错误内容,更新段落的对应起止时间; 向量化与存储,运用大语言模型对合并内容进行向量化处理,并将生成向量存储于向量数据库中;并将最终合并的所述关联信息存储于关系型数据库中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京九恒星科技股份有限公司,其通讯地址为:100080 北京市海淀区知春路7号致真大厦D座20层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。