北京通用人工智能研究院汪宇轩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京通用人工智能研究院申请的专利智能体的流视频理解模型的评估方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119741566B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510246878.1,技术领域涉及:G06V10/776;该发明授权智能体的流视频理解模型的评估方法、装置、设备及介质是由汪宇轩;郑子隆设计研发完成,并于2025-03-04向国家知识产权局提交的专利申请。
本智能体的流视频理解模型的评估方法、装置、设备及介质在说明书摘要公布了:本发明实施例提供了一种智能体的流视频理解模型的评估方法包括,可以应用于人工智能技术领域。该智能体的流视频理解模型的评估方法包括:根据接收的模型评价基准获取评测视频数据;对评测视频数据执行切分,以生成评测输入数据;通过评测输入数据,生成流视频理解模型的评测输出数据;以及根据评测输出数据和模型评价基准获取流视频理解模型的模型评估数据。本发明实施例还提供了一种智能体的流视频理解模型的评估装置、设备、存储介质和程序产品。
本发明授权智能体的流视频理解模型的评估方法、装置、设备及介质在权利要求书中公布了:1.一种智能体的流视频理解模型的评估方法,其特征在于,包括: 根据接收的模型评价基准获取与预设评估理解任务对应的评测视频数据,其中,预设评估理解任务分为流视频理解和主动推理两个方面,流视频理解分为动作预测任务、动态状态追踪任务和多轮依赖推理任务三个子任务,主动推理分为主动提醒任务、噪声识别任务和说话者识别任务三个子任务; 对所述评测视频数据执行切分,以生成评测输入数据; 模拟视频流输入形式将所述评测输入数据输入至所述流视频理解模型,以生成评测输出数据;以及 根据所述评测输出数据和模型评价基准获取所述流视频理解模型的模型评估数据; 其中模型评价基准为根据所述流视频理解模型的评估要求的流视频理解任务和预设问答数据集而生成的评价标准数据,其中该预设问答数据集中包括不同流视频理解任务对应的问题-标准答案之间的匹配数据集; 根据所述模型评估数据和预设指令跟随数据,对所述流视频理解模型执行训练,其中所述预设指令跟随数据包括图文交错指令、噪声指令和打断指令对应的主动推理数据; 其中,完成预设指令跟随数据训练的流视频理解模型的主动推理实用于Omni语言模型的KV-cache存储视频流,结合最大堆算法,发出主动提醒;此外,通过并行解码的方式实现包含随时打断的事实交互式的对话。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京通用人工智能研究院,其通讯地址为:100080 北京市海淀区颐和园路2号未来科技大厦东裙楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。