深圳市昂纬科技开发有限公司郭占秋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市昂纬科技开发有限公司申请的专利基于语音指令的音视频播放器控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121053987B 。
龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511602023.4,技术领域涉及:G10L15/22;该发明授权基于语音指令的音视频播放器控制方法是由郭占秋;万祥兵;陈进设计研发完成,并于2025-11-04向国家知识产权局提交的专利申请。
本基于语音指令的音视频播放器控制方法在说明书摘要公布了:本发明涉及音视频控制技术领域,公开了基于语音指令的音视频播放器控制方法。该方法包括采集用户的原始语音指令流,此指令流含时域音频信号序列、环境噪声频谱及用户发音特征参数,可全面捕捉语音信息;再对原始语音指令流进行多模态指令解析处理,生成包含声学控制意图标识、语义操作对象描述及上下文关联参数的结构化控制指令集合,提升解析精准度;接着基于该集合执行播放器状态适配,生成含设备状态调整命令、媒体内容定位参数及界面交互逻辑标识的动态控制响应序列,驱动播放器执行多维度控制操作并生成实时播放控制效果反馈数据;最后依反馈数据优化多模态解析参数,生成自适应指令解析策略,优化用户对音视频播放器的控制体验。
本发明授权基于语音指令的音视频播放器控制方法在权利要求书中公布了:1.一种基于语音指令的音视频播放器控制方法,其特征在于,所述方法包括: 采集用户发出的原始语音指令流,所述原始语音指令流包含时域音频信号序列、环境噪声频谱及发音特征参数; 对所述原始语音指令流进行多模态指令解析处理,生成结构化控制指令集合,所述结构化控制指令集合包含声学控制意图标识、语义操作对象描述及上下文关联参数; 基于所述结构化控制指令集合执行播放器状态适配操作,生成动态控制响应序列,所述动态控制响应序列包含设备状态调整命令、媒体内容定位参数及界面交互逻辑标识; 根据所述动态控制响应序列驱动音视频播放器执行多维度控制操作,生成实时播放控制效果反馈数据; 基于所述实时播放控制效果反馈数据对所述多模态指令解析处理进行参数优化调整,生成自适应指令解析策略; 所述基于所述结构化控制指令集合执行播放器状态适配操作,生成动态控制响应序列,包括: 解析所述声学控制意图标识得到基础操作类型标识及操作强度参数; 根据所述语义操作对象描述检索媒体资源数据库,生成目标媒体资源标识及资源定位信息; 结合所述上下文关联参数计算播放器状态迁移路径,生成状态迁移约束条件; 融合所述基础操作类型标识、操作强度参数、目标媒体资源标识及状态迁移约束条件,生成设备状态调整命令、媒体内容定位参数及界面交互逻辑标识; 所述结合所述上下文关联参数计算播放器状态迁移路径,生成状态迁移约束条件,包括: 提取所述上下文关联参数中的历史操作序列记录及当前设备状态快照; 基于状态机模型对所述历史操作序列记录进行模式挖掘处理,生成常见状态迁移模式集合; 根据所述当前设备状态快照与常见状态迁移模式集合的匹配程度,生成状态迁移概率分布; 基于迁移代价函数对所述状态迁移概率分布进行优化筛选处理,生成状态迁移约束条件。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市昂纬科技开发有限公司,其通讯地址为:518000 广东省深圳市宝安区新安街道68区隆昌路10号美生创谷科技创新园夏谷401;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励