广东锐兆音频设备有限公司陈增获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东锐兆音频设备有限公司申请的专利一种基于人工智能的多媒体会议室音响系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120812477B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511005194.9,技术领域涉及:H04R1/20;该发明授权一种基于人工智能的多媒体会议室音响系统是由陈增设计研发完成,并于2025-07-21向国家知识产权局提交的专利申请。
本一种基于人工智能的多媒体会议室音响系统在说明书摘要公布了:本发明涉及会议室音响控制技术领域,尤指一种基于人工智能的多媒体会议室音响系统,通过人员定位模块实时获取参会人员的图像位置与头部姿态,结合麦克风布局自动建立人员与通道的空间映射关系,实现麦克风通道的动态绑定。基于音频数据的语音活动检测自动识别主发言通道,并通过音响输出模块对通道增益进行差异化控制,有效抑制非发言麦克风的背景噪声。通过提取主发言者的行为特征和交互意图,基于强化学习模型对行为特征与交互意图进行联合建模,实现对下一发言者的预测及主通道的动态更新,并基于发言反馈持续优化策略参数。实现减少人工操作,提高语音输出清晰度与会议交互的自然流畅性。
本发明授权一种基于人工智能的多媒体会议室音响系统在权利要求书中公布了:1.一种基于人工智能的多媒体会议室音响系统,其特征在于,包括: 人员定位模块,用于基于采集的图像数据,对图像数据执行人脸识别与头部姿态估计,生成各参会人员身份标识与对应空间位置; 麦克风关联模块,用于基于所述空间位置与会议室麦克风布局关系,构建参会人员与麦克风通道之间的临时关系表; 主发言初定模块,用于对各麦克风通道采集的音频数据进行语音活动频率检测,并根据所述临时关系表确定主发言通道与对应人员身份标识; 音响输出模块,用于对所述主发言通道,执行通道增益维持处理,对其余通道执行增益抑制处理,得到当前有效音频信号集,并将所述有效音频信号集作为会议室扬声器输出音频信号进行音响输出; 交互特征提取模块,用于基于主发言通道与对应人员身份标识,对所述图像数据中主发言通道的人员区域进行视线方向、头部朝向与手部动作的行为特征提取,生成行为特征集;对有效发言音频信号集执行语音识别与语义解析处理,提取当前发言内容的交互意图; 主发言通道更新模块,用于根据所述行为特征集与交互意图,通过强化学习模型预测下一发言人员并根据临时关系表更新主发言通道,根据实际发言反馈结果计算奖励值,通过奖励值更新所述强化学习模型的策略参数; 所述人员定位模块用于执行以下步骤: 基于采集的图像数据,对图像数据执行人脸检测处理,得到图像帧中所有参会人员的人脸区域集合; 基于所述人脸区域集合,执行时序跟踪处理,按照帧序列为每一人脸区域分配唯一临时标识,得到参会人员身份标识与图像位置对; 根据所述图像位置,对每一人脸区域执行头部姿态估计处理,得到各标识对应的头部姿态参数,并结合图像位置过滤视角偏离阈值之外的无效人脸,得到姿态修正后的人脸空间投影参数集; 根据所述人脸空间投影参数集与摄像头标定参数,对各标识的人脸中心点与朝向信息进行三维映射,得到各参会人员身份标识与对应空间位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东锐兆音频设备有限公司,其通讯地址为:510000 广东省广州市番禺区东环街汪波三街南3号1栋301房之三;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励