中国人民解放军空军军医大学师文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军空军军医大学申请的专利基于人工智能声纹识别的手术安全核查方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115938371B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211220782.0,技术领域涉及:G10L17/22;该发明授权基于人工智能声纹识别的手术安全核查方法及系统是由师文;高昌俊;边梅;彭钰娟;史英武;苏宇林设计研发完成,并于2022-10-08向国家知识产权局提交的专利申请。
本基于人工智能声纹识别的手术安全核查方法及系统在说明书摘要公布了:本发明提供的基于人工智能声纹识别的手术安全核查方法及系统,涉及人工智能技术领域。在本发明中,对待核查用户进行语音信息采集操作,以输出对应的待识别用户音频。对待识别用户音频进行音频分割操作,以形成待识别用户音频对应的多个待识别用户音频片段。依据预先训练得到的声纹识别模型分别对多个待识别用户音频片段中的每一个待识别用户音频片段进行识别操作,以输出多个待识别用户音频片段对应的多个音频识别结果,再依据多个音频识别结果对待核查用户进行身份核查操作,以输出用户身份核查结果。基于上述方法,可以提高手术安全核查的可靠度。
本发明授权基于人工智能声纹识别的手术安全核查方法及系统在权利要求书中公布了:1.一种基于人工智能声纹识别的手术安全核查方法,其特征在于,应用于安全核查服务器,所述手术安全核查方法包括: 对待核查用户进行语音信息采集操作,以输出所述待核查用户对应的待识别用户音频,所述待识别用户音频包括多帧用户音频帧; 对所述待识别用户音频进行音频分割操作,以形成所述待识别用户音频对应的多个待识别用户音频片段,所述多个待识别用户音频片段中的每一个所述待识别用户音频片段包括多帧用户音频帧; 依据预先训练得到的声纹识别模型分别对所述多个待识别用户音频片段中的每一个待识别用户音频片段进行识别操作,以输出所述多个待识别用户音频片段对应的多个音频识别结果,再依据所述多个音频识别结果对所述待核查用户进行身份核查操作,以输出用户身份核查结果,所述用户身份核查结果用于反映所述待核查用户是否属于目标手术的参与人; 所述对所述待识别用户音频进行音频分割操作,以形成所述待识别用户音频对应的多个待识别用户音频片段的步骤,包括: 对所述待识别用户音频进行音频-文本转换操作,以输出所述待识别用户音频对应的待识别用户文本数据; 依据所述待识别用户文本数据,对所述待识别用户音频进行音频分割操作,以形成所述待识别用户音频对应的多个待识别用户音频片段; 所述依据所述待识别用户文本数据,对所述待识别用户音频进行音频分割操作,以形成所述待识别用户音频对应的多个待识别用户音频片段的步骤,包括: 对所述待识别用户文本数据进行分段操作,以输出所述待识别用户文本数据对应的多个候选文本数据片段; 对于所述多个候选文本数据片段中相邻的每两个候选文本数据片段,对该两个候选文本数据片段进行文本相似度的计算操作,以输出该两个候选文本数据片段之间的文本相似度,再将该两个候选文本数据片段之间的文本相似度与预先配置的文本相似度参考值进行大小比较操作,以及,在该文本相似度小于或等于所述文本相似度参考值的情况下,将该两个候选文本数据片段标记为相互对应的非关联候选文本数据片段; 在所述多个候选文本数据片段中中存在至少两个不属于相互对应的非关联候选文本数据片段的两个候选文本数据片段的情况下,回转执行所述对所述待识别用户文本数据进行分段操作,以输出所述待识别用户文本数据对应的多个候选文本数据片段的步骤,在所述多个候选文本数据片段中中相邻的每两个候选文本数据片段都属于相互对应的非关联候选文本数据片段的情况下,将当前输出的多个候选文本数据片段中的每一个候选文本数据片段分别标记为目标文本数据片段,以输出多个目标文本数据片段; 依据所述多个目标文本数据片段,对所述待识别用户音频进行音频分割操作,以形成所述待识别用户音频对应的多个候选待识别用户音频片段; 对于所述多个候选待识别用户音频片段中相邻的每两个候选待识别用户音频片段,对该两个候选待识别用户音频片段进行音频相似度的计算操作,以输出该两个候选待识别用户音频片段之间的音频相似度; 在所述多个候选待识别用户音频片段中相邻的每两个候选待识别用户音频片段之间的音频相似度中存在大于或等于预先设置的音频相似度对比值的至少一个音频相似度的情况下,回转执行所述对所述待识别用户文本数据进行分段操作,以输出所述待识别用户文本数据对应的多个候选文本数据片段的步骤,在所述多个候选待识别用户音频片段中相邻的每两个候选待识别用户音频片段之间的音频相似度中不存在大于或等于预先设置的音频相似度对比值的至少一个音频相似度的情况下,将当前形成的多个候选待识别用户音频片段中的每一个候选待识别用户音频片段标记为待识别用户音频片段,以形成多个待识别用户音频片段; 所述对于所述多个候选待识别用户音频片段中相邻的每两个候选待识别用户音频片段,对该两个候选待识别用户音频片段进行音频相似度的计算操作,以输出该两个候选待识别用户音频片段之间的音频相似度的步骤,包括: 分别将所述音频相似度的计算操作对应的两个候选待识别用户音频片段标记为第一候选待识别用户音频片段和第二候选待识别用户音频片段,再依据所述第一候选待识别用户音频片段包括的每一帧第一用户音频帧对应的第一音频能量值进行序列化操作,以输出所述第一候选待识别用户音频片段对应的第一音频能量序列,以及,再依据所述第二候选待识别用户音频片段包括的每一帧第二用户音频帧对应的第二音频能量值进行序列化操作,以输出所述第二候选待识别用户音频片段对应的第二音频能量序列; 依据目标片段数量,对所述第一音频能量序列进行分割操作,以输出对应的多个第一音频能量序列片段,再依据所述目标片段数量,对所述第二音频能量序列进行分割操作,以输出对应的多个第二音频能量序列片段,所述多个第一音频能量序列片段的数量等于所述目标片段数量,所述多个第二音频能量序列片段的数量等于所述目标片段数量; 对于每一个第一音频能量序列片段,分别将该第一音频能量序列片段包括的每一个第一音频能量值和对应的第一用户音频帧的音频帧时序进行坐标化操作,以输出该第一音频能量序列片段对应的第一音频特征坐标集合,所述第一音频特征坐标集合包括多个第一音频特征坐标,对于每一个第二音频能量序列片段,分别将该第二音频能量序列片段包括的每一个第二音频能量值和对应的第二用户音频帧的音频帧时序进行坐标化操作,以输出该第二音频能量序列片段对应的第二音频特征坐标集合,所述第二音频特征坐标集合包括多个第二音频特征坐标; 对于每一个第一音频能量序列片段,对该第一音频能量序列片段对应的第一音频特征坐标集合包括的多个第一音频特征坐标进行两两连接操作,以在每两个第一音频特征坐标之间形成第一连接线,再依据面积最小的原则,对所述第一连接线和所述第一音频特征坐标进行遍历操作,以输出该第一音频能量序列片段对应的第一区域,再将该第一区域的中心点对应的音频能量值标记为该第一音频能量序列片段对应的目标第一音频能量值,所述第一区域的每一条边属于为一条所述第一连接线,所述第一区域包括的顶点与对应的所述多个第一音频特征坐标重合; 对于每一个第二音频能量序列片段,对该第二音频能量序列片段对应的第二音频特征坐标集合包括的多个第二音频特征坐标进行两两连接操作,以在每两个第二音频特征坐标之间形成第二连接线,再依据面积最小的原则,对所述第二连接线和所述第二音频特征坐标进行遍历操作,以输出该第二音频能量序列片段对应的第二区域,再将该第二区域的中心点对应的音频能量值标记为该第二音频能量序列片段对应的目标第二音频能量值,所述第二区域的每一条边属于为一条所述第二连接线,所述第二区域包括的顶点与对应的所述多个第二音频特征坐标重合; 依据每一个所述第一音频能量序列片段对应的目标第一音频能量值进行集合构建操作,以输出第一音频能量值有序集合,再依据每一个所述第二音频能量序列片段对应的目标第二音频能量值进行集合构建操作,以输出第二音频能量值有序集合,再依据对应集合位置的目标第一音频能量值和目标第二音频能量值之间的差值,对所述第一音频能量值有序集合和所述第二音频能量值有序集合进行相似度的计算操作,以输出所述两个候选待识别用户音频片段之间的音频相似度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军空军军医大学,其通讯地址为:710038 陕西省西安市灞桥区新寺路唐都医院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励