重庆邮电大学韦庆杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于行为文本处理的语音服务内容识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116166771B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211480102.9,技术领域涉及:G06F16/334;该发明授权一种基于行为文本处理的语音服务内容识别方法是由韦庆杰;朱思宇;刘歆;陈奉;万邦睿;姜美兰;王奕琀;宋阳设计研发完成,并于2022-11-22向国家知识产权局提交的专利申请。
本一种基于行为文本处理的语音服务内容识别方法在说明书摘要公布了:本发明涉及一种行为文本处理的语音服务内容识别方法,属于自然语言处理领域,包含以下步骤:采集客服的服务音频,计算音频各帧之间的声纹相似度,按相似度对音频帧进行聚类;建立客服人员音色库,确定服务音频客服身份;使用语音识别模型将服务音频转为语音文本;建立文本关键词库,计算与检索语音文本中的行为关键词,构建行为关键词序列;建立说话人行为识别模型,根据行为关键词序列确定客服行为,构建客服行为序列;建立服务内容识别模型,根据客服行为序列确定客服服务内容。
本发明授权一种基于行为文本处理的语音服务内容识别方法在权利要求书中公布了:1.一种基于行为文本处理的语音服务内容识别方法,其特征在于:包括以下步骤: S1:设置语音采集装置,获取客服人员工作时的工作音频;将客服人员每次接线与挂断间的音频,作为一个完整的服务音频,并对其进行分帧,参照每帧音频的声纹特征对分帧音频进行聚类,以获得客服音频信息; S2:建立客服人员音色库,使用声纹识别模型确定服务音频中客服的身份;使用语音识别模型将服务音频转为语音文本; S3:建立文本关键词库,用于确定服务行为;建立关键词获取模块,用于计算和检索语音文本中的行为关键词; S4:建立说话人行为识别模型;建立行为标签库,对构建的说话人行为识别模型进行训练,通过行为关键词序列确定说话人行为; S5:建立服务内容识别模型;建立服务内容标签库,对构建的服务内容识别模型进行训练,用于确定客服服务内容; 所述步骤S3包括以下步骤: S31:建立能够确定说话人行为的文本关键词库,表示为,表示第个行为关键词,代表关键词库中关键词的数量; S32:建立关键词获取模块,检索步骤S23获得的中所有行为关键词; 所述关键词获取模块包括分词对齐模块,张量化模块,替换模块三部分;语音文本关键词获取步骤如下: S321:分词对齐模块将对中的语音文本进行词语分割,同时对分割后语音文本中分词的数量进行对齐;对于中第段语音文本,将其输入分词器进行词语划分,分割后按照设置的最大分词数量进行数量对齐,若分词数量低于最大分词数量使用“null”进行数量补齐,否则进行截取,获得的分词文本表示为,其中表示中第个分词,表示最大分词数量;遍历,对每段语音文本进行词语分割,获得分词文本集合表示为,其中表示进行词语分割后的分词文本; S322:张量化模块将按照词语在哈工大同义词林中的位置,将其张量化为长度为6的向量;首先将S31获得的中所有的行为关键词张量化,其中第个行为关键词张量化过程如下:按照在同义词林6个分类级中的类别号,将转化为能表示6个类别号的向量,表示为 , 代表在同义词林中第级中的类别编号;遍历,将所有行为关键词向量化,获得行为关键词向量集合表示为,关键词向量集合维度为,代表关键词库中关键词的数量;将S31获得的中的所有分词张量化,其中第段分词文本中第个分词向量化后表示为,此时分词向量为一维长度为6的向量;遍历,将中所有分词向量化,获得的向量表示为,向量维度为;遍历将所有分词文本向量化,获得的分词向量集合表示为,分词向量集合维度为,表示被分割的音频段数量; S323:替换模块根据词语在哈工大同义词林中的位置,使用与其最相近的行为关键词替换它;首先提前对哈工大同义词林中的6个分类级别设置权重,表示为;计算中第段分词文本向量中第个分词向量与中第个行为关键词向量之间的语义相似度,计算公式为: 遍历,计算每一个关键词向量与之间的语义相似度,获得语义相似度最大的行为关键词向量,表示为,最后使用对应的行为关键词替换,替换后的分词表示为,是行为关键词库中的关键词;遍历,重复上述操作,使用行为关键词替换中每个分词,获得第段关键词替换文本表示为,关键词替换文本是一维长度为的向量;最后遍历,使用行为关键词替换每段分词文本中的所有分词获得行为关键词替换文本集合,表示为,行为关键词替换文本集合维度为; 所述步骤S4包括以下步骤: S41:行为关键词序列由步骤S31建立的文本关键词库中的行为关键词组成,即S323获得的行为关键词替换文本集合;在训练阶段,对所有的进行打标构建行为标签库; S42:基于语音文本的说话人行为识别模型根据编码后的行为关键词序列对说话人的行为进行分类,该模型由三个卷积层,三个池化层,一个全连接层和一个激活函数构成;先采用编码将步骤S323获得的向量化,其中第段关键词替换文本向量化后表示为,将输入三层卷积层与三层池化层中进行特征提取,再经过层处理,最终获得一个维度为的数组,表示为,表示设置的行为数量,表示第种行为出现的概率,最终的分类结果表示为,;遍历,获得每段关键词替换文本的分类结果,使用分类结果构建服务行为序列,表示为,代表被分成的段数,注意此时的即为所对应的服务行为序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区黄桷垭崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励