腾讯科技(深圳)有限公司邓克琦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉腾讯科技(深圳)有限公司申请的专利一种数据处理方法、装置、设备、存储介质和程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114328811B 。
龙图腾网通过国家知识产权局官网在2025-06-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111173239.5,技术领域涉及:G06F16/334;该发明授权一种数据处理方法、装置、设备、存储介质和程序产品是由邓克琦;曹松军;马龙设计研发完成,并于2021-10-08向国家知识产权局提交的专利申请。
本一种数据处理方法、装置、设备、存储介质和程序产品在说明书摘要公布了:本申请实施例公开了一种数据处理方法、装置、设备、存储介质和程序产品,由于第一语音训练样本中的多段子语音信息对应于同一口音类型用户,因此多段子语音信息具有相似的口音特征。基于此,基于人工智能技术,根据多段子语音信息口音特征之间的差异确定第一损失函数,根据待定口音类型与样本口音类型之间差异确定第二损失函数,基于第一损失函数和第二损失函数对初始口音分类模型进行参数调整,可以一方面使初始口音分类模型所确定出的口音类型更加准确,一方面可以使模型在训练的过程中,控制所确定出的子语音信息口音特征之间的差异在合理范围内,使口音特征确定的方式更加贴合真实的口音情况,提高口音分类模型训练的准确度和合理性。
本发明授权一种数据处理方法、装置、设备、存储介质和程序产品在权利要求书中公布了:1.一种数据处理方法,其特征在于,所述方法包括: 获取对应样本口音类型的第一语音训练样本,所述第一语音训练样本包括对应同一口音类型用户的多段子语音信息,所述第一语音训练样本为语音训练样本集所包括的多个第一语音训练样本中的任意一个,所述多个第一语音训练样本所包括的多段子语音信息对应第一用户和第二用户,所述第一用户的口音类型与所述第二用户的口音类型不同; 根据所述第一语音训练样本和初始口音分类模型确定所述多段子语音信息分别对应的口音特征,以及所述第一语音训练样本对应的待定口音类型,所述待定口音类型是基于所述口音特征确定的,所述初始口音分类模型用于对语音信息的口音类型进行分类,所述口音特征体现出子语音信息所对应用户的口音特点; 确定所述第一语音训练样本对应的第一损失函数和第二损失函数,所述第一损失函数是根据所述多段子语音信息分别对应的口音特征之间的差异确定的,所述第二损失函数是根据所述待定口音类型与所述样本口音类型之间的差异确定的; 根据所述第一损失函数、所述第二损失函数对所述初始口音分类模型进行参数调整,得到口音分类模型,所述口音分类模型用于确定待分类语音信息对应的口音类型; 确定所述第一损失函数对应的第一权重参数和所述第二损失函数对应的第二权重参数,所述第一权重参数用于标识第一损失函数对于初始特征提取子模型参数调整的影响程度,所述第二权重参数用于标识第二损失函数对于初始特征提取子模型参数调整的影响程度; 其中,所述初始口音分类模型包括初始特征提取子模型和初始特征分类子模型,所述初始特征提取子模型用于确定所述多段子语音信息分别对应的所述口音特征,所述初始特征分类子模型用于根据所述口音特征确定所述待定口音类型,所述初始特征提取子模型包括线性层,所述线性层用于基于相关参数对口音特征进行线性分类,所述根据所述第一损失函数、所述第二损失函数对所述初始口音分类模型进行参数调整,得到口音分类模型,包括: 根据所述第一损失函数和所述第二损失函数,对所述初始特征提取子模型进行参数调整,得到特征提取子模型,其中包括:根据所述第一损失函数、所述第一权重参数、所述第二损失函数、所述第二权重参数确定综合损失函数;根据所述综合损失函数对所述初始特征提取子模型的线性层进行参数调整,得到特征提取子模型; 根据所述第二损失函数,对所述初始特征分类子模型进行参数调整,得到特征分类子模型; 根据所述特征提取子模型和所述特征分类子模型,确定所述口音分类模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯科技(深圳)有限公司,其通讯地址为:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。