深圳海冰科技有限公司陈永祥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳海冰科技有限公司申请的专利一种基于数据挖掘测试的车载语音模型优化方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119694324B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411737937.7,技术领域涉及:G10L21/0208;该发明授权一种基于数据挖掘测试的车载语音模型优化方法及装置是由陈永祥;刘世捷;马文立;周玉芳设计研发完成,并于2024-11-29向国家知识产权局提交的专利申请。
本一种基于数据挖掘测试的车载语音模型优化方法及装置在说明书摘要公布了:本发明公开涉及一种基于数据挖掘测试的车载语音模型优化方法及装置,该方法包括:获取来自车载语音服务日志系统和网络爬取系统的数据源,该数据源包括音频数据和语义数据;通过数据筛选策略将该数据源中的无效音频数据进行删除,获取目标音频数据;通过数据过滤策略将该数据源中噪声文本数据和无效文本数据进行删除,获取目标语义数据;对该目标音频数据和目标语义数据进行识别,获取badcase数据;将该badcase数据加入车载语音模型进行规避学习,以对该车载语音模型进行优化。能够通过对数据的挖掘测试持续优化模型,且标注的数据可以用作后续模型评估的数据,为模型大版本更新迭代替换等提供评估的数据集方案,提升测试效率并解决模型实时性数据问题。
本发明授权一种基于数据挖掘测试的车载语音模型优化方法及装置在权利要求书中公布了:1.一种基于数据挖掘测试的车载语音模型优化方法,其特征在于,所述方法包括: 获取来自车载语音服务日志系统和网络爬取系统的数据源,所述数据源包括音频数据和语义数据; 通过数据筛选策略将所述数据源中的无效音频数据进行删除,获取目标音频数据; 通过数据过滤策略将所述数据源中噪声文本数据和无效文本数据进行删除,获取目标语义数据; 对所述目标音频数据和目标语义数据进行识别,获取badcase数据; 将所述badcase数据加入车载语音模型进行规避学习,以对所述车载语音模型进行优化; 所述获取来自车载语音服务日志系统和网络爬取系统的数据源,包括: 通过语音助手服务接入车载语音服务日志系统,对服务请求的数据进行日志保存; 获取来自所述车载语音服务日志系统的第一数据源,所述第一数据源包括用户真实的第一音频数据和对应的第一语义数据; 定时爬取网络中的实时影视媒资,音乐媒资和时政热点新闻中的文本数据,所述文本数据为第二语义数据; 通过音色合成服务将所述第二语义数据转换为第二音频数据,所述第二语义数据和第二音频数据共同组成第二数据源。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳海冰科技有限公司,其通讯地址为:518000 广东省深圳市福田区园岭街道华林社区上步北路1012号、1016号鹏益花园1栋、2栋2栋407;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励