昆明理工大学高盛祥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利一种基于迁移学习的老挝语字符转音素方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119207418B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411302433.2,技术领域涉及:G10L15/26;该发明授权一种基于迁移学习的老挝语字符转音素方法是由高盛祥;胡剑;董凌;余正涛设计研发完成,并于2024-09-18向国家知识产权局提交的专利申请。
本一种基于迁移学习的老挝语字符转音素方法在说明书摘要公布了:本发明涉及一种基于迁移学习的老挝语字符转音素方法,旨在利用在其他语言上预训练的模型,并通过对有限老挝语数据的微调来实现高效的音素转换。这种方法不仅能够缓解数据稀缺的问题,还可以加速模型的训练过程,提高模型在新任务上的泛化能力。通过迁移学习可以构建一个更加健壮的老挝语字符转音素模型,为后续的语音合成奠定基础。由于与老挝语具有很高语言相似性的泰语同样为低资源语言,无法作为预训练语言,本文选择中文作为预训练语言。基于Transformer架构先使用中文开源数据集训练一个中文G2P模型,将该模型的解码端参数初始化到学生模型并使用规模为一万的老挝语数据集微调训练,提升老挝语字符转音素模型准确率。
本发明授权一种基于迁移学习的老挝语字符转音素方法在权利要求书中公布了:1.一种基于迁移学习的老挝语字符转音素方法,其特征在于:包括: Step1:数据的选择及预处理;选择CPP中文-老挝语自构数据集; Step2:通过Transformer编码器模块捕捉字符之间的语义关系和上下文信息; Step3:通过微调模块对Transformer模型进行微调:引入了预先训练好的中文Transformer模型,通过替换解码器部分的嵌入层与输出全连接层,以适配不同的输出音素集合大小要求;最后,对调整后的模型在相同的语言和训练字典规模条件下进行了微调;用微调好的Transformer模型进行老挝语字符转音素; 所述Step2中包括: 采用老挝语字符粒度的BERT预训练语言模型作为Transformer编码器模块的一部分;输入字符序列首先通过分词器进行处理,其中包括文本转换为小写、去除标点符号、进行分词操作;BERT采用WordPiece分词方法,通过将单词进一步细分为子词,以优化词汇表的规模和提高模型的泛化能力;通过引入BERT预训练语言模型,旨在充分利用字符级别的信息,以加强对老挝语字符转音素任务中缺乏数据的挑战的应对能力;BERT模型的特征提取和表示学习能力被整合到字符转音素模型中,以更好地捕获字符之间的语义关系和上下文信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励