昆明理工大学余正涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利基于大语言模型语义能力的说话人日志任务优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119943055B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510110597.3,技术领域涉及:G10L15/26;该发明授权基于大语言模型语义能力的说话人日志任务优化方法是由余正涛;沈艺卓;马峻彬;高盛祥;王文君设计研发完成,并于2025-01-23向国家知识产权局提交的专利申请。
本基于大语言模型语义能力的说话人日志任务优化方法在说明书摘要公布了:本发明涉及基于大语言模型语义能力的说话人日志任务优化方法,属于人工智能技术领域。本发明包括步骤:通过语音活动检测和自动语音识别模块生成带时间戳的语音转录文本,将生成的时间戳与转录文本整合,形成时间戳文本流;利用提示构造器分析时间戳文本流,生成与说话人日志任务匹配的提示词;将生成的提示词、时间戳文本流输入大语言模型,解析时间戳和文本内容,生成包含时间戳、句子和说话人标签的初步说话人日志结果;对初步说话人日志结果进行后处理,输出准确的说话人日志结果,本发明的错误率有明显降低。
本发明授权基于大语言模型语义能力的说话人日志任务优化方法在权利要求书中公布了:1.基于大语言模型语义能力的说话人日志任务优化方法,其特征在于:所述方法包括: Step1、通过语音活动检测和自动语音识别模块生成带时间戳的语音转录文本,将生成的时间戳与转录文本整合,形成时间戳文本流; Step2、利用提示构造器分析时间戳文本流,生成与说话人日志任务匹配的提示词; Step3、将生成的提示词、时间戳文本流输入大语言模型,解析时间戳和文本内容,生成包含时间戳、句子和说话人标签的初步说话人日志结果; Step4、对初步说话人日志结果进行后处理,输出准确的说话人日志结果; 所述Step1包括:语音活动检测模块采用FSMN单声道大语言模型; 语音活动检测模块首先检测出音频中有效的语音片段,标注出这些语音片段的开始和结束时间戳;随后自动语音识别模块对这些语音片段进行转录,生成相应的文本;最终,语音活动检测模块生成的时间戳和自动语音识别模块生成的文本被整合为时间戳文本流; 所述Step3包括: Step3.1、将输入提示词的大语言模型结合输入的时间戳文本流,通过Few-shot提示策略对语义内容进行分析,识别不同说话人的发言区域和转换点,并通过Few-shot向模型展示典型的对话结构,指导模型准确区分不同说话人的发言;同时,模型根据语义特征判断说话人身份,并生成包含时间戳、句子和说话人标签的初步说话人日志结果; Step3.2、之后,进行多轮对话输入并多次生成初步说话人日志结果:若生成的日志中某些发言未能标记说话人身份,则默认标记为“说话人1”;而插话或语义转折的内容则根据语义特征分配给其他说话人。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励