科大讯飞股份有限公司;河北省讯飞人工智能研究院;中科讯飞互联(北京)信息科技有限公司巩捷甫获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大讯飞股份有限公司;河北省讯飞人工智能研究院;中科讯飞互联(北京)信息科技有限公司申请的专利文本处理方法、计算机设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114298031B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111544933.3,技术领域涉及:G06F40/289;该发明授权文本处理方法、计算机设备及存储介质是由巩捷甫;申资卓;喻快;宋巍;盛志超;王士进;陈志刚;胡国平;秦兵;刘挺设计研发完成,并于2021-12-16向国家知识产权局提交的专利申请。
本文本处理方法、计算机设备及存储介质在说明书摘要公布了:本申请涉及人工智能技术领域,并公开了一种文本处理方法、计算机设备及存储介质,所述方法包括:获取待处理文本,所述待处理文本包括至少一条自然语言语句;将所述待处理文本输入预训练的文本润色模型,对所述自然语言语句、所述自然语言语句中的修饰词,和或所述自然语言语句中的待优化词汇进行润色处理,得到目标文本。能够对文本从语句、语句的修饰词和或语句的词汇层级进行润色处理,可以高效准确地提高文本内容的质量。
本发明授权文本处理方法、计算机设备及存储介质在权利要求书中公布了:1.一种文本处理方法,其特征在于,所述方法包括: 获取待处理文本,所述待处理文本包括至少一条自然语言语句; 获取预设数量的训练样本,对预设语言模型进行训练,得到预训练的文本润色模型; 将所述待处理文本输入预训练的文本润色模型,对所述自然语言语句、所述自然语言语句中的修饰词,和或所述自然语言语句中的待优化词汇进行润色处理,得到目标文本; 其中,所述预训练的文本润色模型包括第一目标网络分支和第二目标网络分支,所述预设语言模型包括第一网络架构和第二网络架构,所述获取预设数量的训练样本,对预设语言模型进行训练,得到预训练的文本润色模型,包括: 针对第一预设数量的第一训练样本中的任意一条优秀语句,根据预设的关键词抽取算法对所述优秀语句进行关键词抽取,得到至少一个关键词;分别生成所述优秀语句的第一序列和所述关键词的第二序列;将所述第二序列补充到所述第一序列,得到目标序列;将每条所述优秀语句对应的目标序列输入至所述预设语言模型,并基于所述目标序列对所述第一网络架构进行训练,得到所述第一目标网络分支;以及 针对第二预设数量的第二训练样本中的任意一对语料对进行分析,得到所述语料对中的无修饰词的语句中每个词的词向量,并基于所述语料对中的修饰词的第一位置,预测所述修饰词在所述词向量中的第二位置;基于所述第一位置和所述第二位置,预测所述修饰词的插入位置;根据所有所述修饰词的插入位置生成位置向量,并基于所述每个词的词向量和所述位置向量,确定各所述插入位置的预测修饰词;基于所述修饰词和所述预测修饰词,对所述第二网络架构进行训练,得到所述第二目标网络分支。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司;河北省讯飞人工智能研究院;中科讯飞互联(北京)信息科技有限公司,其通讯地址为:230000 安徽省合肥市合肥市高新开发区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。