Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆大学鄢萌获国家专利权

重庆大学鄢萌获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆大学申请的专利一种基于大模型的标题生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119903179B

龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411959434.4,技术领域涉及:G06F16/34;该发明授权一种基于大模型的标题生成方法是由鄢萌;徐银康;张小洪;孙伟峰;刘骁设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。

一种基于大模型的标题生成方法在说明书摘要公布了:本发明涉及一种基于大模型的标题生成方法,提出了文档组件分析器DCA和标题生成模型TGM,来为缺陷报告自动生成高质量的标题。具体来说,应用文档组件分析器DCA来将不同样式的缺陷报告转换为模板化缺陷报告,再将模板化缺陷报告标题生成模型TGM以自动生成高质量的标题。该方法展示了其在为各种缺陷报告格式生成高质量标题方面的稳健性和有效性。

本发明授权一种基于大模型的标题生成方法在权利要求书中公布了:1.一种基于大模型的标题生成方法,其特征在于,包括离线训练阶段和在线推理阶段,离线训练阶段分为训练文档组件分析器DCA和构建标题生成模型TGM; 从公开数据上收集数据并构建数据集,数据集中每条数据都是一个完整的缺陷报告,缺陷报告中包含description、reproduction、expectedbehavior、others这四个字段,且这四个字段格式相同,则认为该条数据为模板化缺陷报告数据,否则为非模板化缺陷报告数据; 在离线训练阶段,包括如下阶段: 构建和训练文档组件分析器DCA,DCA的结构包含嵌入层、编码层、分类层和输出层,包括如下步骤: S101:获取模板化缺陷报告数据,其中每条数据由文本和标题构成; S102:将每段文本分割成一系列的单个句子,每个句子都打上真实类别标签,真实类别标签为description、reproduction、expectedbehavior和others; S103:使用预训练的BERT模型对DCA的参数进行初始化,使用预训练的BERT模型将句子S转换为标记序列T; S104:通过嵌入层,将标记序列T转换为嵌入序列XT; S105:对于XT,将其输入编码层,得到标记向量h[CLS],然后,h[CLS]被传递到分类层,通过softmax函数来预测句子的预测类别,计算预测类别与句子真实类别标签之间的损失,并根据该损失更新DCA的参数;每轮训练会将模板化缺陷报告数据中所有数据均输入DCA进行训练,当进行完设定轮次训练后,得到训练好的DCA; 构建标题生成模型TGM,TGM的结构包含嵌入层、编码器层、解码器层和输出层,包括如下步骤: S201:获取非模板化缺陷报告数据,将非模板化的缺陷报告数据输入训练好的DCA转化为模板化缺陷报告数据; 转化后的模板化缺陷报告数据中的每条数据由文本和标题构成;将文本中的每个句子都打上真实类别标签,真实类别标签为description、reproduction、expectedbehavior和others; S202:设计四个输入槽位,分别对应转化后的每条模板化缺陷报告数据中的description、reproduction、expectedbehavior和others,将转化后的每条模板化缺陷报告数据嵌入输入槽位生成输入序列fInput,fInput=DES:[X]:REP:[Y]:EXP:[Z]:OTH:[V],其中[X]、[Y]、[Z]和[V]为转化后的模板化缺陷报告数据中不同真实类别标签的文本;DES、REP、EXP和OTH为不同真实类别标签的占位符; S203:使用预训练的CodeT5对TGM的参数进行初始化,采用自注意力机制self-attention和编码器-解码器注意力机制encoder-decoderattention对fInput进行编码后表示为 S204:将传入多个Transformer编码器,并应用自注意力机制、前馈网络和层归一化操作,得到上下文表示向量R; S205:将R输入TGM生成预测标题,计算预测标题与真实标题之间的损失,并根据该损失更新TGM参数,每轮训练会将非模板化缺陷报告数据中所有数据均输入TGM进行训练,当进行完设定轮次训练后,得到训练好的TGM; 在线推理阶段,包括如下步骤: S300:对于一个缺陷报告,判断该缺陷报告是否是模板化的,若缺陷报告中包含description、reproduction、expectedbehavior、others这四个字段,且这四个字段格式相同,则认为该缺陷报告为模板化缺陷报告,否则,为非模板化缺陷报告; 如果是模板化缺陷报告,则直接提取分类好的句子;使用S202的方法将分类好的句子嵌入输入槽位生成f′Input,再使用S203的方法将f′Input转化为使用S204的方法将转化为R’,将R’输入训练好的TGM,输出即为预测的该缺陷报告的标题; 如果是非模板化缺陷报告,则利用训练好的DCA将该缺陷报告转化为模板化的缺陷报告;使用S202的方法将转化为模板化的缺陷报告嵌入输入槽位生成f′Input,再使用S203的方法将f′Input转化为使用S204的方法将转化为R’,将R’输入训练好的TGM,输出即为预测的该缺陷报告的标题。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学,其通讯地址为:400044 重庆市沙坪坝区沙正街174号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。