上海阶跃星辰智能科技有限公司汪自力获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海阶跃星辰智能科技有限公司申请的专利自监督摘要生成方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120196750B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510677254.5,技术领域涉及:G06F16/34;该发明授权自监督摘要生成方法、系统、设备及介质是由汪自力设计研发完成,并于2025-05-26向国家知识产权局提交的专利申请。
本自监督摘要生成方法、系统、设备及介质在说明书摘要公布了:本申请实施例涉及自然语言处理技术领域,公开了一种自监督摘要生成方法、系统、设备及介质。使用预训练语言模型生成文档‑摘要对;通过自监督过滤器模块对所述文档‑摘要对进行筛选,得到数据集;使用专家迭代模块对所述数据集进行多轮自监督学习,迭代教师模型;将迭代后的所述教师模型的知识蒸馏到学生模型中;通过可控摘要生成模块,在训练和推理阶段引入控制属性,根据所述控制属性使用所述学生模型生成定制化摘要。通过构建一个自监督的信息理论目标,结合小型语言模型进行蒸馏和训练,降低了对大规模预训练模型的依赖。可以至少用以解决摘要生成质量低的技术问题。
本发明授权自监督摘要生成方法、系统、设备及介质在权利要求书中公布了:1.一种自监督摘要生成方法,其特征在于,所述方法包括: 使用预训练语言模型生成文档-摘要对; 通过自监督过滤器模块对所述文档-摘要对进行筛选,得到数据集; 使用专家迭代模块对所述数据集进行多轮自监督学习,迭代教师模型; 将迭代后的所述教师模型的知识蒸馏到学生模型中; 通过可控摘要生成模块,在学生模型的训练和推理阶段引入控制属性,根据所述控制属性使用所述学生模型生成定制化摘要,其中,所述控制属性包括:摘要长度、信息提取性和关键词; 所述通过自监督过滤器模块对所述文档-摘要对进行筛选包括: 对所述文档-摘要对进行mask处理,计算文档与摘要之间的互信息,根据所述互信息计算摘要的显著性评分、可信性评分和简洁性评分; 筛选出显著性评分、可信性评分和简洁性评分满足预设阈值的文档-摘要对,组成所述数据集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海阶跃星辰智能科技有限公司,其通讯地址为:200232 上海市徐汇区云锦路701号30层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。