北京信工博特智能科技有限公司葛志启获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京信工博特智能科技有限公司申请的专利一种可控可信的公文生成模型的训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119988648B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510474631.5,技术领域涉及:G06F16/36;该发明授权一种可控可信的公文生成模型的训练方法是由葛志启;周斌设计研发完成,并于2025-04-16向国家知识产权局提交的专利申请。
本一种可控可信的公文生成模型的训练方法在说明书摘要公布了:本发明公开了一种可控可信的公文生成模型的训练方法,涉及自然语言处理技术领域,包括以下步骤:S1、基于政府机构、公共数据库和法律文书库采集原始公文数据,建立多源多类型语料库,所述多源多类型语料库包括:请示报告、会议纪要、通知公告和政策文件。本发明提出的公文生成模型的训练方法通过深度整合自然语言处理技术与公文生成规范,显著提升了公文生成的质量与效率,该方法通过构建多源多类型语料库,确保了公文内容的丰富性和多样性,同时,去重和标准化处理有效避免了信息冗余和格式不一的问题,评估系统的引入,对数据质量进行了严格把关,为模型训练提供了可靠保障,实现了对公文生成过程的动态约束和实时监控。
本发明授权一种可控可信的公文生成模型的训练方法在权利要求书中公布了:1.一种可控可信的公文生成模型的训练方法,其特征在于,包括以下步骤: S1、基于政府机构、公共数据库和法律文书库采集原始公文数据,建立多源多类型语料库,所述多源多类型语料库包括:请示报告、会议纪要、通知公告和政策文件; S2、对采集的语料库原始数据进行去重和标准化处理; S3、建立由格式校验器、法律合规检测模块和语义完整性分析器组成的评估系统对数据质量进行评估,并基于评估后的数据,将数据划分为训练集和测试集; S4、构建基于BART-large架构的预训练语言模型,集成可控性门控机制和可信度评估网络; S5、并行训练基础可控模型、可信增强模型及鲁棒性增强模型,其中可信增强模型实时对接法律法规数据库进行核验,鲁棒性增强模型注入对抗噪声,通过测试集动态监控生成内容的可控偏离度与法律合规性,触发早停机制防止过拟合; S6、对训练完成的三类模型进行验证集表现加权参数融合,生成最终部署模型,并通过用户反馈闭环机制自动触发迭代优化; 所述可信度评估网络包括: 法律条款核查器通过国家法律法规数据库API验证引用条款时效性,对失效条款自动替换为最新版本; 逻辑矛盾检测器构建时间-事件关系图谱,识别生成内容中的时序冲突; 来源可信度评分模块计算: ; 式中,为综合可信度评分,为法律合规性得分,为内容一致性得分,为加权系数; 其中法律合规性得分的计算公式为: ; 式中,为法律合规性评分,为生成条款总数,为第条生成条款,为法律知识库集合,为指示函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京信工博特智能科技有限公司,其通讯地址为:100000 北京市朝阳区广顺北大街17号4层04层B03内01室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。