无锡江南计算技术研究所周林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉无锡江南计算技术研究所申请的专利一种基于预训练模型的事件文本智能标注方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119807394B 。
龙图腾网通过国家知识产权局官网在2026-01-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411881511.9,技术领域涉及:G06F16/334;该发明授权一种基于预训练模型的事件文本智能标注方法和装置是由周林;王思宇;吴碧伟;郭强;喻金桃;王宇设计研发完成,并于2024-12-19向国家知识产权局提交的专利申请。
本一种基于预训练模型的事件文本智能标注方法和装置在说明书摘要公布了:本发明公开了一种基于预训练模型的事件文本智能标注方法和装置,涉及计算机技术领域。该方法包括:加载预训练的事件文本标注模型,事件文本标注模型包括自然语言处理子模型和确定性策略梯度模块,确定性策略梯度模块包括标注决策网络;获取待标注事件文本和待标注事件文本的状态信息,将待标注事件文本输入至自然语言处理子模型进行识别,得到待标注事件文本的文本特征;将文本特征和状态信息输入至标注决策网络进行序列标注决策,确定待标注事件文本的标注决策,基于标注决策对待标注事件文本进行标注。本发明将自然语言处理子模型和确定性策略梯度模块结合,通过预训练不断优化确定性策略梯度模块的标注策略,从而提高事件文本标注的准确性。
本发明授权一种基于预训练模型的事件文本智能标注方法和装置在权利要求书中公布了:1.一种基于预训练模型的事件文本智能标注方法,其特征在于,包括: 加载预训练的事件文本标注模型,所述事件文本标注模型包括自然语言处理子模型和确定性策略梯度模块,所述确定性策略梯度模块包括标注决策网络; 获取待标注事件文本和所述待标注事件文本的状态信息,将所述待标注事件文本输入至所述自然语言处理子模型进行识别,得到所述待标注事件文本的文本特征; 将所述文本特征和所述状态信息输入至所述标注决策网络进行序列标注决策,确定所述待标注事件文本的标注决策,基于所述标注决策对所述待标注事件文本进行标注; 其中,所述事件文本标注模型的训练方法,包括: 获取事件文本标注任务的样本数据,所述样本数据包括第一轮次的标注样本数据和第一轮次的未标注样本数据; 迭代执行以下步骤,在满足第一迭代停止条件的情况下,得到训练完成的事件文本标注模型: 基于当前轮次的标注样本数据对事件文本标注模型进行训练,得到更新后的事件文本标注模型; 基于所述更新后的事件文本标注模型对当前轮次的未标注样本数据进行预测,得到所述当前轮次的每一未标注样本数据的标签概率分布; 基于所述当前轮次的每一未标注样本数据的标签概率分布对所述当前轮次的未标注样本数据进行采样并标注,得到下一轮次的标注样本数据; 其中,所述确定性策略梯度模块还包括价值网络,用于评估所述标注决策网络输出的标注决策的价值; 所述基于所述标注样本数据对事件文本标注模型进行训练,得到更新后的事件文本标注模型,包括: 基于所述标注样本数据对自然语言处理子模型进行微调,基于微调后的所述自然语言处理子模型对所述标注样本数据进行识别,提取所述标注样本数据的样本特征; 在每一时间步,将所述样本特征和所述标注样本数据的当前状态信息输入至所述标注决策网络进行序列标注决策,得到所述标注样本数据当前状态的标注决策,并基于所述标注决策与所述标注样本数据进行交互,确定经验数据样本,将所述经验数据样本存储于经验缓冲区中;其中,所述经验数据样本包括当前状态信息、所述标注决策、奖励值和下一状态信息; 迭代执行以下步骤,在满足第二迭代停止条件的情况下,得到所述更新后的事件文本标注模型: 从所述经验缓冲区中获取一批经验数据样本,基于所述一批经验数据样本确定所述价值网络的损失函数;基于所述价值网络的损失函数更新所述价值网络的网络参数; 基于更新后的所述价值网络对所述标注决策进行评估,得到所述标注决策的价值,基于所述标注决策的价值确定所述标注决策网络的梯度,基于所述梯度更新所述标注决策网络。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人无锡江南计算技术研究所,其通讯地址为:214000 江苏省无锡市滨湖区山水东路699号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励