南京云问网络技术有限公司李平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京云问网络技术有限公司申请的专利用于技术标准文档中三元组抽取系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115660085B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211339655.2,技术领域涉及:G06N5/025;该发明授权用于技术标准文档中三元组抽取系统及方法是由李平;杜振东;王清琛设计研发完成,并于2022-10-26向国家知识产权局提交的专利申请。
本用于技术标准文档中三元组抽取系统及方法在说明书摘要公布了:本发明公开一种三元组抽取系统,其先对句子中的S字段和P字段,接着确定S字段和P字段的尾位置,最后根据输入句子的文本向量表征结合S字段和P字段的相对位置关系抽取对应的O字段。本发明还公开一种用于技术标准文档中三元组抽取方法,主要采用不限类型的文档训练新的三元组抽取模型得到开放域三元组抽取模型;然后采用训练好的开放域三元组抽取模型抽取不同类型的技术标准文档,从而获得用于训练闭域三元组抽取模型的技术标准文件中的P字段;分别采用训练好的开放域三元组抽取模型和封闭域三元组抽取模型对待抽取的技术标准文档进行抽取,并将两个模型的抽取结果进行去重合并,得到待抽取的技术标准文档中的三元组。
本发明授权用于技术标准文档中三元组抽取系统及方法在权利要求书中公布了:1.一种三元组抽取系统,其特征在于:包括输入表征编码模块、S字段和P字段抽取模块、S字段和P字段关系确定模块和O字段抽取模块; 其中,输入表征编码模块将输入的句子转化成文本向量表征;并将得到的输入的句子的文本向量表征输入到S字段和P字段抽取模块; S字段和P字段抽取模块根据接收到的输入的句子的文本向量表征,抽取其中所有的S字段和P字段,并分类;并将抽取得到且分类后的结果输入到S字段和P字段关系确定模块; S字段和P字段关系确定模块通过S字段和P字段的尾部位置确定存在关系的S字段和P字段; O字段抽取模块根据句子中其他字段分别与存在关系的S字段和P字段的相对位置关系抽取对应的O字段; 其中,所述S字段和P字段关系确定模块被设置成根据抽取得到的S字段和P字段对应的尾部位置,通过S字段和P字段的尾部位置确定存在关系的S字段和P字段,具体包括以下过程: RS=tanhwshi+bs; RP=tanhwPhi+bP; Pi,j=σLinearRi,j; 其中,RS表示hi为S字段的尾部位置的表征;RP表示hi为P字段的尾部位置的表征;hi表示输入句子中第i个位置的内容的文本向量表征;ws、bs、wP和bP为待训练参数;tanh表示激活函数,表示拼接操作,σ表示sigmoid激活函数,Pi,j表示输入句子的第i个位置和第j个位置可以构成关系的概率;在训练过程中,输入句子的S字段的尾位置和P字段尾位置为已知信息,则根据已知信息训练待训练参数ws、bs、wP和bP; 所述O字段抽取模块被设置成按照以下过程获取输入句子中每个位置是O字段开始位置和结束位置的概率,实现O字段的抽取: sdis=EmbeddingSidx; pdis=EmbeddingPidx; 其中,hi表示输入句子中第i个位置的内容的文本向量表征;Sidx表示与其他字段与S字段之间的相对位置,Pidx表示其他字段与P字段之间的相对位置,wstart、bstart、wend和bend为待训练参数;表示输入句子中第i个位置是O字段的开始位置的概率,表示输入句子中第i个位置是O字段的结束位置的概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京云问网络技术有限公司,其通讯地址为:210000 江苏省南京市鼓楼区建宁路65号2楼203室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励