Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙江邦盛科技股份有限公司;杭州邦睿科技有限公司李莹获国家专利权

浙江邦盛科技股份有限公司;杭州邦睿科技有限公司李莹获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙江邦盛科技股份有限公司;杭州邦睿科技有限公司申请的专利一种基于自监督表示学习的企业单位地址匹配方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116303881B

龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211600260.3,技术领域涉及:G06F16/334;该发明授权一种基于自监督表示学习的企业单位地址匹配方法及装置是由李莹;金路;汪陈笑;陈盼盼;邓静设计研发完成,并于2022-12-13向国家知识产权局提交的专利申请。

一种基于自监督表示学习的企业单位地址匹配方法及装置在说明书摘要公布了:本发明公开了一种基于自监督表示学习的企业单位地址匹配方法及装置,该方法首先根据具体应用场景规则制定正负样本对,同时通过无监督和有监督结合的这两种方式进行深度学习模型的训练学习。通过两种训练方式的结合,可以在少量标注样本的情况下,学习到特定场景下更具有区分度的语义表征,实现对企业单位地址的精准匹配;本发明方法主要分为三个部分:正负训练样本对的规则制定、无监督和有监督结合的模型训练方式、基于自监督表示学习对单位地址的匹配。本发明方法可在少量标注样本的情况下,学习特定场景下更具有区分度的语义表征,并且实现单位地址的精准匹配,同时在评价指标上优于近几年最先进的模型。

本发明授权一种基于自监督表示学习的企业单位地址匹配方法及装置在权利要求书中公布了:1.一种基于自监督表示学习的企业单位地址匹配方法,其特征在于,该方法包括以下步骤: (1)获取单位地址匹配场景下的地址,将地址数据标注成地址token序列的方式对其进行构造; (2)初始化正样本集合和负样本集合,在地址token长度的范围内初始化一个整数,遍历地址token序列,随机选取个位置对token进行修改,得到正负地址token样本加入到对应的集合中,将所有的地址串和对应的标签拼接,得到正样本训练集和负样本训练集; (3)构建文本匹配模型,该模型将输入的文本进行编码,获取到经过编码的字向量表征后,采用注意力模块用代表着句向量的最后时间步的隐向量和字向量进行注意力操作,得到最终加权的句向量; (4)基于正样本训练集和负样本训练集对文本匹配模型通过有监督的学习方式进行训练;然后再通过无监督的方式对文本匹配模型进行训练,反向传播优化自监督表示学习的损失函数,得到训练后的文本匹配模型; 所述无监督的学习方式利用模型中的Dropoutmask,对每一个句子进行两次前向传播,得到两个不同的embeddings向量,将同一个句子得到的向量对作为正样本对,对于每一个向量,选取其他句子产生的embeddings向量作为负样本,以此来训练文本匹配模型; 自监督表示学习的损失函数L定义如下: 其中和是平衡权重,目的是希望增加有监督表示学习样本部分的损失权重,让其在表示学习中起到主导作用;为有监督过程的对比学习损失函数,为无监督过程的对比学习损失函数; (5)基于训练好的文本匹配模型,直接将需要匹配的文本对,依次输入到文本匹配模型中获取文本的特征表达,采用相似度算法来计算文本匹配模型输出的文本特征向量的相似度,将计算出的相似度和相似度阈值比较,得到企业单位地址匹配。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江邦盛科技股份有限公司;杭州邦睿科技有限公司,其通讯地址为:310012 浙江省杭州市西湖区西斗门路3号天堂软件园D幢17层ABCD座;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。