Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 惠每数科(北京)医疗科技有限公司文栋获国家专利权

惠每数科(北京)医疗科技有限公司文栋获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉惠每数科(北京)医疗科技有限公司申请的专利一种多模态数据中特定人名及单位名属性的提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115410185B

龙图腾网通过国家知识产权局官网在2026-01-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211031517.8,技术领域涉及:G06V20/62;该发明授权一种多模态数据中特定人名及单位名属性的提取方法是由文栋;谢燮;张新燕设计研发完成,并于2022-08-26向国家知识产权局提交的专利申请。

一种多模态数据中特定人名及单位名属性的提取方法在说明书摘要公布了:本发明提供的一种多模态数据中特定人名及单位名属性的提取方法包括:获取原始数据文件;采用图像文字识别方法识别所述原始数据文件中的图像中的文本;将图像文字识别文本框转为文本序列,获得图片识别的纯文本结果;从所述纯文本结果中筛选目标信息的数据,获得目标文本;从所述目标文本中识别文本里的人名结果和单位名实体;对所述人名结果增强处理,获得增强人名结果;根据所述增强人名结果对人物单位进行匹配。通过分析数据内部关键信息间的逻辑关联,逐步把满足所有逻辑关系约束的目标结果状态识别出来,通过识别人物及单位的例子具体说明这一算法范式的操作细节。

本发明授权一种多模态数据中特定人名及单位名属性的提取方法在权利要求书中公布了:1.一种多模态数据中特定人名及单位名属性的提取方法,其特征在于,所述提取方法包括: 获取原始数据文件; 采用图像文字识别方法识别所述原始数据文件中的图像中的文本; 将图像文字识别文本框转为文本序列,获得图片识别的纯文本结果,包括: 将图像文字识别文本框转为文本序列; 微调对齐文本框位置,对所有文本框,计算左上左下角横坐标均值并替换原始值,计算右上右下角横坐标均值并替换原始值,计算左上右上纵坐标均值并替换原始值,计算左下右下纵坐标均值并替换原始值; 对所有文本框按左上角横坐标排序,对相邻文本框,如果左边界距离不超过某一阈值,则归为一组,否则归为不同组,最后同组文本框左边界取均值并替换原始值; 对右边界、上边界、下边界进行同样的操作; 保证所有文本框均为相对平行的长方形,且相近文本框的边界位置对齐; 将文本框顺序恢复为原本从左到右从上到下的顺序; 基于左上角纵坐标对所有文本框排序,计算相邻文本框间上下边界距离,取没有重叠关系的文本框距离的上四分位数作为间隔阈值,按所述间隔阈值对所有文本框在垂直方向上分组; 再对每个垂直分组,用同样的方法得到组内水平方向分组,将小水平分组里包含所有文本框的最小方框作为新的合并文本框,分别计算四个方向上最外位置所包围的方框; 对每个合并方框内文本框按从左到右从上到下恢复顺序后,拼接合并方框内文本;合并文本时需判断相邻两句话可以直接拼接还是需要加入标点符号,在中文维基百科数据上训练统计语言模型后,分别计算五组条件概率:前一条文本加结尾符s1,前一条文本加标点符号s2,前一条文本加后一条文本的第一个字s3,起始符加后一条文本s4,前一条文本的最后一个字加后一条文本s5,如果s3s1且s2s1或s5s4,说明两条文本连贯的可能性大于拆分的可能性,则直接拼接,否则通过连接符拼接; 对得到的合并重排过的结果,按纵向大分区和横向小分组,分别用不同的连接符拼接文本,得到图片识别到的纯文本结果,存档并保留识别结果文件与原始图像文字识别结果文件的对应关系; 从所述纯文本结果中筛选目标信息的数据,获得目标文本; 从所述目标文本中识别文本里的人名结果和单位名实体; 对所述人名结果增强处理,获得增强人名结果; 根据所述增强人名结果对人物单位进行匹配。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人惠每数科(北京)医疗科技有限公司,其通讯地址为:100000 北京市东城区永外东革新里42号商业一层1066-8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。