北京百度网讯科技有限公司宋永浩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京百度网讯科技有限公司申请的专利提取实体的方法、装置、设备、介质和产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114722800B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210346916.7,技术领域涉及:G06F40/279;该发明授权提取实体的方法、装置、设备、介质和产品是由宋永浩;熊蜀光;居恒哲;裴肖龙设计研发完成,并于2022-04-02向国家知识产权局提交的专利申请。
本提取实体的方法、装置、设备、介质和产品在说明书摘要公布了:本公开提供了提取实体的方法、装置、设备、介质和产品,涉及计算机技术领域,尤其涉及自然语言处理中的信息提取技术。具体实现方案为:接收待识别的文本,所述文本中包括有插入噪声字符的目标原始实体;选择与所述目标原始实体对应的形式化规则和噪声字符插入规则;根据所述形式化规则和所述噪声字符插入规则遍历所述文本,筛选用于拼接目标实体的字符,并将所述字符拼接成的字符串作为从所述文本中提取的目标实体。本公开通过噪声字符插入规则,以及根据目标实体构建的形式化规则,对文本进行遍历,将目标实体内部及上下文插入噪声字符的字符串逐步拼接为目标字符,以实现从文本中提取插入噪声字符的目标实体。
本发明授权提取实体的方法、装置、设备、介质和产品在权利要求书中公布了:1.一种提取实体的方法,包括: 接收待识别的文本,所述文本中包括有插入噪声字符的目标原始实体; 选择与所述目标原始实体对应的形式化规则和噪声字符插入规则; 根据所述形式化规则和所述噪声字符插入规则遍历所述文本,筛选用于拼接目标实体的字符,并将所述字符拼接成的字符串作为从所述文本中提取的目标实体;包括: 遍历所述文本中的字符,确定当前字符的类型,以及目标实体变量的目标实体字符串长度,所述目标实体变量用于存储筛选出用于拼接目标实体的字符; 若所述当前字符的类型与所述目标实体的目标类型匹配,则根据所述目标实体字符串长度和所述形式化规则,将所述当前字符存储到所述目标实体变量或初始化目标变量,继续遍历下一个字符; 若所述当前字符的类型与所述目标实体的目标类型不匹配,则更新用于记录噪声字符数量的噪声字符变量,并基于更新后噪声字符变量和所述实体字符串长度,初始化目标变量或将所述目标实体变量中存储的字符拼接成表征目标实体的字符串并存储到目标实体列表,所述目标变量包括目标实体变量和噪声字符变量,继续遍历下一个字符; 直到遍历完所述文本中的字符,将存储在所述目标实体列表中的目标实体,作为从所述文本中提取到的目标实体。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦2层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励