浪潮云信息技术股份公司王功明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮云信息技术股份公司申请的专利一种面向地址识别的状态转移字典树创建方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116303849B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310094247.3,技术领域涉及:G06F16/29;该发明授权一种面向地址识别的状态转移字典树创建方法及装置是由王功明;魏金雷;赵志航;潘心冰设计研发完成,并于2023-02-07向国家知识产权局提交的专利申请。
本一种面向地址识别的状态转移字典树创建方法及装置在说明书摘要公布了:本发明公开了一种面向地址识别的状态转移字典树创建方法及装置,属于数据处理及地址识别技术领域,该方法的实现方式如下:S1、创建地址词典库,将所有地址信息保存在词典库中;S2、根据地址词典库生成状态转移字典树,生成的字典树与地址词典库相对应;S3、根据状态转移字典树查找地址信息:根据匹配的地址名称状态值获取其在地址词典库中的地址信息。本发明能够提高地址识别速度、减少存储空间,同时能够建立地址词典库和状态转移字典树的关联,通过匹配结果确定对应地址信息,有助于后继处理和分析。
本发明授权一种面向地址识别的状态转移字典树创建方法及装置在权利要求书中公布了:1.一种面向地址识别的状态转移字典树创建方法,其特征在于,该方法的实现方式如下: S1、创建地址词典库,将所有地址信息保存在词典库中; S2、根据地址词典库生成状态转移字典树,生成的字典树与地址词典库相对应;生成方式如下: S21:字典树初始化为空; S22:对地址名称列表进行字典序排列; S23:根据排序结果逐层生成字典树:根据地址名称中相邻字符间的父子关系逐层生成字典树; S24:修改地址名称对应的状态值:修改地址名称在字典树中对应结点的状态值,用于检索其在地址词典库中的地址信息; S25:返回所生成的字典树; S3、根据状态转移字典树查找地址信息:根据所匹配的地址名称状态值获取其在地址词典库中的地址信息; 所述地址词典库包括: 地址名称映射表:用于建立从地址名称到地址信息集合的映射关系,由于不同地址名称存在重名现象,所以单个地址名称对应的地址信息集合可包含多条地址信息; 地址名称列表:由所有地址名称构成的列表; 地址编码映射表:用于建立从地址编码到地址信息的映射关系,由于地址编码存在唯一性,所以地址编码和地址信息是一一映射关系; 所述根据排序结果逐层生成字典树,用locWords表示按照字典序排列后的地址名称列表,I是该列表中的地址名称个数,L是地址名称的最大长度,用locWords[i]表示第i个地址名称,1≤i≤I,用locWords[i][j]表示该地址名称的第j个字符,用locWords[i][1..j]表示该地址名称前j个字符构成的子串,locWords[i][0]=locWords[i][1..0]="";设字典树根结点的层数为0,则字典树的最大层数是地址名称的最大长度L;将地址名称的前缀子串视为状态,地址名称中的字符视为变量,用state表示状态数组,用s和t表示状态在state中的下标,用c表示变量的编号,用base[s]表示下标s对应的状态,用check[t]表示状态base[t]对应的前驱状态,满足:base[s]+c=t、check[t]=s; 则所述步骤S23具体包括: S231:初始化数组base和check的元素均为0,层数j=1; S232:按照i从1递增的顺序逐个访问前缀子串locWords[i][1..1],合并重复的前缀子串后,得到字典树中根结点的孩子状态,即字典树第1层的状态,按序存放在状态数组state中; S233:如果j+1≤L,那么转步骤S234,否则转步骤S23B; S234:i=1; S235:得到计算父子关系时待处理的前缀子串个数p:locWords[i-1][1..j]!=locWords[i][1..j],locWords[i][1..j]=locWords[i+p-1][1..j],locWords[i][1..j]!=locWords[i+p][1..j]; S236:合并p个前缀子串locWords[k][1..j+1]的重复项,得到q个前缀子串,它们是locWords[i][1..j]在字典树对应结点的孩子状态,i≤k≤i+p-1,q≤p; S237:根据父子关系更新数组base,check和state:根据locWords[k][1..j]和locWords[k][1..j+1]在字典树对应结点的父子关系更新数组base,check和state,i≤k≤i+p-1; S238:更新地址名称序号i=i+p; S239:如果i≤I,那么转步骤S235,否则转步骤S23A; S23A:更新层数j=j+1,转步骤S233; S23B:返回所生成的数组base,check和state; 所述修改地址名称对应的状态值,用locWords表示按照字典序排列后的地址名称列表,I是该列表中的地址名称个数,用locWords[i]表示第i个地址名称,用si表示locWords[i]在state中对应状态的下标,满足:1≤i≤I; 则所述步骤S24具体包括: S241:初始化i=1; S242:获取locWords[i]在state中对应状态的下标si; S243:修改状态值base[si]=-i; S244:i=i+1; S245:如果i≤I,那么转步骤S242,否则转步骤S246; S246:返回修改后的数组base; 所述根据状态转移字典树查找地址信息,用addrName表示所匹配的地址名称,用sa表示其在state中对应状态的下标,用addrNameNum表示其地址名称编号,用addrInfoSet表示其对应的地址信息集合,该集合中的元素表示为addrInfo,用LocWords表示按照字典序排列后的地址名称列表,用locationWordMap表示地址名称映射表; 则所述步骤S3具体包括: S31:获取addrName在state中对应状态的下标sa; S32:计算地址名称编号addrNameNum=base[sa]*-1; S33:获取地址信息集合addrInfoSet=locationWordMap[locWords[addrNameNum]]; S34:访问addrInfoSet中的地址信息addrInfo。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮云信息技术股份公司,其通讯地址为:250100 山东省济南市高新区浪潮路1036号浪潮科技园S01号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励