上海理想信息产业(集团)有限公司李铮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海理想信息产业(集团)有限公司申请的专利一种基于意图识别的语义拆分信息提取的实现方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115062625B 。
龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210731813.2,技术领域涉及:G06F40/30;该发明授权一种基于意图识别的语义拆分信息提取的实现方法是由李铮;代晓菊;孙海;蒋润青;邵琳钰设计研发完成,并于2022-06-26向国家知识产权局提交的专利申请。
本一种基于意图识别的语义拆分信息提取的实现方法在说明书摘要公布了:本发明涉及智能客服及自然语言处理技术领域,且公开了一种基于意图识别的语义拆分信息提取的实现方法,包括以下步骤:S1:分词与词性标注,在自动填单文本输入的过程中输入长文本S,并对输入长文本S进行分词与词性标注,得到标注序列T;S2:业务要素识别,根据预设的业务要素规则,基于语义序列匹配算法对标注对象进行业务要素识别,生成新序列E;S3:定位意图边界,识别序列E中出现的主谓宾结构,定位意图边界。本发明采用了基于意图的业务内容提取方法,能够准确地将业务动作与业务对象相关联,尤其适合处理包含了多种业务场景的长文本,在处理复合业务的场景时能够划分不同的意图区域,每个场景都能保证自身的准确性。
本发明授权一种基于意图识别的语义拆分信息提取的实现方法在权利要求书中公布了:1.一种基于意图识别的语义拆分信息提取的实现方法,其特征在于,包括以下步骤: S1:分词与词性标注,在自动填单文本输入的过程中输入长文本S,并对输入长文本S进行分词与词性标注,得到标注序列T{t1,t2…tn}; S2:业务要素识别,根据预设的业务要素规则,基于语义序列匹配算法对标注对象进行业务要素识别,生成新序列E{e1,e2,…en}; S3:定位意图边界,识别序列E中出现的主谓宾结构,定位意图边界; S4:文本切分,根据意图边界,将文本切分为短句集合P; S5:识别业务场景,根据预设的业务场景特征规则,识别集合P中分句关联的业务场景,得到业务场景集合以及每个业务场景和短句的关联; S6:生成工单,根据预设的业务场景字段规则,从当前业务场景关联的短句中,提取有效的业务要素填充到对应工单字段中,为每个业务场景生成工单; 所述S2中预设的业务要素规则组成形式为词性、文本、逻辑运算符、推理运算符构成的正则序列,如果标注序列中的某段子序列满足规则条件,则进行业务要素转换;所有的规则条目会按照优先级顺序依次检查,从而完成要素识别; 所述S2中在规则的组成序列中,三种类型的规则元素所代表的含义包括:词性或文本型、逻辑运算符型、逻辑推理型,词性或文本型为直接比对标注对象的文本或词性,逻辑运算符型用来描述规则元素之间的联系,相邻的距离限制、顺序等价性、逻辑的是、否、与、或操作、通配符,逻辑推理型中表示如规则带有逻辑推理,则需要最后将标注序列作为参数,输入到规则对应的知识推理机中进行实体识别; 所述S2中在运行时还包括如下步骤: S201,每条规则从标注序列T的每一个元素tx作为起点,进行连续子序列遍历检查; S202,对规则序列中的每个规则对象,检查子序列中对应标注对象是否满足要求,规则对象中的词性和文本类对象直接进行比对判断是否满足,如果规则带有逻辑推理,则需要额外进行推理运算; S203,如果规则不满足,则以tx+1为起点子序列开始,重新进行规则序列检查; S204,如果所有规则对象都满足要求,则当前规则检查通过,将子序列[tx~tx+k]从原始序列中移除,在原子序列起点插入一个新的标注对象ex,标注对象的标签为规则对象的标签,标注对象的文本为子序列的对象文本拼接;如果规则对象包含推理,则使用推理结果作为ex的文本; S205,规则满足,则从tx+k+1为起点,重复S203的步骤,如果tx+k+1到tn的子序列长度小于规则长度,则当前规则检查结束,从规则列表中读取下一条规则重复S201步骤,直到完成所有规则的检查。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海理想信息产业(集团)有限公司,其通讯地址为:201315 上海市浦东新区秀沿西路189号电信信息园区B4楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励