Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 泰华智慧产业集团股份有限公司;山东华科仁杰信息咨询有限公司米杰获国家专利权

泰华智慧产业集团股份有限公司;山东华科仁杰信息咨询有限公司米杰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉泰华智慧产业集团股份有限公司;山东华科仁杰信息咨询有限公司申请的专利一种基于大语言模型的工会经费代收信息提取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120296799B

龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510780213.9,技术领域涉及:G06F21/62;该发明授权一种基于大语言模型的工会经费代收信息提取方法及系统是由米杰;扈海波;米颖;郝敬全;付高健;徐鹏;杨明明;赵连才;袁慧设计研发完成,并于2025-06-12向国家知识产权局提交的专利申请。

一种基于大语言模型的工会经费代收信息提取方法及系统在说明书摘要公布了:本发明提供了一种基于大语言模型的工会经费代收信息提取方法及系统,属于信息提取技术领域,包括:获取经费数据文件并利用数据库工具存储,利用提取工具从经费数据文件中提取出经费文本;设计第一级提示词,将所述第一级提示词和主体信息输入至预设的大语言模型,所述大语言模型在所述第一级提示词的引导下输出所述经费文本的关键信息;大语言模型在第二级提示词的引导下输出每个经费的经费类别编码结果,能够有效分析出少缴单位和未缴单位,需要根据单位性质确定缴费周期,然后根据缴费金额、缴费日期及单位的工资总额计算应缴金额,比对分析后获取少缴单位、少缴金额和未缴单位,将名单推送给税务系统进行提醒。

本发明授权一种基于大语言模型的工会经费代收信息提取方法及系统在权利要求书中公布了:1.一种基于大语言模型的工会经费代收信息提取方法,其特征在于,包括: 获取经费数据文件并利用数据库工具存储,利用提取工具从经费数据文件中提取出经费文本;对于经费数据文件采用传递excel表的形式,在进行经费文本信息提取前,先要将excel表内文档转换成LA-DOM树结构,再根据LA-DOM树各节点的属性和其子树的统计信息进行噪声节点判断,最后实现主体信息提取; 设计第一级提示词,将所述第一级提示词和主体信息输入至预设的大语言模型,所述大语言模型在所述第一级提示词的引导下输出所述经费文本的关键信息; 对于所述经费文本的关键信息中的每个经费,设计第二级提示词,所述第二级提示词包括经费名称、对应的经费类别,将所述第二级提示词输入至所述大语言模型,所述大语言模型在所述第二级提示词的引导下输出每个经费的经费类别编码结果; 节点生成过程根据标签分类,将节点标签生成LA-DOM节点,属性标签转换为属性值;待处理的excel表内文档内容作为一个字符串传入转换程序,转换程序对字符串从头到尾进行扫描,遇到节点标签的起始标签,则生成节点,并添加到当前节点的子节点中,同时当前节点指针下移,以新生成的节点作为当前节点;当遇到节点标签的结束标签时,当前节点指针回溯,指向当前节点的父节点;当遇到属性标签时,作为节点属性,与节点标签其他属性一起添加到当前节点中; 属性栈在LA-DOM树节点生成过程中产生,在LA-DOM树建立完成时消毁,其作用是记录各层节点的属性,最后将属性赋值给文本节点,作为后续分析工作的依据;属性栈的生成规则为:遇到节点标签的起始标签,生成层次节点的同时,生成属性元素,该属性元素先复制属性栈顶属性,再将当前新的属性添加到属性元素中,最后属性元素入栈;遇到节点标签的结束标签,当前节点指针回溯时,属性栈顶元素也同时出栈;遇到文本节点时,将属性栈的栈顶元素作为属性赋值给文本节点,且不出栈;按此规律,当LA-DOM树建立完成时,所有文本节点均按层次关系被添加了属性值,且此时属性栈为空; excel表内文档转换为LA-DOM树算法流程:if起始标签{if是节点标签{生成新节点;提取标签属性,入属性栈;将该节点添加为DOM树当前节点的子树;当前节点指向新节点};elseif是属性标签{记录属性,入属性栈};else{无关标签,直接跳过};elseif是结束标签{if是节点标签{属性栈顶元素出栈;回溯查找配对开始标签;if找到匹配开始标签{标签闭合;设置为当前节点}else{多余标签,直接跳过}};else{不是节点标签,直接跳过}};else{文本信息;生成文本节点;将属性栈栈顶属性添加到文本节点;将叶节点添加为DOM树当前节点的子节点}; 在LA-DOM树的节点中增加了直接非链接子叶节点数、直接非链接子叶节点字符数、直接链接子叶节点数、直接链接子叶节点字符数、总链接子节点数、总链接子节点字符数、总非链接子节点数、总非链接子节点字符数统计信息,以这些统计信息为判断标准,进行噪声节点标记; 节点中的统计信息命名如下:DLN:直接链接子节点数;DLT:直接链接子节点字符数;DUN:直接非链接子节点数;DUT:直接非链接子节点;TLN:总链接子节点数;TLT:总链接子节点字符数;TUN:总非链接子节点数;TUT:总非链接子节点字符数; 噪声节点判断规则设计如下: 1DUN=0DUT=0当直接非链接子节点数或非链接子节点字符数为0时,即当前节点下无非链接文本节点,则判断为噪声节点; 2DLT=DUT当直接链接子节点字符数大于直接非链接字符数,则判断为噪声节点,因为在经费文本主体部分,绝大部分文本是非链接文本; 3DLN*aDUN当直接链接子节点数大于直接非链接子节点数时,则判断为噪声节点;a为调整因子; 4DLTDLNDUTDUN直接链接子节点字符数与直接链接子节点数之比大于直接非链接子节点字符数与直接非链接子节点数之比时,则判断为噪声节点; 5DUTDUNthresholdDUTDUN的值小于某阈值时,则判断为噪声。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人泰华智慧产业集团股份有限公司;山东华科仁杰信息咨询有限公司,其通讯地址为:250000 山东省济南市历下区和平路47号诚基中心22号-32号楼470;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。