北京凯旋创智科技有限公司戴迎春获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京凯旋创智科技有限公司申请的专利基于人工智能的财务票据信息自动录入系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121074935B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511161750.1,技术领域涉及:G06V30/42;该发明授权基于人工智能的财务票据信息自动录入系统是由戴迎春设计研发完成,并于2025-08-19向国家知识产权局提交的专利申请。
本基于人工智能的财务票据信息自动录入系统在说明书摘要公布了:本发明属于智能票务管理领域,具体是基于人工智能的财务票据信息自动录入系统,包括票据采集模块、多尺度自适应降噪模块、智能分类模块和智能分区录入模块;本发明采用一种基于转置自注意力的特征双域自适应增强方法,提升降噪鲁棒性,针对性处理不同噪声类型,克服了单一域的局限,并在保留细节的同时恢复全局结构,增加对票据图像的降噪能力,提升文本检测效率;本发明采用一种文档智能分区方法,将异构任务统一为实例与语义分割的结合,避免模型冗余,并将类别名称映射为语义查询,支持开放集分类和零样本迁移,通过混合查询实现实例与语义查询的动态交互,增强模型对复杂文档结构的理解,实现高效地票据图像分区信息提取与录入。
本发明授权基于人工智能的财务票据信息自动录入系统在权利要求书中公布了:1.基于人工智能的财务票据信息自动录入系统,其特征在于: 包括票据采集模块、多尺度自适应降噪模块、智能分类模块和智能分区录入模块; 所述票据采集模块,包括扫描仪与图像预处理单元,所述扫描仪对财务票据进行扫描并获取票据图像,所述图像预处理单元采用U-Net分割网络去除票据图像的背景; 所述多尺度自适应降噪模块对去除背景的票据图像进行降噪得到降噪图像,包括多尺度图像构建单元、初级特征提取单元、自适应学习单元以及图像降噪单元; 在所述多尺度自适应降噪模块中,所述多尺度图像构建单元,对去除背景的票据图像进行插值操作,生成不同尺度的多尺度图像; 所述初级特征提取单元,通过卷积层对所有多尺度图像进行初级的特征提取,得到初级特征; 所述自适应学习单元,采用一种基于转置自注意力的特征双域自适应增强方法,对初级特征进行增强,得到增强特征; 在所述自适应学习单元中,一种基于转置自注意力的特征双域自适应增强方法,具体包括以下步骤: 步骤S1:对初级特征通过卷积和ReLU激活后,经快速傅里叶变换转换到频域,得到频域特征; 步骤S2:使用可学习掩码Mask分离频域特征的高频分量和低频分量; 步骤S3:对高频分量和低频分量分别进行逆傅立叶变换、多层感知机处理以及转置自注意力增强,得到高频特征和低频特征; 步骤S4:合并高频特征和低频特征得到增强频率特征,采用转置自注意力捕获增强频率特征的通道间的长程依赖,得到自适应空间频率增强特征; 步骤S5:对自适应空间频率增强特征进行门控前馈网络处理,得到增强特征; 所述图像降噪单元,将每个尺度的增强特征通过卷积生成残差图像,将所有残差图像与去除背景的票据图像相加得到降噪图像; 所述智能分类模块,包括一级分类单元与二级分类单元,所述一级分类单元对票据的降噪图像进行基础分类,将票据分为大类,包括发票、收据、合同和银行单据,所述二级分类单元,将票据的大类按照子类进行分类; 所述智能分区录入模块,采用一种基于Transformer的文档智能分区方法,对票据进行智能化分区以及信息录入; 在所述智能分区录入模块,一种基于Transformer的文档智能分区方法,具体包括以下步骤: 步骤Q1:采用Swin-Transformer提取票据的降噪图像的多尺度特征,通过FPN网络将多尺度特征融合为掩码特征; 步骤Q2:采用文字提取技术提取降噪图像所有的表头文字,使用Sentence-BERT将表头文字映射为语义向量,即语义查询,并为所有表头随机初始化可学习的实例位置嵌入参数,即实例查询; 步骤Q3:通过协同注意力机制对语义查询与实例查询进行信息交互,得到语义交互特征与实例交互特征; 步骤Q4:通过跨尺度注意力将语义交互特征以及实例交互特征分别与多尺度特征进行特征解码,得到语义细化特征与实例细化特征; 步骤Q5:将语义细化特征和实例细化特征分别与掩码特征进行矩阵乘法并激活,得到语义掩码和实例掩码; 步骤Q6:对语义细化特征与实例细化特征进行相似度计算并使用softmax函数进行归一化处理,得到类别得分,设置得分阈值,将类别得分低于阈值的实例查询进行剔除; 步骤Q7:对每个实例查询,根据其对应的实例掩码计算初始边界框; 步骤Q8:将实例查询和掩码特征进行融合,并通过全连接层预测边界框的实例位置嵌入坐标,根据实例位置嵌入坐标对初始边界框进行坐标调整,得到票据降噪图像的表格边界框分区结果; 步骤Q9:根据分区结果,采用文字识别提取模型,对分区内的信息进行分别提取与储存。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京凯旋创智科技有限公司,其通讯地址为:102600 北京市大兴区经济技术开发区西环南路18号A幢4层463室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励