中科讯飞互联(北京)信息科技有限公司;科大讯飞股份有限公司陈致鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中科讯飞互联(北京)信息科技有限公司;科大讯飞股份有限公司申请的专利图文联合纠错方法、装置、存储介质及计算机设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114241279B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111651496.5,技术领域涉及:G06V10/80;该发明授权图文联合纠错方法、装置、存储介质及计算机设备是由陈致鹏;崔一鸣;陈志刚设计研发完成,并于2021-12-30向国家知识产权局提交的专利申请。
本图文联合纠错方法、装置、存储介质及计算机设备在说明书摘要公布了:本申请公开一种图文联合纠错方法、装置、存储介质及计算机设备。该方法包括:获取待处理的文本数据和图像数据,文本数据包括目标文本,图像数据包括场景图片;提取文本数据的文本向量表示,文本向量表示包含目标文本的文本信息;提取图像数据的图片向量表示,图片向量表示包含场景图片的图像信息;根据文本向量表示与图片向量表示,计算包含有文本信息和图像信息的多模态向量表示;在目标文本用于表达场景图片时,根据多模态向量表示确定针对目标文本和场景图片的纠错结果,以根据纠错结果对图文进行纠错,实现了图文联合纠错,提升了纠错能力。
本发明授权图文联合纠错方法、装置、存储介质及计算机设备在权利要求书中公布了:1.一种图文联合纠错方法,其特征在于,包括: 获取待处理的文本数据和图像数据,所述文本数据包括目标文本,所述图像数据包括场景图片; 提取所述文本数据的文本向量表示,所述文本向量表示包含所述目标文本的文本信息; 提取所述图像数据的图片向量表示,所述图片向量表示包含所述场景图片的图像信息; 获取位置向量表示和类型向量表示,所述位置向量表示用于标注所述文本数据中每个词的位置,所述类型向量表示用于区分文本类型和图像类型; 根据所述文本向量表示与所述图片向量表示,计算包含有文本信息和图像信息的多模态向量表示,包括:根据所述文本向量表示、所述图片向量表示、所述位置向量表示和所述类型向量表示,基于自注意力模型计算包含文本信息和图像信息的多模态向量表示,多模态向量表示包含所述文本信息和所述图像信息之间的语义匹配关系; 在所述目标文本用于表达所述场景图片时,根据所述多模态向量表示确定针对所述目标文本和所述场景图片的纠错结果,包括:通过纠错模块中的全连接层和识别纠错方式模块,根据多模态向量表示确定纠错操作对应的纠错结果,若纠错操作为无错,则纠错结果为输出与无错的纠错操作对应的词;若纠错操作为删除操作,则纠错结果为将目标文本中与删除操作对应的词进行删除;若纠错操作为修改操作,则纠错结果为将目标文本中与修改操作对应的词改为预测词,或将场景图片中修改操作对应的图像目标改为预测图像目标; 基于语音、视频模态信息来辅助纠错。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科讯飞互联(北京)信息科技有限公司;科大讯飞股份有限公司,其通讯地址为:100193 北京市海淀区西北旺东路10号院东区5号楼三层311-2;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励