天津城建大学陈昊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津城建大学申请的专利一种基于OCR技术的会议纪要自动生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120337862B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510820674.4,技术领域涉及:G06F40/109;该发明授权一种基于OCR技术的会议纪要自动生成方法及系统是由陈昊;何力彦;张慧设计研发完成,并于2025-06-19向国家知识产权局提交的专利申请。
本一种基于OCR技术的会议纪要自动生成方法及系统在说明书摘要公布了:本发明公开了一种基于OCR技术的会议纪要自动生成方法及系统。主要技术手段:通过多视角摄像机与麦克风阵列采集多模态数据,运用PaddleOCR、语音识别和CNN‑LSTM网络检测手势,经多模态时间同步、动态权重分配模型融合数据,按自定义语义模板结构化输出,部署于边缘计算设备,具备实时纠错、领域自适应、智能分发等功能。可实现会议信息全面准确采集与实时处理,提升纪要生成效率与规范性,增强系统适应性和可靠性,实现会议信息闭环自动化管理。
本发明授权一种基于OCR技术的会议纪要自动生成方法及系统在权利要求书中公布了:1.一种基于OCR技术的会议纪要自动生成方法,其特征在于,包括以下步骤: 通过部署于会场的多视角摄像机与麦克风阵列,同步采集包含白板内容、投影画面、演讲者手势的视觉图像流及环绕音频流; 对所述视觉图像流依次进行PaddleOCR文字检测、识别及版面分析,获取结构化文本数据;对所述环绕音频流进行端到端语音识别及实体关系抽取,生成带时间戳的语音文本;手势动作检测步骤:通过CNN-LSTM网络模型对演讲者手势进行实时检测,标记重点内容对应的手势动作类型及时间节点; 多模态数据处理:基于多模态时间同步算法对齐视觉文本、语音文本及手势标记数据,采用注意力机制构建动态权重分配模型,设为注意力权重,为OCR识别的文本嵌入向量,为标准语音文本嵌入向量;为嵌入维度,对应公式为:,其中是权重矩阵,是偏置项,是sigmoid函数,再根据手势动作类型自动调整对应时段OCR文本与语音文本的融合优先级,设是融合后的文本表示,计算公式为:; 按照预定义的结构化语义模板,将融合后的多模态数据自动填充至议题分类、决策事项和行动项列表结构化字段,生成包含重点标注的会议纪要文档; 所述动态权重分配模型的构建方法包括: 当检测到"圈选"或"指向"手势时,将对应区域OCR文本的权重系数提升至语音文本的设置倍数; 当检测到"擦除"手势时,触发对应时段数据的过滤机制; 权重系数通过会议历史数据训练的强化学习模型动态调整; 还设置有实时错误纠正机制: 对OCR识别结果进行上下文语义校验,通过BERT模型检测文本连贯性,设句子,取BERT输出的CLStoken向量作为句向量,余弦相似度计算公式:,对置信度小于设置值的识别结果触发二次识别,计算公式:,其中为调整斜率的超参数; 其中,为待校验的OCR识别句子,为上下文参考句子,为句子的语义向量,为句子的语义向量; 对语音识别结果进行讲话人分离处理,结合会议室座位布局信息修正跨说话人转录错误。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津城建大学,其通讯地址为:300380 天津市西青区津静路26号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励