云袭网络技术河北有限公司段海卿获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉云袭网络技术河北有限公司申请的专利一种基于场景感知的智能字幕生成方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120881222B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511366907.4,技术领域涉及:H04N5/278;该发明授权一种基于场景感知的智能字幕生成方法和系统是由段海卿;孟海彬;丁士鹏设计研发完成,并于2025-09-24向国家知识产权局提交的专利申请。
本一种基于场景感知的智能字幕生成方法和系统在说明书摘要公布了:本发明涉及一种基于场景感知的智能字幕生成方法和系统,通过动态提取视频的实时视觉特征并解析音频流,融合多模态信息建立智能决策模型,以实现字幕的生成与呈现与画面内容和语义上下文的深度协同,依据场景切换、人物动作、关键物体及画面焦点区域的变化,智能决策字幕触发的时机与位置,并采用避让算法确保字幕不会遮挡关键视觉元素,集成语音情感分析,据此动态调整字幕的字体颜色、描边及透明度等视觉特效,从而在准确传达语义信息的基础上,增强情感表现力与视觉舒适度。本发明有效解决了传统字幕生成技术中存在的视听信息割裂、遮挡画面、样式单一及缺乏情感适配等问题,显著提升了用户在各类视频观看场景中的综合体验。
本发明授权一种基于场景感知的智能字幕生成方法和系统在权利要求书中公布了:1.一种基于场景感知的智能字幕生成方法,其特征在于,包括: S1,动态提取待生成字幕视频的实时视觉特征,包括场景切换帧、人物动作幅度变化值、关键物体出现坐标及画面焦点区域坐标; S2,解析所述待生成字幕视频的音频流,识别语音停顿点并分割语义单元,同时提取语音情感倾向值; S3,建立多模态决策模型,融合所述实时视觉特征与语义单元生成动态字幕触发策略,当检测到画面焦点区域稳定持续预设时长且动作幅度变化值小于预设阈值时,激活字幕显示,在语音停顿点处执行智能断句,并关联当前画面中的关键物体坐标; S4,根据所述当前画面的说话者人脸坐标或关键物体中心坐标,动态计算字幕显示区域,采用避让算法使字幕避开画面焦点区域,当所述说话者位于画面侧边时,启动眼神矫正定位模式,将字幕置于人物视线延长线区域; S5,实时提取所述字幕的显示区域的背景主色调,通过色彩对比度优化算法自动调整字幕字体颜色及描边颜色,确保对比度符合预设要求; S6,根据语义情感倾向值动态调整字体特效,对积极情感采用渐变色渲染,消极情感增加透明度补偿。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人云袭网络技术河北有限公司,其通讯地址为:050022 河北省石家庄市裕华区怀特商业广场D座5层5002室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励