北京工业大学王波涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京工业大学申请的专利一种听觉代替视觉的导盲方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117064636B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310684036.5,技术领域涉及:A61F9/08;该发明授权一种听觉代替视觉的导盲方法是由王波涛;苗嘉琦;王相焜设计研发完成,并于2023-06-10向国家知识产权局提交的专利申请。
本一种听觉代替视觉的导盲方法在说明书摘要公布了:一种听觉代替视觉的导盲方法涉及电子信息领域。通过摄像头采集距离正前方3米左右的景像,同时送入图像转音乐模块进行图像到音乐的转化,首先将图像RGB空间转化到HSV空间,获取每个像素点的H、S、V的值。将H、S、V的值映射到音乐的midi格式文件的参数中,有6种映射方式,最佳映射方式为:H值赋给midi文件的音高参数,S值赋给midi文件的音量参数,V值赋给midi文件的delta‑time参数。通过得到的音乐midi文件参数值进行midi参数构造进而得到midi音乐文件。将H、S、V值与音量、音高、delta‑time参数匹配后进行映射,得到转化的音乐后,人耳听此声音,判断出正前方障碍物的有无情况,达到导盲的目的。编程实现了听觉代替视觉算法,为盲人提供价廉有效的辅助。
本发明授权一种听觉代替视觉的导盲方法在权利要求书中公布了:1.一种听觉代替视觉的导盲方法,其特征在于: ①将图像的RGB颜色空间通过公式转化成HSV颜色空间,转化公式如下: cmax=maxR',G',B' cmin=minR',G',B' Δ=cmax-cmin V=cmax 其中:H、S、V对应色调、饱和度和亮度值;R'、G'、B'是归一化后的RGB值,Cmax和Cmin分别表示归一化后R、G、B的最大值和最小值;H'表示H分量的预先计算量;Δ:表示归一化后R、G、B三个颜色通道中最大值与最小值之差; ②图像信息到音乐信息的midi格式参数的转化 将H、S、V三个图像特征映射到音乐的midi文件的三个参数:delta-time值、音高和音量中,进而将像素点转换成了midi文件中的音符;H取值范围为0~360,S取值范围为0~1,V的取值范围为0~1;音高、音量值的取值范围均为0~127,delta-time参数是任意正数值,采用一个字节的存储量即0~127,来表示delta-time参数取值范围; 图像三个分量信息向音乐三个参数信息进行映射,根据不同的映射方法,最终得到6种不同的映射声音,分别为: 1H值映射到midi文件的delta-time值,S值映射到midi文件的音高,V值映射到midi文件的音量; 2H值映射到midi文件的delta-time值,S值映射到midi文件的音量,V值映射到midi文件的音高; 3H值映射到midi文件的音高,S值映射到midi文件的delta-time值,V值映射到midi文件的音量; 4H值映射到midi文件的音高,S值映射到midi文件的音量,V值映射到midi文件的delta-time值; 5H值映射到midi文件的音量,S值映射到midi文件的音高,V值映射到midi文件的delta-time值; 6H值映射到midi文件的音量,S值映射到midi文件的delta-time值,V值映射到midi文件的音高; 具体映射方法为:将H、S、V值与音量、音高、delta-time参数进行匹配映射;其中p,t,d分别代表转化的音乐的音高、音量和delta-time值; 1H、S、V与转化的音乐的delta-time、音高、音量值进行映射: d=127360╳H,p=127╳S,t=127╳V; 2H、S、V与转化的音乐的delta-time、音量、音高值进行映射: d=127360╳H,t=127╳S,p=127╳V; 3H、S、V与转化的音乐的音高、delta-time、音量值进行映射: p=127360╳H,d=127╳S,t=127╳V; 4H、S、V与转化的音乐的音高、音量、delta-time值进行映射: p=127360╳H,t=127╳S,d=127╳V; 5H、S、V与转化的音乐的音量、音高、delta-time值进行映射: t=127360╳H,p=127╳S,d=127╳V; 6H、S、V与转化的音乐的音量、delta-time、音高值进行映射: t=127360╳H,d=127╳S,p=127╳V; ③图像到声音的转化 将图像像素点值转化成的midi文件音符进行合并,通过将相同的音高和音量的音符合并; 在音符的音高和音量相同时,选择保留时间较长的音符,而覆盖时间较短的音符;将得到的音符数据生成midi格式事件代码,再加上midi格式化的文件头和音轨头生成midi文件。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100124 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励