Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于多模态大语言模型的医学图像视觉问答方法,涉及人工智能与医学图像技术领域。本发明具备细粒度信息捕捉能力显著增强,通过融合视觉编码器的中层特征(如第16层)与高层特征(如第23层),有效保留医学图像的边缘、纹理等细节信息,解...
  • 本申请涉及图像分析技术领域,尤其涉及基于深度学习的阿尔茨海默症病理图像分析方法及系统。包括:通过获取患者多张脑部医疗图像并与参考图像对齐,基于目标区域的清晰度、亮度、对比度及区域占比计算权重向量,加权融合生成高质量关键图像;将关键图像划分为...
  • 本申请提供一种基于双路视觉编码的多模态视觉理解模型、训练方法、推理方法及设备,模型包括:第一视觉编码器用于提取自然通用图像的全局视觉特征并输出第一图像特征,第一视觉编码器的权重冻结;第二视觉编码器的输入为经尺寸调整至预设的高分辨率的图像,用...
  • 本申请涉及一种人物对象处理方法、装置、存储介质和程序产品。从包含待处理人物的人物图像中提取出特征向量;将位置编码向量融入至所述特征向量中,得到目标特征向量;对所述目标特征向量进行编码,得到具有上下文关系的编码特征向量;所述对目标特征向量进行...
  • 本发明公开了一种基于改进Transformer网络的遥感影像道路提取方法、系统、设备及存储介质,涉及道路提取技术领域。本发明的技术要点包括:利用基于改进Transformer网络的道路提取模型对道路遥感图像进行道路提取,其中改进Transf...
  • 本申请涉及智慧篮板技术领域,特别涉及一种智慧篮板互动方法、装置、智慧篮板、介质及程序,其中,方法包括:获取当前工作模式下采集的篮球视频;识别智慧篮板是否存在进球,若智慧篮板存在进球,则将篮球视频输入训练完成的目标神经网络模型,目标神经网络模...
  • 本发明公开了一种基于深度学习的多向倾斜钢号检测与识别方法,属于轧制自动化及钢号识别技术领域。该方法包括:采集多向倾斜的金属板材钢号图像构建粗/精定位数据集,通过改进YOLOv11模型进行两阶段训练:首先对钢号粗定位,将其从存在多个钢号的复杂...
  • 本发明涉及母线槽技术领域,且公开了一种母线槽防火预警系统,解决了现有母线槽防火预警系统探测器的位置固定,而母线槽的构造较长,导致探测器不能及时对母线槽内部的信息快速做出采集,存在探测死角的问题,其包括母线槽本体,所述母线槽本体的两侧均固定安...
  • 本发明公开了涉及智能消防技术领域的一种智能消防警报触发装置,包括安装底座、承载座、进风罩和防护罩,承载座通过螺纹与安装底座连接,且承载座设于安装底座内侧,防护罩螺纹连接于安装底座的下侧,承载座下方设置有进风罩,进风罩外侧固定安装有内齿轮,进...
  • 本发明涉及消防监控技术领域,公开了消防报警监控仪及其控制方法,消防报警监控仪包括:多个阈值温控模块、控制模块和热成像模块;多个阈值温控模块分别设置在多个预设监测区域,在检测预设监测区域的区域温度大于预设温度阈值时,输出监测信号;控制模块分别...
  • 本申请涉及一种地下停车场充电桩防撞报警装置,包括停车地框架,停车地框架的两侧安装有车身定位机构,停车地框架的内部一侧设置有间距预警机构,停车地框架的一侧固定连接有防护箱,防护箱的内部安装有控制机构,停车地框架的顶部边侧设置有定位感应机构,通...
  • 本发明公开了一种空中飞机场的智能停机方法以及系统,本发明涉及智能停机方法的技术领域,根据飞机的位置和飞行状态确定对应的停机空间,停机坪确定多层停机空间;根据各个停机空间的工作状态和多个飞机的飞行任务确定各个飞机相对于停机坪的智能停机方案,提...
  • 本发明涉及警务战术技术领域,具体公开了一种基于虚拟现实的警务战术训练系统及方法,包括配置模块,模型模块,动画模块,案例模块,关联模块,事件生成模块,决策分支模块,场景模块,训练模块;本发明通过虚拟现实开发平台和三维建模软件,创建VR模型和模...
  • 本发明涉及一种基于多模态思维链的电影人声配音方法,包括以下步骤:构建带有CoT标注的电影配音数据集;整合多语种语音库、动画数据集和多说话人数据集,训练TTS语音合成模块和V2S视频配音模块;对含有噪声和语义不清楚的数据进行去除;训练多模态视...
  • 本申请提供了一种面向智能家居的用户行为意图预测方法与系统,涉及智能家居领域,其采集用户语音控制信号并提取用户声纹特征以确定用户身份标签,同步提取用户语音控制语义特征并基于用户身份标签进行约束性表达来确定当前行为意图。接着,获取用户的历史行为...
  • 本发明提出一种基于声能衰减的多设备防误唤醒方法,包括以下步骤:S001:对麦克风拾取的语音信号进行降噪;S002:对降噪后的语音信号进行活动检测;S003:识别模型匹配唤醒词,如匹配不成功则流程结束,不唤醒,如匹配成功则进入下一步;S004...
  • 本公开实施例是关于一种语音交互方法及装置、计算机程序产品、电子设备,涉及计算机技术领域,该方法包括:响应目标用户作用于语音交互设备的交互请求,获取目标用户的查询信息;对所述查询信息进行意图识别确定意图识别结果,根据所述意图识别结果确定对所述...
  • 本申请涉及语音处理技术领域,揭示了一种基于环境噪声自适应的语音增强方法、装置及设备,其中方法包括:基于第一时间间隔,获取目标话筒中的麦克风阵列实时采集的音频,作为第一音频;根据所述第一音频提取声音特征,获得第一特征;基于方案库,根据所述麦克...
  • 本发明公开了一种自适应语音增强与分离方法及系统,首先利用毫米波信号确定说话人位置,并从特定位置处提取毫米波振动特征用以表达用户语音行为特征,随后将混合语音与毫米波振动特征输入设计的多模态深度学习网络以实现清晰的语音增强与分离。本发明无需提前...
  • 本发明涉及一种构建统一视频到人声音效模型的方法,包括以下步骤:在VGGSound数据集上训练V2A能力,使其能够输入视频,输出音效;采用条件流匹配目标函数,基于EMILIA数据集优化TTS能力;构建多任务指令集,通过混合专家机制实现不同模型...
技术分类