Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)王敏获国家专利权

合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)王敏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)申请的专利一种基于检索增强的大语言模型策略生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119129736B

龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411078594.8,技术领域涉及:G06N5/04;该发明授权一种基于检索增强的大语言模型策略生成方法及系统是由王敏;徐炜烨;周文罡;李厚强设计研发完成,并于2024-08-07向国家知识产权局提交的专利申请。

一种基于检索增强的大语言模型策略生成方法及系统在说明书摘要公布了:本发明公开了一种基于检索增强的大语言模型策略生成方法及系统,包括如下步骤:步骤一、将多个任务组成一组,在初始轮次中,构建数据库;步骤二、将第i个任务作为当前任务,基于观测图片中的观测特征通过大语言模型得到图模型并编码,步骤三、从数据库中取出对应的宏动作序列,得到与环境交互后的宏动作,并与步骤二中对应编码后的图模型作为临时特征序列暂存;步骤四,令i=i+1,重复步骤二至步骤三,得到所有任务对应的临时特征序列,基于所有临时特征序列对数据库进行更新;该大语言模型策略生成方法建立场景交互轨迹的检索数据库,得到具有定制化决策能力的决策策略。

本发明授权一种基于检索增强的大语言模型策略生成方法及系统在权利要求书中公布了:1.一种基于检索增强的大语言模型策略生成方法,其特征在于,包括如下步骤: 步骤一、将多个任务组成一组,在初始轮次中,分别获取多个任务下智能体与环境交互得到的轨迹数据,从轨迹数据中分离出不同的结构数据系列,所述结构数据系列包括观测序列和宏动作序列,将每个任务的观测序列组织成一个图模型,对每个图模型进行编码得到固定长度的特征向量并与宏动作序列一起储存到数据库中; 步骤二、将第i个任务作为当前任务,在当前轮次中,获取当前任务下环境给予的观测图片,所述观测图片包括观测特征和动作特征,将观测特征转化为标签文本并编码为查询特征向量,将查询特征向量和数据库中所有的特征向量进行余弦相似度匹配并降序排列,从数据库中取排在前k个相似度对应的特征向量,并将所取出的特征向量输入到大语言模型的prompt中,输出所取出特征向量对应的图模型并编码,i∈[1,N],N为一组中任务的总数量; 步骤三、将所取出的特征向量对应的宏动作序列从数据库中取出,大语言模型以设定提示词以及所选出的宏动作序列作为索引从设定的宏动作库中选择其中一个宏动作,将所选宏动作按照事先设定原则转换成执行的微动作并依次输入给环境以进行交互,将交互后的宏动作与步骤二中对应编码后的图模型作为临时特征序列暂存; 步骤四,令i=i+1,重复步骤二至步骤三,得到所有任务对应的临时特征序列,基于所有临时特征序列对数据库进行更新; 步骤五、将更新后的数据库作为下一组多任务下智能体与环境交互的数据库,迭代步骤二至步骤四,直至数据库最终迭代更新完成。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室),其通讯地址为:230000 安徽省合肥市高新区望江西路5089号,中国科学技术大学先进技术研究院未来中心B1205-B1208;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。