Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浪潮软件科技有限公司李照川获国家专利权

浪潮软件科技有限公司李照川获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浪潮软件科技有限公司申请的专利一种基于国产化操作系统的智能体服务系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120029517B

龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510503462.3,技术领域涉及:G06F3/04883;该发明授权一种基于国产化操作系统的智能体服务系统是由李照川;林一伟;王冠军;张尧臣;林杰;王金超;张庆鑫;王珂琛设计研发完成,并于2025-04-22向国家知识产权局提交的专利申请。

一种基于国产化操作系统的智能体服务系统在说明书摘要公布了:本发明公开了一种基于国产化操作系统的智能体服务系统,属于操作系统与人工智能融合技术领域,本发明要解决的技术问题为常规智能体系统在国产化生态中存在的行为感知敏感度差、偏好变更响应滞后、决策可解释性低,采用的技术方案为:该系统是融合操作行为感知与强化学习技术,通过操作感知引擎、人类反馈强化学习中枢、MCP协议适配器以及思维链可视化设计器形成感知‑建模‑优化‑解释的完整技术闭环,实现智能体从被动执行向主动协同的范式跃迁;其中,通过操作感知引擎实时捕获并解析用户行为数据,获取操作序列数据,将操作序列数据作为特征输入到强化学习中枢,强化学习中枢输出操作指令。

本发明授权一种基于国产化操作系统的智能体服务系统在权利要求书中公布了:1.一种基于国产化操作系统的智能体服务系统,其特征在于,该系统是融合操作行为感知与强化学习技术,通过操作感知引擎、人类反馈强化学习中枢、MCP协议适配器以及思维链可视化设计器形成感知-建模-优化-解释的完整技术闭环,实现智能体从被动执行向主动协同的范式跃迁; 其中,通过操作感知引擎实时捕获并解析用户行为数据,获取操作序列数据,将操作序列数据作为特征输入到强化学习中枢,强化学习中枢输出操作指令,MCP协议适配器将强化学习中枢推荐的操作指令通过标准化的接口与不同的数据源和服务进行交互,获取操作指令对应的结果,并将外部系统的反馈传递回人类反馈强化学习中枢,不断优化人类反馈强化学习中枢的策略网络;思维链可视化设计器将人类反馈强化学习中枢复杂的决策过程和数据关系转换为直观的可视化视图,并指导人类反馈强化学习中枢的调整和优化,形成闭环优化过程; 强化学习中枢包括: 模型训练模块,用于进行行为-文件多模态联合概率模型训练; 优化引擎建立模块,用于建立双通道反馈驱动的策略优化引擎,实现行为-文件多模态联合概率模型的优化; 隐私保护与安全模块,用于利用隐私保护与安全机制实现强化学习中枢中的隐私保护; 模型训练模块工作过程具体如下: (1)对每个操作行为分别计算相应的操作频率、持续时间和路径复杂度三个维度的特征值;其中,操作频率是指统计用户在特定时间段内对每个操作行为的执行次数,反映用户对不同操作行为的使用频率;持续时间是指记录用户在每个操作行为上花费的时间,体现用户对不同操作的关注程度和投入时间的多少;路径复杂度是指分析用户在执行操作时的路径复杂程度,衡量用户操作路径的复杂性; (2)将用户的不同操作行为视为词汇,将用户的一系列操作序列视为文档,利用TF-IDF算法量化用户对不同类型操作行为的偏好权重W,具体公式如下; ; 其中,表示词汇t在文档Di中出现次数;表示文档中所有词汇的词数;N表示文档总数;表示文档是否包含词汇t,若包含为1,不包含为0; (3)利用用户对不同类型操作行为的偏好权重和三维特征值,将所有操作序列数据转化为结构化的特征向量,作为行为-文件多模态联合概率模型训练的输入; (4)通过动态贝叶斯网络计算操作行为与文件访问行为的联合概率分布,将用户在不同时间点的操作序列与文件访问行为建模为条件概率分布,捕捉操作行为与文件访问之间的因果关系; (5)将结构化的特征向量输入多层神经网络,多层神经网络输出为操作建议的概率分布,采用监督学习方法,通过历史行为数据训练行为-文件联合概率模型,构建操作序列与文件访问的时空关联,动态更新概率分布以反映用户行为的时序性和上下文依赖性; (6)通过交叉验证和指标评估验证行为-文件多模态联合概率模型性能,确保模型的泛化能力; 优化引擎建立模块的工作过程具体如下: (1)设计反馈通道,反馈通道包括显式反馈通道和隐式反馈通道;其中,显式通道通过用户界面接收用户对智能建议的星级评分,评分范围为1-5级;隐式通道通过眼动追踪记录用户在操作过程中的注视点、扫视路径和瞳孔变化,并记录用户在特定操作或界面元素上的停留时间,通过眼动和停留时长数据计算认知负荷指标;再将评分与认知负荷指标转化为数值化的反馈信号,作为强化学习的奖励函数输入; (2)结合显式和隐式反馈信号设计奖励函数,显式反馈直接作为奖励值,隐式反馈通过认知负荷指标间接影响奖励; (3)采用PPO算法计算行为-文件多模态联合概率模型策略网络的梯度更新,通过截断策略更新确保训练的稳定性;其中,PPO算法采用多目标优化,通过最小化路径熵优化用户操作路径,并通过最大化敏感操作混淆度,提高敏感操作的不可识别性,保护用户隐私。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮软件科技有限公司,其通讯地址为:250000 山东省济南市高新区浪潮路1036号浪潮科技园;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。