中用科技有限公司江大白获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中用科技有限公司申请的专利减少NLP中基于语料库偏见自我诊断和除偏方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116451687B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310234185.1,技术领域涉及:G06F40/289;该发明授权减少NLP中基于语料库偏见自我诊断和除偏方法及系统是由江大白;胡增;汪刚设计研发完成,并于2023-03-07向国家知识产权局提交的专利申请。
本减少NLP中基于语料库偏见自我诊断和除偏方法及系统在说明书摘要公布了:本发明公开了减少NLP中基于语料库偏见自我诊断和除偏方法及系统,减少NLP中基于语料库偏见自我诊断和除偏方法包括以下步骤:获取偏见的文本描述;基于语言模型的内部知识以及偏见的文本描述对语言模型进行自我诊断;基于预设的自我除偏算法对语言模型进行自我除偏。本发明能够证明语言模型,尤其是大型语言模型,具有自我诊断的能力,基于这种能力,可以构建简单方法,通过模型输出、自我诊断及删除不期望出现情况的方法降低模型输出不当语言的概率。
本发明授权减少NLP中基于语料库偏见自我诊断和除偏方法及系统在权利要求书中公布了:1.减少NLP中基于语料库偏见自我诊断和除偏方法,其特征在于,该方法包括以下步骤: S1、获取偏见的文本描述; S2、基于语言模型的内部知识以及偏见的文本描述对语言模型进行自我诊断; S3、基于预设的自我除偏算法对语言模型进行自我除偏; 所述基于语言模型的内部知识以及偏见的文本描述对语言模型进行自我诊断包括以下步骤: S21、定义语言模型M和词语序列w1,...wk; S22、定义在输入为词语序列w1,...wk时,语言模型输出下一个词语是ω的概率表示为pMω|ω1,...ωk,将概率最大的单词作为语言模型M的输出; S23、基于语言模型M生成的语句x和属性描述y,构建自我诊断输入sdgx,y; 其中,自我诊断输入sdgx,y构建方法为针对语言模型M生成的语句x,对语言模型M进行提问,要求语言模型M利用模型内部知识回答输入的语句x中是否含有属性y; S24、通过预设的概率计算公式计算语句x表现出属性y的概率; 所述基于预设的自我除偏算法对语言模型进行自我除偏包括以下步骤: S31、基于预设的自我除偏算法,构建输入x对应的自除偏输入sdbx,y; S32、将原始输入x以及自除偏输入sdbx,y输入语言模型M中,语言模型M计算输出标记单词的概率分布,得到pMω|x和pMω|sdbx,y; S33、将原始输入x对应的概率分布pMω|x和自除偏输入sdbx,y的概率分布pMω|sdbx,y输入算法中,通过计算得到新的概率分布; S34、基于计算得到新的概率分布pMω|x,通过比较标记单词对应概率大小,输出最大概率对应的标记单词; 其中,通过要求语言模型M在输入文本局域x基础上生成的延续包含属性y,构建自除偏输入sdbx,y。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中用科技有限公司,其通讯地址为:230601 安徽省合肥市经济开发区宿松路3963号智能装备科技园E栋12层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。