江西师范大学彭香龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江西师范大学申请的专利基于信息增益与层次分类的中文文本可读性评估方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119293238B 。
龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411787057.0,技术领域涉及:G06F16/35;该发明授权基于信息增益与层次分类的中文文本可读性评估方法是由彭香龙;曾锦山;叶文俊;刘谦毅;肖文艳设计研发完成,并于2024-12-06向国家知识产权局提交的专利申请。
本基于信息增益与层次分类的中文文本可读性评估方法在说明书摘要公布了:本发明属于自然语言处理技术领域,公开了基于信息增益与层次分类的中文文本可读性评估方法,本方法的可读性评估模型,包括语言特征表示模块、信息增益引导的深度表示模块和层次分类模块;其中,语言特征表示模块用于提取语言特征并采用自然语言描述的方式将这些特征映射到深度语义空间,得到相应的语言特征表示;信息增益引导的深度表示模块利用信息增益原理根据不同编码层蕴含信息的差异性,融合多个编码层的表示来充分挖掘文本的深度表示;层次分类模块建模为层次树结构,通过捕获层次结构信息,从而学习不同可读性难度类别之间的相互关系。本发明融合多个编码层的表示来充分挖掘文本的深度表示,并能学习不同可读性难度类别之间的相互关系。
本发明授权基于信息增益与层次分类的中文文本可读性评估方法在权利要求书中公布了:1.基于信息增益与层次分类的中文文本可读性评估方法,其特征在于:包括:本方法建立基于信息增益和层次分类的可读性评估模型,包括语言特征表示模块、信息增益引导的深度表示模块和层次分类模块;其中,语言特征表示模块用于提取语言特征并采用自然语言描述的方式将这些特征映射到深度语义空间,得到相应的语言特征表示;信息增益引导的深度表示模块以包含语义信息的编码输出层作为锚定层,利用信息增益原理根据不同编码层蕴含信息的差异性,融合多个编码层的表示来充分挖掘文本的深度表示;层次分类模块建模为层次树结构,通过捕获层次结构信息,从而学习不同可读性难度类别之间的相互关系; 信息增益引导的深度表示模块中,首先将文本分为若干段落块,之后一同输入到预训练模型中,产生各自的编码表示,使用块间残差Transformer模块对这些段落块的编码表示进行融合,得到编码层中所有段落块的特征表示;深度表示模块选择对最后一层编码层进 行单独的分类评估任务,计算该层单独的信息熵;将之前的各个编码层的深度表示依次与最后一层编码层的深度表示拼接,各自进行分类评估任务,计算各个编码层与最后一层编码层融合得到的条件熵,将信息熵和条件熵作为特征提取损失的损失函数;本方法令所有增益系数组成增益系数向量,而将各层的自适应权重组成权重向量;计算增益系数向量与权重向量之间的KL散度作为引导损失,信息增益引导的深度表示模块由特征提取损失和引导损失共同训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江西师范大学,其通讯地址为:330000 江西省南昌市紫阳大道99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。