东南大学杨鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种基于无监督学习的用户攻击性评论风格转换方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115544245B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210390821.5,技术领域涉及:G06F16/353;该发明授权一种基于无监督学习的用户攻击性评论风格转换方法是由杨鹏;赵翰林;冷俊成;陈维威设计研发完成,并于2022-04-14向国家知识产权局提交的专利申请。
本一种基于无监督学习的用户攻击性评论风格转换方法在说明书摘要公布了:本发明公开了一种基于无监督学习的用户攻击性评论风格转换方法,该方法首先利用双向编码注意力机制对输入评论文本进行编码,所涉及的双向编码用来捕捉文本序列的上下文信息,所涉及的注意力机制用来保留文本的核心信息;其次,本发明通过使用生成器‑鉴别器进行对抗训练,解决非并行语料库中特定关键词匮乏问题;最后,本发明通过循环强化学习构造重构损失算法,确保攻击性评论转换后风格标签的准确性、文本内容的完整性和可读性。本发明可以有效解决攻击性评论风格转换中存在的语义丢失、并行语料缺乏以及内容保留程度较低等问题。
本发明授权一种基于无监督学习的用户攻击性评论风格转换方法在权利要求书中公布了:1.一种基于无监督学习的用户攻击性评论风格转换方法,其特征在于,所述方法包括以下步骤: 步骤1,使用双向编码注意力机制获得高保留语义编码; 步骤2,使用生成器‑鉴别器模块进行模型对抗训练,步骤3,循环强化学习构造重构损失; 其中,步骤1具体如下,原始文本在输入层会被转为计算机理解的向量化表示,假设社交媒体中非攻击性文本数据集为其中m为非攻击性文本数据集X0的大小;攻击性文本为其中n为X1的大小;对应地,文本的风格标签为{S0,S1},攻击性文本风格转换的数据集为其中表示风格标签为Si的第k个句子,N=m+n为数据集的总大小,i∈{0,1}分别表示风格标签为非攻击性和攻击性,对原始文本进行基于注意力机制的双向编码,该步骤实施过程分为2个子步骤: 子步骤1‑1,使用双向门循环单元BiGRU捕捉文本序列的上下文信息,BiGRU当前时刻t的隐层状态由当前的输入xt,上一时刻t‑1的前向隐层状态输出和后向隐层状态输出三个部分共同决定,因此,BiGRU编码层在t时刻的隐层状态输出可由前向隐层状态和后向隐层状态加权求和得到: 其中,GRU函数表示对输入的词向量的非线性变换,把词向量编码成对应的GRU隐层状态,wt和vt分别表示t时刻双向GRU所对应的前向隐层状态和后向隐层状态所对应的权重,bt表示t时刻隐层状态对应的偏置量,UCST‑UL模型将一个句子及其风格标签Si作为双向编码器的输入,经过BiGRU从前向和后向对句子进行编码后,得到更深层次的上下文之间的语义关系特征,从BiGRU获得了一个隐层状态序列子步骤1‑2,注意力机制的输入为双向编码器中经过BiGRU神经网络激活处理的输出向量对于当前时刻t某位置输入与输出之间的关联性,写成相应的向量形式且加权点乘后为: 对ekt进行softmax操作将其正则化得到注意力的分布为: 利用注意力分布αk进行加权求和可以得到经过注意力机制后的隐层向量,即: 其中,W1表示权重系数,bw为偏置量;W2表示随机初始化的注意力矩阵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励