Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 平安科技(深圳)有限公司吴育人获国家专利权

平安科技(深圳)有限公司吴育人获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉平安科技(深圳)有限公司申请的专利一种结合有监督和无监督方式的文本分类方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116719938B

龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310723677.7,技术领域涉及:G06F16/353;该发明授权一种结合有监督和无监督方式的文本分类方法及相关装置是由吴育人;庄伯金设计研发完成,并于2023-06-16向国家知识产权局提交的专利申请。

一种结合有监督和无监督方式的文本分类方法及相关装置在说明书摘要公布了:本发明公开了一种结合有监督和无监督方式的文本分类方法及相关装置,通过attention的方法,利用每个样本向量与所有类向量之间的距离,反向更新样本向量,并基于更新后的样本向量,重新计算类向量。本发明将Bert模型作为backbone,同时将Bert模型预测得到的分类结果作为一个粗略的结果,用于后续的优化。本发明将无监督学习的思想与有监督学习的场景进行了有效得融合,从而大大降低了分类任务对有标签训练数据的依赖。得益于Attention方法的引入,句向量得以在Bert模型之后持续迭代更新,同时由于这种更新考虑了与其他所有可能的类别之间的关系,最终使得原本离类中心更近的句向量将更加靠近,而离最近类中心稍远的句向量,将得到修正。

本发明授权一种结合有监督和无监督方式的文本分类方法及相关装置在权利要求书中公布了:1.一种结合有监督和无监督方式的文本分类方法,其特征在于,包括以下步骤; 将待分类的文本信息输入Bert模型,得到若干分类结果; 提取Bert模型输出层的句向量CLS得到若干句向量,或聚合Bert模型输出层的所有字向量得到若干句向量,所述聚合是采用加和、平均或池化方法得到句向量,其中表示句子数,同时每个句向量对应的类别记为; 根据分类结果,对同一类别的句向量求均值,得到类别向量; 将所有句向量与所有类别向量做关联,并对类别向量进行加权求和处理得到新的句向量; 依次计算每一个新的句向量与对应的类别向量之间的距离,输出距离最短的类别作为新类别; 重复计算新的句向量,并输出距离最短的类别,直至每个句子的类别不再发生变化; 所述将所有句向量与所有类别向量做关联,并对类别向量进行加权求和处理得到新的句向量,包括: 对同一类别的句向量求均值,得到类别向量,整合得到矩阵B; 将每一个句向量与所有类别向量做attention,并将类别向量进行加权求和得到新的句向量: 其中,表示B的权重,表示,为正整数,表示某种注意力打分机制,并将替换为。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。