北京邮电大学陈勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京邮电大学申请的专利一种面向虚拟数字人交互的基于文本片段的主题挖掘方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115048496B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210479506.X,技术领域涉及:G06F16/3329;该发明授权一种面向虚拟数字人交互的基于文本片段的主题挖掘方法是由陈勇;乔秀全;刘瑞;严辉;黄亚坤设计研发完成,并于2022-05-05向国家知识产权局提交的专利申请。
本一种面向虚拟数字人交互的基于文本片段的主题挖掘方法在说明书摘要公布了:本发明公开了一种面向虚拟数字人交互的基于文本片段的主题挖掘方法,包括:对文本数据进行处理,得到词串序列;基于词串序列构建文本片段序列;统计文本片段序列中的文本片段的词共现模式,构建词‑词共现矩阵;对词‑词共现矩阵进行归一化处理,得到词‑词相关度矩阵S;将词‑词相关度矩阵S分解成词语‑主题矩阵和它的转置之间的乘积。本申请的主题挖掘方法将重点从文档转换到局部上下文环境的文本片段能够带来更多语义相关的主题信息,同时也减少了错误的语义信息;另外,利用文本片段而不是文档能够用一种统一的方式来处理各式各样的文本,无论是长文本数据集、短文本数据集,还是单个的文档比如说一部小说。
本发明授权一种面向虚拟数字人交互的基于文本片段的主题挖掘方法在权利要求书中公布了:1.一种基于文本片段的主题挖掘方法,其特征在于,包括: 对文本数据进行处理,得到词串序列; 基于所述词串序列构建文本片段序列; 统计所述文本片段序列中的文本片段的词共现模式,构建词-词共现矩阵; 对所述词-词共现矩阵进行归一化处理,得到词-词相关度矩阵S,词-词相关度矩阵S表示两两词语之间的词义相关度; 将词-词相关度矩阵S分解成词语-主题矩阵和它的转置之间的乘积,其中M代表着词语的数目,K代表着主题的数目,词语-主题矩阵U的每一行为每一个词语在主题空间上的表示,词语-主题矩阵U的每一列为一个主题,并且满足: 其中,OU表示信息损失量,F表示矩阵的F-范数; 其中, 其中,V是中间辅助变量,为U的一个拷贝,α是非负的超参数,用来控制矩阵V和矩阵U的接近程度,α的值越大,则这两个矩阵越接近相等。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。