Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 湖北三峡职业技术学院黄亚娴获国家专利权

湖北三峡职业技术学院黄亚娴获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉湖北三峡职业技术学院申请的专利网络大数据文本解析多维分簇主题进化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119441477B

龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411396234.2,技术领域涉及:G06F16/35;该发明授权网络大数据文本解析多维分簇主题进化方法是由黄亚娴;扆冰礼设计研发完成,并于2024-10-08向国家知识产权局提交的专利申请。

网络大数据文本解析多维分簇主题进化方法在说明书摘要公布了:本申请的网络大数据文本解析多维分簇主题进化方法,通过疑惑度和对数似然函数评价指标选择不同主题维并进行文本解析和文本分类,一是主题进化模型的最优主题维估算,采用一种基于疑惑度和对数似然动态函数来判断语料库中的主题维的方法,计算不同主题维下的疑惑度和对数似然动态函数之间的变化,得到不同的最优主题维;二是基于文本解析的主题进化模型,从文本解析的角度利用可视化方法对不同主题维下建模的效果进行评估;三是基于文本分类的主题进化模型,基于文档与主题之间的分布关系,并通过主题分布构建文本表示,并以此作为特征向量,确定最优的主题维,网络大数据文本解析分类的精度和效率高。

本发明授权网络大数据文本解析多维分簇主题进化方法在权利要求书中公布了:1.网络大数据文本解析多维分簇主题进化方法,其特征在于,构建从文本解析和文本分类角度对数据进化模型中估算主题维的评判方法,通过计算不同主题维下疑惑度和对数似然动态函数,采用数据驱动的方式对主题维做出估算;然后利用估算主题维对语料库建模的结果上,结合文本解析和文本分类对最优主题维做出评判,通过主题进化模型下的可视化,即从词频与文档、词频与分类、基于数据进化的主题分布以词云、气泡图的方式直观展示文本内容,得出基于对数似然动态函数的建模与基于疑惑度的建模效果的动态比较; A1-主题进化模型的最优主题维估算:结合语言模型评价指标与数据进化模型自身的结构特点,采用一种基于疑惑度和对数似然动态函数来判断语料库中的主题维的方法,计算不同主题维下的疑惑度和对数似然动态函数之间的变化,通过M层交叉验证来求疑惑度最低的主题维和对数似然动态函数最大的主题维,从而得到不同的最优主题维; A2-基于文本解析的主题进化模型:包括基于文本词频的词云分析、基于词云的文本解析、基于主题进化模型的可视化分析,从文本解析的角度利用可视化方法对不同主题维下建模的效果进行评估,通过在对比“文档-词项”的文本解析中突显高频词的分析方法,构建基于数据进化的文本解析方法和在主题空间下的词项分析方法,同时通过建模后“主题-主题”、“主题-词项”的分布情况确定最优主题维; A3-基于文本分类的主题进化模型:包括基于数据进化降维的文本分类模型、基于最相邻的文本分类模型,基于文档与主题之间的分布关系,并通过主题分布构建文本表示,并以此作为特征向量,通过文本分类对比对不同的主题建模,确定最优的主题维,通过高概率词项的语义表达和特定的对比结果来优化主题进化模型,并针对不同指标选择主题维的建模效果做出评价; 数据进化模型:假定测试文本集用D表示,词袋模型里的词项用w表示,似然对数值描述该词在主题空间分布情况,首先给定“文档-词项”矩阵的先验参数,通过利用吉布斯抽样来确定先验分布参数值,通过将语料分成训练集和测试集,利用训练集训练模型参数,然后使用VEM估算来计算测试集的对数似然动态函数; 估算主题维是不断的进行模型比较的过程,解析在主题维变化的情况下模型疑惑度均值和对数似然动态函数均值的改变情况,采用交叉检验法来对数据进行检测,在对语料库进行建模时,将文本数据随机分成数量均等的E组,挑选一组作为测试集,对剩下的E-1组集数据进行建模训练主题进化模型,然后使用训练后的主题进化模型来对测试集进行建模,计算得到一组其疑惑度和对数似然动态函数,在同一条件下如此反复多次就得到多组疑惑度和对数似然动态函数,并将多组疑惑度和对数似然动态函数的均值作为结果输出,完成多层交叉检验; 在对主题进化模型的建模效果进行评价时,确定疑惑度越低越好,对数似然动态函数越大越好,在一次主题建模后同时计算疑惑度和对数似然动态函数,在当前模型参数下进行多层交叉检验得到平均的疑惑度和对数似然动态函数,然后改变主题维解析输出的疑惑度和对数似然动态函数趋势,其中在求解平均疑惑度和对数似然动态函数的过程如下: 第一步:给定主题维; 第二步:选定算法Gibbs主题建模; 第三步:求解当前建模的疑惑度和对数似然动态函数; 第四步:重复6次做M层交叉检验,记录平均疑惑度和对数似然动态函数; 通过M层交叉验证的方法来模拟确定主题进化模型的主题维,同时结合疑惑度和对数似然函数值2个评价指标确定主题值取值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖北三峡职业技术学院,其通讯地址为:443000 湖北省宜昌市体育场路31号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。