登录    注册    忘记密码    使用帮助

详细信息

基于机器学习的无监督文件数据智能分类方法及系统    

文献类型:专利

中文题名:基于机器学习的无监督文件数据智能分类方法及系统

作者:周伟[1];林耀庭[1];张文欢[1];王国轩[1];

机构:[1]广东海洋大学;

专利类型:发明公开

申请号:CN202511502866.7

申请日:20251021

申请人地址:524088 广东省湛江市麻章区海大路1号

公开日:20260109

代理人:郭福利

代理机构:厦门智慧呈睿知识产权代理事务所(普通合伙) 35222

语种:中文

中文关键词:基于机器;无监督;文件数据;智能分类;分类文件;数据集;多模态;特征提取;多维特征向量;特征向量集合;文本特征向量;结构特征向量;语义;拼接;融合;动态自适应;神经网络模型;输入;节点动态;分裂;合机;生成文件;特征图;文件特征;节点表;权重表;簇间;相似度;自适应带宽;核密度估计

中文摘要:本发明公开了一种基于机器学习的无监督文件数据智能分类方法及系统,属于机器学习领域,所述方法为:获取待分类文件数据集后进行多模态特征提取,得到融合文本、结构和语义特征的多维特征向量集合;通过动态自适应图神经网络生成文件特征图,结合自适应带宽核密度估计识别簇中心,通过密度聚类、层次树构建与剪枝生成初始分类结果;对纯度小于等于预设阈值的簇经主成分分析确定最大方差轴并沿最大方差轴二次分裂得到中间分类结果;构建分类知识图谱,并经图谱增强学习迭代更新,得到目标分类结果。因此,通过实施本发明,能够实现无监督场景下文件数据的精准、自适应分类。

参考文献:

正在载入数据...

版权所有©广东海洋大学 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心