温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

怎样理解K-均值聚类原理

发布时间:2021-12-03 16:17:53 来源:亿速云 阅读:221 作者:柒染 栏目:大数据

怎样理解K-均值聚类原理,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

如何正确使用K-均值聚类

无监督学习是指从无标注数据中学习模型的机器学习问题。无标注数据是自然得到的数据,模型表示数据的类别、转换或概率无监督学习的本质是学习数据中的统计规律或潜在结构,主要包括聚类、降维、概率估计。

KMeans算法是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。  
K个初始聚类中心点的选取对聚类结果具有较大的影响,因为在该算法第一步中是随机地选取任意k个对象作为初始聚类中心,初始地代表一个簇。该算法在每次迭代中对数据集中剩余的每个对象,根据其与各个簇中心的距离赋给最近的簇。当考查完所有数据对象后,一次迭代运算完成,新的聚类中心被计算出来。
算法过程如下:  
 (1)从N个数据文档(样本)随机选取K个数据文档作为质心(聚类中心)。  
 本文在聚类中心初始化实现过程中采取在样本空间范围内随机生成K个聚类中心。  
 (2)对每个数据文档测量其到每个质心的距离,并把它归到最近的质心的类。  
 (3)重新计算已经得到的各个类的质心。  
 (4)迭代(2)~(3步直至新的质心与原质心相等或小于指定阈值,算法结束。

怎样理解K-均值聚类原理

下图为几张GIF,形象说明k均值聚类的过程。
数据点。

怎样理解K-均值聚类原理

从最左边的4点开始

怎样理解K-均值聚类原理

从最右边的4点开始

怎样理解K-均值聚类原理

从4个最高点开始

怎样理解K-均值聚类原理

从4个底线开始

怎样理解K-均值聚类原理

从一个簇中的4个随机点开始

怎样理解K-均值聚类原理

关于怎样理解K-均值聚类原理问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI