今天给大家介绍一下K-means聚类中的Kmeans Clustering该如何理解。文章的内容小编觉得不错,现在给大家分享一下,觉得有需要的朋友可以了解一下,希望对大家有所帮助,下面跟着小编的思路一起来阅读吧。
Kmeans算法是将一些杂乱无章的数,分为若干个类的一种聚类方法
算法步骤:(k表示聚类中心的个数,上图为3)
(1)随机选取任意k个对象作为初始聚类中心,初始代表一个簇;
(2)计算点到质心的距离,并把它归到最近的质心的类;
(3)重新计算已经得到的各个类的质心;
(4)迭代2~3步直至新的质心与原质心相等或小于指定阈值,算法结束。
K-means算法的优缺点:
1.效果好,不易受初始值得影响
2.不能处理非球形的簇
3.不能处理不同尺寸,不同密度的簇
4.容易受孤立点的影响(需要我们人为干预,进行剔除)
常用的距离算法:
1.欧几里得距离
2.余弦相似度
以上就是K-means聚类中的Kmeans Clustering该如何理解的全部内容了,更多与K-means聚类中的Kmeans Clustering该如何理解相关的内容可以搜索亿速云之前的文章或者浏览下面的文章进行学习哈!相信小编会给大家增添更多知识,希望大家能够支持一下亿速云!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。