这篇文章主要介绍了python的聚类算法怎么选择的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python的聚类算法怎么选择文章都会有所收获,下面我们一起来看看吧。
说明
1、如果数据集是高维度的,选择谱聚类是子空间的一种。
2、如果数据量是中小型的,K均值会是更好的选择。
如果数据量超过100W条,可以考虑使用MiniBatchKMeans。
3、如果数据集中有噪声,选择DBSCAN。
使用基于密度的DBSCAN可以有效解决这个问题。
4、若追求更高的分类准确性,则选择谱聚类。
实例
import numpy as np import matplotlib.pyplot as plt # 数据准备 raw_data = np.loadtxt('./pythonlearn/cluster.txt') # 导入数据文件 X = raw_data[:, :-1] # 分割要聚类的数据 y_true = raw_data[:, -1] print(X)
1、简单易用,与C/C++、Java、C# 等传统语言相比,Python对代码格式的要求没有那么严格;
2、Python属于开源的,所有人都可以看到源代码,并且可以被移植在许多平台上使用;
3、Python面向对象,能够支持面向过程编程,也支持面向对象编程;
4、Python是一种解释性语言,Python写的程序不需要编译成二进制代码,可以直接从源代码运行程序;
5、Python功能强大,拥有的模块众多,基本能够实现所有的常见功能。
关于“python的聚类算法怎么选择”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“python的聚类算法怎么选择”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。