温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

python数据挖掘中的分类算法是什么

发布时间:2020-11-16 09:30:52 来源:亿速云 阅读:220 作者:小新 栏目:编程语言

小编给大家分享一下python数据挖掘中的分类算法是什么,希望大家阅读完这篇文章后大所收获,下面让我们一起去探讨吧!

一、KNN算法

二、算法过程

1.读取数据集

2.处理数据集数据 清洗,采用留出法hold-out拆分数据集:训练集、测试集

三、实现KNN算法类:

1)遍历训练数据集,离差平方和计算各点之间的距离

2)对各点的距离数组进行排序,根据输入的k值取对应的k个点

3)k个点中,统计每个点出现的次数,权重为距离的导数,得到最大的值,该值的索引就是我们计算出的判定类别

四、kNN的python实现

import numpy as np
 
#一个最简单的KNN
class KNN():
    
    def __init__(self):
        self.model = {}#存储各个类别的训练样本的特征,key为类别标签,value是一个list,元素为样本的特征向量
        self.training_sample_num = {}#存储训练数据中,各个类别的数量
    
    #训练模型,输入是标签列表,和对应的输入数据列表
    def fit(self, X, Y):
        for i in range(len(Y)):
            #将训练数据按照类别分组
            if Y[i] in self.model:
                self.model[Y[i]].append(X[i])
            else:
                self.model[Y[i]] = [X[i]]
            #各个类别的样本总数
            self.training_sample_num[Y[i]] = self.training_sample_num.get(Y[i], 0) + 1
    
#预测/判断一个样本的类别。这里模仿sklearn的风格,允许输入单个样本,也允许输入多个样本

看完了这篇文章,相信你对python数据挖掘中的分类算法是什么有了一定的了解,想了解更多相关知识,欢迎关注亿速云行业资讯频道,感谢各位的阅读!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI