-
NumPy:用于进行数值计算和数组操作。主要函数有:
- numpy.array():创建NumPy数组
- numpy.arange():创建等差数列数组
- numpy.linspace():创建等距数列数组
- numpy.zeros():创建全零数组
- numpy.ones():创建全一数组
- numpy.eye():创建单位矩阵
- numpy.dot():矩阵乘法
- numpy.transpose():矩阵转置
- numpy.linalg.inv():矩阵求逆
- numpy.linalg.det():计算矩阵行列式
- numpy.linalg.eig():计算矩阵特征值和特征向量
-
pandas:用于数据处理和分析。主要函数有:
- pandas.DataFrame():创建数据框
- pandas.Series():创建序列
- DataFrame.head():查看数据框前n行
- DataFrame.tail():查看数据框后n行
- DataFrame.describe():查看数据框统计信息
- DataFrame.groupby():对数据框进行分组
- DataFrame.merge():合并数据框
- DataFrame.join():连接数据框
- DataFrame.pivot_table():创建数据透视表
- DataFrame.drop():删除数据框行或列
- DataFrame.drop_duplicates():删除重复行
- DataFrame.fillna():填充缺失值
- DataFrame.replace():替换数据框中的值
-
matplotlib:用于数据可视化。主要函数有:
- matplotlib.pyplot.plot():绘制折线图
- matplotlib.pyplot.scatter():绘制散点图
- matplotlib.pyplot.hist():绘制直方图
- matplotlib.pyplot.boxplot():绘制箱线图
- matplotlib.pyplot.pie():绘制饼图
- matplotlib.pyplot.bar():绘制条形图
- matplotlib.pyplot.figure():创建画布
- matplotlib.pyplot.subplot():创建子图
- matplotlib.pyplot.savefig():保存图像
- matplotlib.pyplot.show():显示图像
-
scikit-learn:用于机器学习和数据挖掘。主要函数有:
- sklearn.linear_model.LinearRegression():线性回归
- sklearn.linear_model.LogisticRegression():逻辑回归
- sklearn.svm.SVC():支持向量机
- sklearn.ensemble.RandomForestClassifier():随机森林分类器
- sklearn.cluster.KMeans():K-means聚类
- sklearn.decomposition.PCA():主成分分析
- sklearn.metrics.accuracy_score():计算准确率
- sklearn.metrics.confusion_matrix():计算混淆矩阵
- sklearn.model_selection.train_test_split():划分训练集和测试集
- sklearn.preprocessing.StandardScaler():标准化数据
- sklearn.pipeline.Pipeline():创建流水线