这篇文章主要介绍基于Jupyter notebooks采用sklearn库实现多元回归方程编程的示例分析,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
一、导入excel文件和相关库
import pandas; import matplotlib; from pandas.tools.plotting import scatter_matrix; data = pandas.read_csv("D:\\面积距离车站.csv",engine='python',encoding='utf-8')
显示文件大小
data.shape
data
二.绘制多个变量两两之间的散点图:scatter_matrix()方法
#绘制多个变量两两之间的散点图:scatter_matrix()方法 font = { 'family' : 'SimHei' } matplotlib.rc('font', **font) scatter_matrix( data[["area","distance", "money"]], figsize=(10, 10), diagonal='kde' ) #diagonal参数表示变量与变量本身之间的绘图方式,kde代表直方图 #求相关系数矩阵 data[["area", "distance", "money"]].corr() x = data[["area", "distance"]] y = data[["money"]]
三、导入sklearn
from sklearn.linear_model import LinearRegression #建模 lrModel = LinearRegression() #训练模型 lrModel.fit(x, y) #评分 R2=lrModel.score(x, y) print("R的平方:",R2) #预测 lrModel.predict([[10, 110],[20, 110]]) #查看参数 lrModel.coef_ #查看截距 lrModel.intercept_
结果如下:
回归方程为:y=41.51x1-0.34x2+65.32
四、python全部代码
import pandas; import matplotlib; from pandas.tools.plotting import scatter_matrix; data.shape #绘制多个变量两两之间的散点图:scatter_matrix()方法 font = { 'family' : 'SimHei' } matplotlib.rc('font', **font) scatter_matrix( data[["area","distance", "money"]], figsize=(10, 10), diagonal='kde' ) #diagonal参数表示变量与变量本身之间的绘图方式,kde代表直方图 #求相关系数矩阵 data[["area", "distance", "money"]].corr() x = data[["area", "distance"]] y = data[["money"]] from sklearn.linear_model import LinearRegression #建模 lrModel = LinearRegression() #训练模型 lrModel.fit(x, y) #评分 R2=lrModel.score(x, y) print("R的平方:",R2) #预测 lrModel.predict([[10, 110],[20, 110]]) #查看参数 lrModel.coef_ #查看截距 lrModel.intercept_
以上是“基于Jupyter notebooks采用sklearn库实现多元回归方程编程的示例分析”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注亿速云行业资讯频道!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。