温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

spark mllib 分类预测之如何实现逻辑回归

发布时间:2021-12-16 14:38:56 来源:亿速云 阅读:236 作者:小新 栏目:云计算

这篇文章主要为大家展示了“spark mllib 分类预测之如何实现逻辑回归 ”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“spark mllib 分类预测之如何实现逻辑回归 ”这篇文章吧。

胃癌转移数据说明

肾细胞癌转移情况(有转移 y=1,无转移 y=2)
x1:确诊时患者年龄(岁)
x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级
x3:肾细胞癌组织内微血管数(MVC)
x4:肾癌细胞核组织学分级,由低到高共4级
x5:肾细胞癌分期,由低到高共4级

y x1 x2 x3 x4 x50 59 2 43.4 2 1

运行代码如下

package spark.logisticRegression

import org.apache.spark.mllib.classification.LogisticRegressionWithSGD
import org.apache.spark.mllib.evaluation.MulticlassMetrics
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.LabeledPoint
import org.apache.spark.mllib.util.MLUtils
import org.apache.spark.{SparkConf, SparkContext}

/**
  *  MLLib分类,逻辑回归,是分类,不是回归
  *  胃癌转移判断
  * Created by eric on 16-7-17.
  */
object LogisticRegression4 {
  val conf = new SparkConf() //创建环境变量
    .setMaster("local")      //设置本地化处理
    .setAppName("LogisticRegression4")//设定名称
  val sc = new SparkContext(conf)

  def main(args: Array[String]) {
    val data = MLUtils.loadLibSVMFile(sc, "./src/main/spark/logisticRegression/wa.txt")	//读取数据文件,一定注意文本格式
    val splits = data.randomSplit(Array(0.7, 0.3), seed = 11L)	//对数据集切分
    val parsedData = splits(0)		//分割训练数据
    val parseTtest = splits(1)		//分割测试数据
    val model = LogisticRegressionWithSGD.train(parsedData,50)	//训练模型

    val predictionAndLabels = parseTtest.map {//计算测试值
      case LabeledPoint(label, features) =>	//计算测试值
        val prediction = model.predict(features)//计算测试值
        (prediction, label)			//存储测试和预测值
    }

    val metrics = new MulticlassMetrics(predictionAndLabels)//创建验证类
    val precision = metrics.precision			//计算验证值
    println("Precision = " + precision)	//打印验证值

    val patient = Vectors.dense(Array(70,3,180.0,4,3))	//计算患者可能性
    val prediction = model.predict(patient)

    if(prediction == 1) println("患者的胃癌有几率转移。")//做出判断
    else println("患者的胃癌没有几率转移。")	//做出判断
    //Precision = 0.3333333333333333
    //患者的胃癌没有几率转移。
  }
}

wa.txt

0 1:59 2:2 3:43.4 4:2 5:1
0 1:36 2:1 3:57.2 4:1 5:1
0 1:61 2:2 3:190 4:2 5:1
1 1:58 2:3 3:128 4:4 5:3
1 1:55 2:3 3:80 4:3 5:4
0 1:61 2:1 3:94 4:4 5:2
0 1:38 2:1 3:76 4:1 5:1
0 1:42 2:1 3:240 4:3 5:2
0 1:50 2:1 3:74 4:1 5:1
0 1:58 2:2 3:68.6 4:2 5:2
0 1:68 2:3 3:132.8 4:4 5:2
1 1:25 2:2 3:94.6 4:4 5:3
0 1:52 2:1 3:56 4:1 5:1
0 1:31 2:1 3:47.8 4:2 5:1
1 1:36 2:3 3:31.6 4:3 5:1
0 1:42 2:1 3:66.2 4:2 5:1
1 1:14 2:3 3:138.6 4:3 5:3
0 1:32 2:1 3:114 4:2 5:3
0 1:35 2:1 3:40.2 4:2 5:1
1 1:70 2:3 3:177.2 4:4 5:3
1 1:65 2:2 3:51.6 4:4 5:4
0 1:45 2:2 3:124 4:2 5:4
1 1:68 2:3 3:127.2 4:3 5:3
0 1:31 2:2 3:124.8 4:2 5:3

结果如图

spark mllib 分类预测之如何实现逻辑回归

以上是“spark mllib 分类预测之如何实现逻辑回归 ”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI