小编给大家分享一下spark mllib如何实现随机梯度下降法,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!
package spark.regressionAnalysis
/**
* 随机梯度下降法(stochastic gradient descent,SGD)
* SGD是最速梯度下降法的变种。
* 使用最速梯度下降法,将进行N次迭代,直到目标函数收敛,或者到达某个既定的收敛界限。
* 每次迭代都将对m个样本进行计算,计算量大。
* 为了简便计算,SGD每次迭代仅对一个样本计算梯度,直到收敛。
* 随机梯度下降,即(最快速从紫金山山顶下去)
*
* Created by eric on 16-7-10.
*/
import scala.collection.mutable.HashMap
object SGD {
val data = HashMap[Int,Int]() //创建数据集
def getData():HashMap[Int,Int] = {//生成数据集内容
for(i <- 1 to 50){ //创建50个数据
data += (i -> (16*i))//写入公式y=16x
}
data //返回数据集
}
var θ:Double = 0 //第一步假设θ为0
var α:Double = 0.1 //设置步进系数,每次下降的幅度大小
def sgd(x:Double,y:Double) = {//设置迭代公式
θ = θ - α * ( (θ*x) - y) //迭代公式
}
def main(args: Array[String]) {
val dataSource = getData() //获取数据集
dataSource.foreach(myMap =>{//开始迭代
sgd(myMap._1,myMap._2)//输入数据
})
println("最终结果θ值为 " + θ)//显示结果
}
}
看完了这篇文章,相信你对“spark mllib如何实现随机梯度下降法”有了一定的了解,如果想了解更多相关知识,欢迎关注亿速云行业资讯频道,感谢各位的阅读!
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
原文链接:https://my.oschina.net/sunmin/blog/719638