#

mahout hadoop canopy

  • 数据挖掘-Mahout-Canopy聚类实践

    1、原理解释(1)原始数据集合List按照一定的规则进行排序,初始距离阈值设置为T1、T2,T1>T2。(2)在List中随机挑选一个数据向量A,使用一个粗糙距离计算方式计算A与List中其它样

    作者:刀刀_高扬
    2020-07-31 14:23:08