这篇文章将为大家详细讲解有关Hadoop中如何实现计数器,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
package mapreduce;
import java.io.IOException;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Counter;
import org.apache.hadoop.mapreduce.Mapper;
/**
* KEYIN 即k1 业务上表示每一行的起始位置,又称偏移量
* VALUEIN 即v1 业务上表示每一行的文本内容
* KEYOUT 即k2 业务上表示每一行的每个单词
* VALUEOUT 即v2 业务上表示每一行的每个单词出现的次数,常量1
* @author Xr
*
*/
public class MyMapper extends Mapper<LongWritable,Text,Text,LongWritable> {
/**
* 解析每一行的文本,解析成每一个单词,统计每一个单词出现的次数
*/
@Override
protected void map(LongWritable key, Text value,Context context)
throws IOException, InterruptedException {
//计数器
Counter counter = context.getCounter("Words", "hello");
//counter.setValue("");//设置初始值
//每一行的文本内容
String string = value.toString();
if(string.contains("hello")){
int times = string.split("hello").length-1;
counter.increment(times);//自动累加
}
//每一行包含的单词数组
String[] split = string.split(" ");
for(String word : split){
context.write(new Text(word), new LongWritable(1));
}
}
}
关于“Hadoop中如何实现计数器”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
原文链接:https://my.oschina.net/Xiao629/blog/205174