这篇文章将为大家详细讲解有关Hadoop中如何实现计数器,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
package mapreduce; import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Counter; import org.apache.hadoop.mapreduce.Mapper; /** * KEYIN 即k1 业务上表示每一行的起始位置,又称偏移量 * VALUEIN 即v1 业务上表示每一行的文本内容 * KEYOUT 即k2 业务上表示每一行的每个单词 * VALUEOUT 即v2 业务上表示每一行的每个单词出现的次数,常量1 * @author Xr * */ public class MyMapper extends Mapper<LongWritable,Text,Text,LongWritable> { /** * 解析每一行的文本,解析成每一个单词,统计每一个单词出现的次数 */ @Override protected void map(LongWritable key, Text value,Context context) throws IOException, InterruptedException { //计数器 Counter counter = context.getCounter("Words", "hello"); //counter.setValue("");//设置初始值 //每一行的文本内容 String string = value.toString(); if(string.contains("hello")){ int times = string.split("hello").length-1; counter.increment(times);//自动累加 } //每一行包含的单词数组 String[] split = string.split(" "); for(String word : split){ context.write(new Text(word), new LongWritable(1)); } } }
关于“Hadoop中如何实现计数器”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。