这篇文章将为大家详细讲解有关Hadoop中的序列化有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
序列化概念:
序列化(Serialization):是指把结构化对象转化为字节流。
反序列化(Deserialization):是序列化的逆过程,即把字节流转回结构化对象。
Java序列化:(java.io.Serializable)
Hadoop序列化:
序列化格式特点:
1、紧凑:高效使用存储空间。
2、快速:读写数据的额外开销小。
3、可扩展:可透明地读取老格式的数据。
4、互操作:支持多语言的交互。
Hadoop想要实现序列化就必须要实现Writable接口。
Writable接口:
Writable接口是根据DataInput和DataOutput实现的简单、有效的序列化对象。
MapReduce的任意Key必须实现WritableComparable接口。
MapReduce的任意Key和Value必须实现Writable接口。
常用的Writable实现类:
Hadoop序列化的作用:
序列化在分布式环境的两大作用:进程间通信,永久存储。
Hadoop节点间通信:
关于“Hadoop中的序列化有什么用”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。