Storm在Zookeeper中的结构是怎样的,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
Storm在Zookeeper中的保存
简介:
我们知道,Twitter Storm的所有状态信息都是保存在Zookeeper 之中的,在前面的有关kafka的文章之中,我们知道kafka也将信息保存在Zookeeper之中,还有其他类似的组件:如double,hbase等。存在对Zookeeper的依赖。
细节:
nimbus通过在Zookeeper上面写状态信息来分配任务,Supervisor,task通过Zookeeper中读取状态来领取自己的任务,与此同时Nimbus在不断的读取 Supervisor,task发送给nimbus的心跳信号,以便能够准确的监控到集群的状态。从而可以重新来启动一些 ”挂掉“的任务。
具体的源代码是 backtype.storm.cluster
/-{storm-zk-root} -- storm在zookeeper上的根 | 目录 | |-/assignments -- topology的任务分配信息 | | | |-/{topology-id} -- 这个下面保存的是每个 | topology的assignments | 信息包括: 对应的 | nimbus上的代码目录,所有 | task的启动时间, | 每个task与机器、端口的映射 | |-/tasks -- 所有的task | | | |-/{topology-id} -- 这个目录下面id为 | | {topology-id}的topology | | 所对应的所有的task-id | | | |-/{task-id} -- 这个文件里面保存的是这个 | task对应的component-id: | 可能是spout-id或者bolt-id | |-/storms -- 这个目录保存所有正在运行 | | 的topology的id | | | |-/{topology-id} -- 这个文件保存这个topology | 的一些信息,包括topology的 | 名字,topology开始运行的时 | 间以及这个topology的状态 | (具体看StormBase类) | |-/supervisors -- 这个目录保存所有的supervisor | | 的心跳信息 | | | |-/{supervisor-id} -- 这个文件保存的是supervisor | 的心跳信息包括:心跳时间,主 | 机名,这个supervisor上worker | 的端口号运行时间 | (具体看SupervisorInfo类) | |-/taskbeats -- 所有task的心跳 | | | |-/{topology-id} -- 这个目录保存这个topology的所 | | 有的task的心跳信息 | | | |-/{task-id} -- task的心跳信息,包括心跳的时 | 间,task运行时间以及一些统计 | 信息 | |-/taskerrors -- 所有task所产生的error信息 | |-/{topology-id} -- 这个目录保存这个topology下面 | 每个task的出错信息 | |-/{task-id} -- 这个task的出错信息
看完上述内容,你们掌握Storm在Zookeeper中的结构是怎样的的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注亿速云行业资讯频道,感谢各位的阅读!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。