第 1 章 HA
概述
本章介绍什么是HA
, 以及为什么需要HA
.
所谓HA
就是High Available
, 即 7 * 24
小时提供服务.
1.1 为什么需要HA
在 Hadoop 1.0
时代,Hadoop 的两大核心组件 HDFS NameNode
和 JobTracker
都存在着单点问题,这其中以 NameNode
的单点问题尤为严重。
因为 NameNode
保存了整个 HDFS
的元数据信息,一旦 NameNode
挂掉,整个 HDFS
就无法访问.
所幸的是,在 Hadoop2.0
中,HDFS NameNode
和 YARN ResourceManger
的单点问题都得到了解决.
像 NameNode
和 ResouceManager
在分布式系统中只有一个运行实例, 最大的隐患就是单点故障问题.
Hadoop2.0+
实现高可用最关键的策略是
1.2 Hadoop 高可用分类
由于HDFS NameNode
和 Yarn ResourceManage
都存在单点失效故障的风险,
所以Hadoop
有两种HA
:
HDFS HA
解决
NameNode
的单点故障问题ResourceManage HA
解决
ResourceMange
的单点故障问题