第 1 章 HA 概述

本章介绍什么是HA, 以及为什么需要HA.

所谓HA就是High Available, 即 高可用, 可用做到不间断 7 * 24小时提供服务.


1.1 为什么需要HA

Hadoop 1.0 时代,Hadoop 的两大核心组件 HDFS NameNodeJobTracker 都存在着单点问题,这其中以 NameNode 的单点问题尤为严重。

因为 NameNode 保存了整个 HDFS 的元数据信息,一旦 NameNode 挂掉,整个 HDFS 就无法访问.

所幸的是,在 Hadoop2.0 中,HDFS NameNodeYARN ResourceManger的单点问题都得到了解决.

NameNodeResouceManager 在分布式系统中只有一个运行实例, 最大的隐患就是单点故障问题.

Hadoop2.0+ 实现高可用最关键的策略是消除单点故障.


1.2 Hadoop 高可用分类

由于HDFS NameNodeYarn ResourceManage 都存在单点失效故障的风险,

所以Hadoop有两种HA:

  1. HDFS HA

    解决NameNode的单点故障问题

  2. ResourceManage HA

    解决ResourceMange的单点故障问题

Copyright © 尚硅谷大数据 & 2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2018-11-11 09:38:54

results matching ""

    No results matching ""