11.1 DataNode工作机制

NameNode是存储的数据的元数据

DataNode是用来存储具体数据的, 通过DataNode的名字就可以看出来.


  1. 一个数据块以文件的显示存储在磁盘上.

  2. 一个块一般包括 2 个文件:

    • 数据本身
    • 块的元数据: 数据块的长度, 块数据的校验和, 以及时间戳
  3. DataNode启动后向NameNode注册. 通过后, 周期性(每隔 1 小时)的向NameNode上报自己的所有块信息

  4. DataNode每个 3 秒就会给NameNode上报一下自己的位置, 证明自己还活着. 我们称为DataNode的心跳机制. NameNode会返回给DataNode一些信息: 如复制块数据到另外的DataNode, 或者删除某块数据.

  5. 如果NameNode超过 10 分钟没有收到某个DataNode的心跳, 则认为这个DataNode已经不存在了. 以后就不会从这个节点读数据或者向这个节点写数据.

  6. 集群运行中也可以加入或退出一些机器.

Copyright © 尚硅谷大数据 2013-2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2019-02-14 02:59:46

results matching ""

    No results matching ""