7.1 快速入门1: 统计表中数据的行数
本节使用官方自带的 RowCounter 来统计每个表有多少行数据.
步骤1: 设置环境变量
就是配置就是 HBASE_HOME
和 HADOOP_HOME
, 如何前面设置过, 跳过此步骤.
export HBASE_HOME=/opt/module/hbase-1.3.2.1
export HADOOP_HOME=/opt/module/hadoop-2.7.2
步骤2: 在hadoop-env.sh
中配置HADOOP_CLASSPATH
变量
我们的步骤是 Hadoop 从 HBase 读取到数据之后, 然后使用 MapReduce 做分析.
所以 Hadoop 就需要持有 HBase 的一些 jar, 设置HADOOP_CLASSPATH
这个变量可以达到我们的目的
export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/opt/module/hbase-1.3.1/lib/*
注意:
把前面这行语句添加
for
循环之后(或者文件的末尾都可以)不要忘记分发修改后的配置文件
步骤3: 重新启动 Hadoop 集群
如果要配置生效, 必须重启集群
步骤4: 运行官方的 MapReduce 任务
统计表中有多少行数据
yarn jar lib/hbase-server-1.3.1.jar rowcounter student