校验 snappy 是否生效

hbase org.apache.hadoop.hbase.util.CompressionTest hdfs:///tmp/hbase snappy

启动 thrift 服务器的时候指定端口

/opt/hbase/bin/hbase-daemon.sh --config /opt/hbase/conf start thrift2 --infoport 9096 -p 9097

使用 PE 命令生产测试表与数据

hbase org.apache.hadoop.hbase.PerformanceEvaluation --compress=SNAPPY --size=10 sequentialWrite 10

会在 hbase 中创建一个名为 TestTable 的 10G 容量的测试数据表

使用 hbase 自带的类进行统计表行数

hbase org.apache.hadoop.hbase.mapreduce.RowCounter '表名'

通过 python 读写 hbase 时的过滤语法

query_str = "SingleColumnValueFilter ('a', 'aa', =, 'substring:test', true, false)"
# query_str = "SingleColumnValueFilter ('a', 'aa', =, 'substring:test', true,false) OR SingleColumnValueFilter ('a', 'aa', =, 'substring:check', true, false)"  #  使用多个条件
# query_str = "SingleColumnValueFilter ('a', 'aa', =, 'regexstring:(test|check).com', true, false)" # 使用正则
query = table.scan(filter=query_str, limit=10)