hbase 使用

时间:2023-11-10 12:07:20

hbase shell命令的使用

再使用hbase 命令之前先检查一下hbase是否运行正常

hadoop@Master:/usr/hbase/bin$ jps
HMaster
NameNode
SecondaryNameNode
Jps
TaskTracker
DataNode
HQuorumPeer
JobTracker
HRegionServer

如果运行不正常的话,关闭hbase后重新启动一下

stop-hbase.sh
start-hbase.sh

1.  status命令

hbase(main)::> status
servers, dead, 3.0000 average load

2. version命令

hbase(main)::> version
0.94., r1524863, Fri Sep :: UTC

3. create 命令
创建一个名为 test 的表,这个表只有一个列为 cf。其中表名、列都要用单引号括起来,并以逗号隔开。

hbase(main)::> create 'test', 'cf'
row(s) in 10.3830 seconds

4. list 命令
查看当前 HBase 中具有哪些表。

hbase(main)::> list
TABLE
test
row(s) in 0.3590 seconds

5. put 命令
使用 put 命令向表中插入数据,参数分别为表名、行名、列名和值,其中列名前需要列族最为前缀,时间戳由系统自动生成。
格式: put 表名,行名,列名([列族:列名]),值
例子:
加入一行数据,行名称为“row1”,列族“cf”的列名为”(空字符串)”,值位 value1。
我这里插入3条记录

hbase(main)::> put 'test', 'row1', 'cf:a', 'value1'
row(s) in 0.2350 seconds hbase(main)::> put 'test', 'row2', 'cf:b', 'value2'
row(s) in 0.0350 seconds hbase(main)::> put 'test', 'row3', 'cf:c', 'value3'
row(s) in 0.0040 seconds

6. describe 命令
查看表“test”的构造。

hbase(main)::> describe 'test'
DESCRIPTION ENABLED
'test', {NAME => 'cf', DATA_BLOCK_ENCODING => 'NONE true
', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '',
VERSIONS => '', COMPRESSION => 'NONE', MIN_VERSIO
NS => '', TTL => '', KEEP_DELETED_CELLS
=> 'false', BLOCKSIZE => '', IN_MEMORY => 'fal
se', ENCODE_ON_DISK => 'true', BLOCKCACHE => 'true'
}
row(s) in 1.6630 seconds

7.get 命令
a.查看表“test”中的行“row2”的相关数据。

hbase(main)::> get 'test','row2'
COLUMN CELL
cf:b timestamp=, value=value2
row(s) in 0.4500 seconds

b.查看表“test”中行“row2”列“cf :b”的值。

hbase(main)::> get 'test','row2', 'cf:b'
COLUMN CELL
cf:b timestamp=, value=value2
row(s) in 0.3090 seconds

或者

hbase(main)::> get 'test', 'row2', {COLUMN=>'cf:b'}
hbase(main)::> get 'test', 'row2', {COLUMNS=>'cf:b'}

备注:COLUMN 和 COLUMNS 是不同的,scan 操作中的 COLUMNS 指定的是表的列族, get操作中的 COLUMN 指定的是特定的列,COLUMNS 的值实质上为“列族:列修饰符”。COLUMN 和 COLUMNS 必须为大写。

8. scan 命令
a. 查看表“test”中的所有数据。

hbase(main)::> scan 'test'
ROW COLUMN+CELL
row1 column=cf:a, timestamp=, value=value1
row2 column=cf:b, timestamp=, value=value2
row3 column=cf:c, timestamp=, value=value3
row(s) in 0.0770 seconds

注意:
scan 命令可以指定 startrow,stoprow 来 scan 多个 row。
例如:

scan 'user_test',{COLUMNS =>'info:username',LIMIT =>, STARTROW => 'test', STOPROW=>'test2'}

b.查看表“scores”中列族“course”的所有数据。

hbase(main)::> scan  'scores', {COLUMN => 'grad'}
hbase(main)::> scan 'scores', {COLUMN=>'course:math'}
hbase(main)::> scan 'scores', {COLUMNS => 'course'}
hbase(main)::> scan 'scores', {COLUMNS => 'course'}

9.count 命令——统计出表中有多少条记录

hbase(main)::> count 'test'
row(s) in 1.6530 seconds

10. exists 命令——查看表是否存在

hbase(main)::> exists 'test'
Table test does exist
row(s) in 1.1620 seconds

11. incr 命令

给‘test’这个列增加 uid 字段,并使用counter实现递增
连续执行incr以上,COUNTER VALUE 的值会递增,通过get_counter

hbase(main)::> incr 'test', 'row2', 'uid',
COUNTER VALUE = hbase(main)::> incr 'test', 'row2', 'uid',
COUNTER VALUE =

查看表可以看到:

hbase(main)::> scan 'test'
ROW COLUMN+CELL
row1 column=uid:, timestamp=, value=buym:
row2 column=uid:, timestamp=, value=\x00\x00\x00\x
\x00\x00\x00\x05
row2 column=uid:, timestamp=, value=buym:
row(s) in 0.0790 seconds

12. delete 命令
删除表“test”中行为“row3”, 列族“cf”中的“c”。

hbase(main)::> delete 'test','row3','cf:c'
row(s) in 0.4640 seconds

13. truncate 命令——将表删除后再重新创建

hbase(main)::> truncate 'test'
Truncating 'test' table (it may take a while):
- Disabling table...
- Dropping table...
- Creating table...
row(s) in 5.6480 seconds

14. disbale、drop 命令
通过“disable”和“drop”命令删除“test”表。

hbase(main)::> disable 'test'
hbase(main)::> drop 'test'
row(s) in 3.9310 seconds

hbase 使用