大数据培训HBase优化之预分区

发布时间:2020年01月13日作者:atguigu浏览次数:853

2 预分区

每一个region维护着startRow与endRowKey,如果加入的数据符合某个region维护的rowKey范围,则该数据交给这个region维护。那么依照这个原则,我们可以将数据所要投放的分区提前大致的规划好,以提高HBase性能。

1.手动设定预分区

hbase> create ‘staff1′,’info’,’partition1′,SPLITS => [‘1000′,’2000′,’3000′,’4000’]

2.生成16进制序列预分区

create ‘staff2′,’info’,’partition2′,{NUMREGIONS => 15, SPLITALGO => ‘HexStringSplit’}

3.按照文件中设置的规则预分区

创建splits.txt文件内容如下:

大数据培训

然后执行:

create ‘staff3′,’partition3’,SPLITS_FILE => ‘splits.txt’

4.使用JavaAPI创建预分区

大数据培训HBase优化之预分区


上一篇:
下一篇:
相关课程

java培训 大数据培训 前端培训

关于尚硅谷
教育理念
名师团队
学员心声
资源下载
视频下载
资料下载
工具下载
加入我们
招聘岗位
岗位介绍
招贤纳师
联系我们
全国统一咨询电话:010-56253825
地址:北京市昌平区宏福科技园2号楼3层(北京校区)

深圳市宝安区西部硅谷大厦B座C区一层(深圳校区)

上海市松江区谷阳北路166号大江商厦3层(上海校区)

武汉市东湖高新开发区东湖网谷(武汉校区)

西安市雁塔区和发智能大厦B座3层(西安校区)

成都市成华区北辰星拱青创园(成都校区)