大数据培训技术之ClickHouse

发布时间:2022年01月12日作者:atguigu浏览次数:145

1 什么是ClickHouse

ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告。

2 什么是列式存储

以下面的表为例:

大数据培训技术之ClickHouse

采用行式存储时,数据在磁盘上的组织结构为:

1

张三

18

2

李四

22

3

王五

34

好处是想查某个人所有的属性时,可以通过一次磁盘查找加顺序读取就可以。但是当想查所有人的年龄时,需要不停的查找,或者全表扫描才行,遍历的很多数据都是不需要的。

而采用列式存储时,数据在磁盘上的组织结构为:

1

2

3

张三

李四

王五

18

22

34

这时想查所有人的年龄只需把年龄那一列拿出来就可以了

3 安装前的准备

3.1 CentOS取消打开文件数限制

在/etc/security/limits.conf、/etc/security/limits.d/90-nproc.conf这2个文件的末尾加入一下内容:

[root@hadoop102 software]# vim /etc/security/limits.conf

在文件末尾添加:

* soft nofile 65536

* hard nofile 65536

* soft nproc 131072

* hard nproc 131072

[root@hadoop102 software]# vim /etc/security/limits.d/90-nproc.conf

在文件末尾添加:

* soft nofile 65536

* hard nofile 65536

* soft nproc 131072

* hard nproc 131072

重启服务器之后生效,用ulimit -n 或者ulimit -a查看设置结果

[root@hadoop102 ~]# ulimit -n

65536

3.2 CentOS取消SELINUX

修改/etc/selinux/config中的SELINUX=disabled后重启

[root@hadoop102 ~]# vim /etc/selinux/config

SELINUX=disabled

3.3 关闭防火墙

大数据培训技术之ClickHouse

3.4 安装依赖

[root@hadoop102 ~]# yum install -y libtool

[root@hadoop102 ~]# yum install -y *unixODBC*

想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习。


上一篇:
下一篇:
相关课程

java培训 大数据培训 前端培训 UI/UE设计培训

关于尚硅谷
教育理念
名师团队
学员心声
资源下载
视频下载
资料下载
工具下载
加入我们
招聘岗位
岗位介绍
招贤纳师
联系我们
全国统一咨询电话:010-56253825
地址:北京市昌平区宏福科技园2号楼3层(北京校区)

深圳市宝安区西部硅谷大厦B座C区一层(深圳校区)

上海市松江区谷阳北路166号大江商厦6层(上海校区)

武汉市东湖高新开发区东湖网谷(武汉校区)

西安市雁塔区和发智能大厦B座3层(西安校区)