快速入门
需求:实现按照维度(工作地点)统计员工信息
1 数据准备
在Hive中创建数据,分别创建部门和员工外部表,并向表中导入数据。
(1)原始数据
dept.txt
emp.txt
(2)建表语句
创建部门表
create external table if not exists default.dept(
deptno int,
dname string,
loc int
)
row format delimited fields terminated by ‘\t’;
创建员工表
create external table if not exists default.emp(
empno int,
ename string,
job string,
mgr int,
hiredate string,
sal double,
comm double,
deptno int)
row format delimited fields terminated by ‘\t’;
(3)查看创建的表
hive (default)> show tables;
OK
tab_name
dept
emp
(4)向外部表中导入数据
导入数据
hive (default)> load data local inpath ‘/opt/module/datas/dept.txt’ into table default.dept;
hive (default)> load data local inpath ‘/opt/module/datas/emp.txt’ into table default.emp;
查询结果
hive (default)> select * from emp;
hive (default)> select * from dept;
想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习
上一篇: jQuery绑定事件方式bind-前端培训技术
下一篇: 大数据培训Spring框架重用切入点定义