ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

数据工程师:必备的 Hive 安装&交互方式技能

2021-11-29 15:34:07  阅读:161  来源: 互联网

标签:bin 交互方式 必备 hive 数据库 Hive Mysql directory your


Hive 安装

hive 的下载地址为:
https://archive.apache.org/dist/hive/

图片

从图中可以看出,hive 有许多可下载的安装版本,这里我使用 hive-2.3.0 的版本为大家演示。

 

step1:下载、上传并解压安装包

进入目标机器将下载的安装包上传至服务器的 /your_directory 路径下,进行解压,命令如下所示

cd /your_directory
tar -zxvf apache-hive-2.3.0-bin.tar.gz -C  /your_directory

 

step2:安装 Mysql 用于存储 Hive 元数据

开始在 Linux 下安装 Mysql 数据库,按照以下顺序步骤执行:

a. 查看是否已安装 Mysql
yum list installed mysql*
如果检测出已安装 Mysql 则可以先卸载掉, 然后再进行安装;

 

b. 安装 Mysql 客户端
yum -y install mysql

 

c. 安装 Mysql 服务器端
yum -y install mysql_server

 

d. 安装 Mysql 开发库
yum -y install mysql-devel

 

e. 配置 Mysql 配置文件
设置 utf-8 编码
vim /etc/my.cnf , 在 my.cnf 文件中添加 default-character-set=utf8;

 

f. 启动 Mysql 数据库
service mysqld start;

 

g. 创建 root 密码
mysqladmin -u root password 123456

 

h. 进入 Mysql 数据库
mysql -hlocalhost -P3306 -uroot -p123456


i. 进入 Mysql 客户端进行授权

grant all privileges on . to 'root'@‘%’ identified by 'test_001' with grant option;
 
flush privileges;

 

step3:修改 hive 的配置文件

修改 hive-env.sh 文件

cd /your_directory/apache-hive-2.3.0-bin/conf
cp hive-env.sh.template hive-env.sh
HADOOP_HOME=/your_directory/hadoop-2.7.5
export HIVE_CONF_DIR=/your_directory/apache-hive-2.3.0-bin/conf

修改 hive-site.xml 文件

 

 

 

从图中可以看出该 xml 文件里设置了 Mysql (存储 hive 元数据信息的数据库) 的连接URL,驱动名称,数据库用户名,密码等关键信息。

 

step4:添加 Mysql 的连接驱动包

Hive 使用 Mysql 作为元数据存储,需要连接 Mysql 数据库,所以将 mysql-connector-java-5.1.38.jar 这个 jar 包上传到 /your_directory/apache-hive-2.3.0-bin/lib这个目录下, 然后启动 Hive。Hive的安装部署就结束了。

 

step5:配置 Hive 的环境变量

在服务器执行以下命令配置 hive 的环境变量

sudo vim /etc/profile
export HIVE_HOME=/your_directory/apache-hive-2.3.0-bin
export PATH=:$HIVE_HOME/bin:$PATH

请记住配置完 hive 的环境变量后,需要使用以下命令使其生效

source /etc/profile

 

Hive 的交互方式

第1种:bin/hive进入hive客户端

# 进入到hive的安装目录
cd /your_directory/apache-hive-2.3.0-bin/
# 输入以下命令则可以进入hive客户端页面
bin/hive

hive 客户端页面如下图所示

 

 创建一个数据库

# 如果数据库名为:mytest的不存在,则创建一个名为 mytest 的数据库,如果存在也不会报错,只是不会创建 mytest 这个名字的数据库;
create database if not exists mytest;

 

第2种:使用 sql 语句或者 sql 脚本进行交互

不进入 hive 的客户端直接执行 hive 的 hql 语句

(1). hive -e 的方式

cd /your_directory/apache-hive-2.3.0-bin
bin/hive -e'create database if not exists mytest;'

 

(2). hive -f 的方式

cd /your_directory

vim test_hive.sql

test_hive.sql内容如下:

create database if not exists mytest;
use mytest;
 
create table t_student(id int, name string);

#通过hive -f来执行sql脚本
bin/hive -f /your_directory/test_hive.sql

以上交互方式创建的 mytest 数据库的元数据信息存储在上述安装的元数据库 mysql 库表中。

 

欢迎关注【无量测试之道】公众号,回复【领取资源】

Python+Unittest框架API自动化、

Python+Unittest框架API自动化、

Python+Pytest框架API自动化、

Python+Pandas+Pyecharts大数据分析、

Python+Selenium框架Web的UI自动化、

Python+Appium框架APP的UI自动化、

Python编程学习资源干货、

资源和代码 免费送啦~
文章下方有公众号二维码,可直接微信扫一扫关注即可。

备注:我的个人公众号已正式开通,致力于IT互联网技术的分享。

包含:数据分析、大数据、机器学习、测试开发、API接口自动化、测试运维、UI自动化、性能测试、代码检测、编程技术等。

微信搜索公众号:“无量测试之道”,或扫描下方二维码:

添加关注,让我们一起共同成长!

标签:bin,交互方式,必备,hive,数据库,Hive,Mysql,directory,your
来源: https://www.cnblogs.com/Wu13241454771/p/15619606.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有