标签:文件 查看 hdfs 09 hive 词频 mysql
.安装Hive
- 下载解压重命名权限
- 配置环境变量 $HIVE_HOME
- 修改Hive配置文件 gedit
- 配置mysql驱动
- 下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls
- 在mysql新建hive数据库 show databases;
- 配置mysql允许hive接入 show grants for 'hive'@'localhost';
- 启停
- 启动Hadoop--启动Hive--退出Hive--停止Hadoop
二、Hive操作
- hive创建与查看数据
- mysql查看hive元数据表DBS
- hive创建与查看表
- mysql查看hive元数据表TBLS
- hdfs查看表文件位置
- hive删除表
- mysql查看hive元数据表TBLS
- hive删除数据库
- mysql查看hive元数据表DBS
- hdfs查看表文件夹变化
-
三、hive进行词频统计
- 准备txt文件
- 启动hadoop,启动hive
- 创建并查看文本表 create table
- 导入文件的数据到文本表中 load data local inpath
- 分割文本 split
- 行转列explode
- 统计词频group by
准备txt文件
上传文件至hdfs
从hdfs导入文件内容到表wctext, 并查看hdfs源文件,hfds数据库文件
统计词频
词频统计结果存到数据表里,并查看表和文件
本地调用本地hql文件进行词频统计,将结果保存为本地文件
wc.hql
退出hive,停止hadoop
标签:文件,查看,hdfs,09,hive,词频,mysql 来源: https://www.cnblogs.com/wjtao/p/15713575.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。