ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

hadoop与hive

2021-12-17 16:30:34  阅读:113  来源: 互联网

标签:数据 数据库 数据仓库 hadoop Hive hive MySQL 售货员


数据依然是存储在HDFS中,由HDFS负责管理数据冗余与一致性。Hive只是在此基础上构建了一个表,在进行数据查询时,Hive引擎将SQL语句转化为下层的mr作业,然后在mr的基础上进行计算,计算完成,最后返回结果。
Hive的语法从MySQL中借鉴了很多东西,因此很多MySQL语句可以直接在Hive中使用。但MySQL属于数据库,Hive属于数据仓库,它们对数据的处理有着本质的区别。
数据库与数据仓库,好比商店的柜台与货仓。你去商店买东西,需要什么东西,只要一问售货员,基本能在1秒之内告诉你在哪儿,价格是多少。柜台好比数据库,需要取数据的时候非常快。如果你问售货员,店里面今年销量最好的手机还有多少部的时候(你就是想买10部送朋友),可能就不会很快得到答案了。因为,售货员需要知道哪款手机卖得最好,另外还需要去仓库里面清点一下存量,假定仓库里面的手机型号太多的话,可能她10分钟才会告诉你答案。这里的仓库也就是数据仓库,数据仓库处理一些并不需要及时反馈的数据,在交互时间上,可能是分钟级别。
Hive就属于这种数据仓库,Hive并不能作为线上使用的数据库,因为执行一条简单的SQL语句,它可能都需要花一分钟来处理。因此,这也正是数据分析的核心。

 

标签:数据,数据库,数据仓库,hadoop,Hive,hive,MySQL,售货员
来源: https://blog.csdn.net/sinat_37574187/article/details/121995302

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有