ICode9

精准搜索请尝试: 精确搜索
  • RHEL之(十一)Red Hat Linux 磁盘管理(上)2021-12-30 16:36:14

    磁盘管理   一、分区概念   硬盘分区是指将硬盘的整体存储空间划分成多个独立的区域,分别用于安装操作系统,应用程序以及存储数据文件等。例如Windows系统也分为CDEFG盘,其中C盘一般作为安装操作系统的盘。这些盘就是一个个在物理硬盘上创建的独立的逻辑单元(分区)。   在分区之

  • 08:Hive从0到1系列学习:分区表2021-12-26 09:03:06

    内容目录 分区表分区表 分区表 Hive的存储是在hdfs上,当Hive创建一张表的时候,其实是在hdfs上创建了一个文件夹。在查询数据的时候,也是将文件夹下所有的文件进行读取,这在海量数据的应用中无疑是非常耗时的,为了进行查找优化,可以使用分区分桶,将数据按照分区分开,在查询的时

  • MySQL 分区表,为什么分区键必须是主键的一部分?2021-12-21 08:00:08

    随着业务的不断发展,数据库中的数据会越来越多,相应地,单表的数据量也会越到越大,大到一个临界值,单表的查询性能就会下降。 这个临界值,并不能一概而论,它与硬件能力、具体业务有关。 虽然在很多 MySQL 运维规范里,都建议单表不超过 500w、1000w。 但实际上,我在生产环境,也见过大小超过 2T

  • Sql Server 表分区2021-12-16 19:04:44

       sql server自2005开始支持分区特性,2012 以前单表分区数量限制1000个,2012开始限制数量为15000个,企业版才支分区特性,目前版本只支持范围分区一种,相比oracle 支持范围、列表、哈希以及子分区特性,功能还有不少的差距。 一、表分区的优势: 1、通过分区交换快速归档、清理历史数据,

  • Hive优化2021-12-06 19:01:59

    (1) 数据存储及压缩。 针对hive中表的存储格式通常有orc和parquet,压缩格式一般使用snappy。相比与textfile 格式表,orc 占有更少的存储。因为 hive 底层使用 MR 计算架构,数据流是 hdfs 到磁盘再到 hdfs,而且会有很多次,所以使用 orc 数据格式和 snappy 压缩策略可以降低 IO 读写

  • 『学了就忘』Linux文件系统管理 — 61、使用parted命令进行分区2021-12-03 11:01:04

    目录1、parted命令介绍2、parted交互模式3、建立分区(1)查看分区(2)修改成GPT分区表(3)建立分区(4)建立文件系统(格式化)(5)调整分区大小(6)删除分区 1、parted命令介绍 我们Linux系统中有两种常见的分区表,MBR分区表(主引导记录分区表)和GPT分区表(GUID分区表,也叫全局唯一标识分区表),其中: MBR分区表

  • 021.hive-hive修改分区表的列(添加列)导致分区字段出问题,需要更新分区信息2021-11-17 11:33:53

    问题 修改分区表的列(添加列)但是查询数据为null 原因 修改分区表导致分区字段元数据出问题,需要更新分区信息   https://blog.csdn.net/gxd520/article/details/92791487?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.not_use_machine_learn_pai&dept

  • 磁盘管理和文件管理2021-11-04 20:01:13

    磁盘必须先被识别,其次是分区,然后再格式化写入文件系统,最后才能被写入文件. 扇区,磁道,磁柱.扇区的最小单位为4KB或512B,磁柱是N个磁面相同半径磁道的累加,磁柱是分区的最小单位. 分区有两种方式,MBR(MSDOS)和GUID   分区是以磁柱为基本单位的连续磁盘空间.分区可以隔离数

  • 大数据基础之Hive(三)—— 分区表和分桶表2021-11-02 11:32:48

    作者:duktig 博客:https://duktig.cn (文章首发) 优秀还努力。愿你付出甘之如饴,所得归于欢喜。 更多文章参看github知识库:https://github.com/duktig666/knowledge 背景 学习完Hadoop,有没有感到编写一个MapReduce程序非常复杂,想要进行一次分析和统计需要很大的开发成本。那么不

  • MySQL 分区表实践2021-10-28 19:02:03

    1、分区表 官方手册:https://dev.mysql.com/doc/refman/5.7/en/partitioning.html 对用户来说,分区表是一个独立的逻辑表,但是底层由多个物理子表组成。实现分区的代码实际上是对一组底层表的句柄对象(Handler Object)的封装。对分区表的请求,都会通过句柄对象转化成对存储引擎的接口调

  • linux操作系统启动2021-10-28 13:03:20

    BIOS+MBR+Grub2 BIOS是固化在ROM中程序,主要完成开机硬件自检和设置。 MBR Master boot record 主引导记录,位于001扇区,512字节。存放分区表信息和bootloader。           一般MBR位于vda或者sda盘中,可以使用parted命令查看。 Grub2就是系统启动的引导程序。

  • MySQL之实践篇(七)2021-10-26 16:57:59

    文章目录 insert语句的锁为什么这么多?怎么最快地复制一张表?mysqldump 方法导出 CSV 文件物理拷贝方法 grant之后要跟着flush privileges吗?全局权限db 权限表权限和列权限flush privileges 使用场景权限的作用范围和修改策略总结 要不要使用分区表?分区表是什么?分区策略分区

  • Windows 10无法更新 不支持UEFI固件的磁盘布局2021-10-24 11:31:06

    解决这个问题有两种方案: UEFI+GPT 主板支持UEFI引导的话,可以采用这个方案,将磁盘分区表从MBR改为GPT,进到U盘的PE系统里面用磁盘分区工具即可,删除所有分区之后再新建,意味着要重装系统了。 一定要记得新建ESP分区,否则UEFI无法引导启动,切记!!! Legacy only + MBR 不改分区表的情况下,进

  • 【Hive】:简介与基本使用2021-10-23 22:31:09

    hive简单来说,就是一个用来查询hadoop当中(hdfs)数据的一个工具。它的结构如下:    hive当中有一部分用来储存元数据,也就是metadata,这些metadata包含了hadoop当中的数据表的schema,比如说一个表的所有列名称,字段,类型。以及有哪些表table已经被hdfs所保存。 而这些数据储存在hive自身

  • postgresql之分区表2021-10-19 15:31:10

    pg10之后有内置分区表,相对于之前传统分区表更好用 ---传统分区表   --继承表 postgres=# create table tbl_log(id int4,create_date date,log_type text); CREATE TABLE 创建一张子表 postgres=# create table tbl_log_sql (sql text ) inherits(tbl_log); CREATE TABLE 父

  • Hive 分区表增加字段并赋值2021-10-11 23:01:20

    Hive 分区表增加字段并赋值 前言背景解决方案具体操作注意事项 总结 前言 最近工作上需要用到大数据平台,之前没用过大数据相关的工具,所以踩了不少坑。今天就把在分区表中添加字段的坑分享出来,避免再次踩坑。 背景 今天接到一个需求,在原有的 hive 分区表中需要添加一个字

  • Hive分区2021-10-10 19:59:08

    目录 一、分区的概念及作用 二、如何实现分区表 1、分区表的简单创建及简单使用(增删查改) (1)建立分区表 (2)增加一个分区: (3) 删除一个分区: (4)查看某个表的所有分区 (5)往分区中插入数据: 2、 查询某个分区的数据: 3、 Hive动态分区 (1)开启Hive的动态分区支持 (2)建立原始表并加载数据sql (3)建

  • PostgreSQL 按年月日动态创建分区表2021-10-05 16:02:02

    文章目录 PostgreSQL 按年月日动态创建分区表 1、创建主表 2、动态创建分区表 3、删除数据 4、解除其与主表的继承关系 5、更改分区表的表空间 PostgreSQL 按年月日动态创建分区表 1、创建主表 CREATE TABLE event_records ( id serial NOT NULL, --

  • mysql调优(九)--分区表2021-10-04 17:02:36

    思维导图 一、分区表的应用场景 1.表非常大以至于无法全部都放在内存中,或者只在表的最后部分有热点数据,其他均是历史数据2.分区表的数据更容易维护 批量删除大量数据可以使用清除整个分区的方式 对一个独立分区进行优化、检查、修复等操作 3.分区表的数据可以分布在不同的

  • Mac 系统引导过程概述 & BootCamp2021-10-02 12:35:05

    前言 OS X 与 Windows 在引导流程上有很大的差别,而且在 Mac 上运行 Windows 需要经过特殊的处理。造成这种差异的原因在于磁盘分区表格式。 分区表 一个磁盘抛开物理组成部分的话,它就是一个地址序列,这个序列从 0~n-1 ,每个地址包含 512B(字节)的空间。一般我们将这些地址称作逻辑块地

  • Hive的内部表、外部表、分区表和分桶表2021-09-28 20:01:14

            hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive的优

  • 装机 --- Windows无法安装到这个磁盘,选中的磁盘具有MBR分区表。在EFI系统上,Windows只能安装到GPT磁盘2021-09-27 12:03:01

    很多同学在重装系统的时候,或多或少都遇到过这样的问题:镜像文件没有问题,但偏偏就在选择安装系统盘盘符的时候,跳出对话框,提示:Windows无法安装到这个磁盘,选中的磁盘具有MBR分区表。在EFI系统上,Windows只能安装到GPT磁盘。 首先搞明白什么是MBR分区表,什么又是GPT磁盘? (1)MBR和GPT

  • hive多分区表创建+数据导入2021-09-22 10:33:13

    步骤:建分区表、建临时表、临时表数据写入、临时表写入数据到分区表   1、分区参数介绍   hive.exec.dynamic.partition:是否启动动态分区。默认false。 hive.exec.dynamic.partition.mode:打开动态分区后,动态分区的模式为strict和nonstrict。 strict可设置为静态

  • Hadoop上搭建hive;初始hhive;并运用zeppelin工具2021-09-18 02:03:45

    准备阶段   1.搭建好Hadoop的服务器。   2.hive压缩包  上传至/opt   3.zeppelin压缩包  上传至/opt 开始搭建   Hive的文件格式    Hive的使用   创建分区表   分区表操作:实际上就是建立一个个的文件夹,将数据按照你的分区约定,分别存放进去。分为静态分区和动态分

  • Doris的brokerLoad导入Hive动态分区表2021-09-17 11:58:18

    问题 brokerLoad将一个以day字段为动态分区字段的hive表 导入到doris也是以day字段为动态分区字段的表 结果报错 type:LOAD_RUN_FAIL; msg:errCode = 2, detailMessage = ParseError : Invalid column selected day doris是不支持导入动态分区hive表嘛 问题解决 问了社区大佬

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有