ICode9

精准搜索请尝试: 精确搜索
  • org.apache.iceberg.exceptions.NotFoundException: Failed to open input stream for file:hdfs://ns1/use2022-09-15 13:34:09

    做机器迁移,导致flink程序写iceberg失败,原因是hive的元数据存储库mysql停了一段时间。 然后flink出现以下异常, org.apache.iceberg.exceptions.NotFoundException: Failed to open input stream for file: hdfs://ns1/user/hive/warehouse/iceberg_ods.db/ods_xxx/metadata/17120-4

  • hive删除表后重新创建时提示表已存在并且卡死2022-09-08 12:34:35

    SQL 错误 [1] [08S01]: Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org.apache.iceberg.exceptions.AlreadyExistsException: Table was created concurrently: iceberg_dw.dw_xxxxxxxx iceberg

  • Retrying task after failure: Waiting for lock. org.apache.iceberg.hive.HiveTableOperations$WaitingFo2022-09-04 21:35:16

    执行spark任务居然碰到了hive中表的被锁了,导致写数据时失败,这个还真是头一次碰到过这回事。 错误信息如下: 22/09/04 21:02:28 WARN Tasks: Retrying task after failure: Waiting for lock. org.apache.iceberg.hive.HiveTableOperations$WaitingForLockException: Waiting for lo

  • 数据湖三剑客 Hudi、Delta、Iceberg 对比2022-09-01 00:04:05

    一、介绍 在构建数据湖时,也许没有比数据格式存储更具有意义的决定。其结果将对其性能、可用性和兼容性产生直接影响。 通过简单地改变数据的存储格式,我们就可以解锁新的功能,提高整个系统的性能,这很有启发意义。 Apache Hudi、Apache Iceberg 和 Delta Lake是目前为数据湖设计的

  • 从 Delta 2.0 开始聊聊我们需要怎样的数据湖2022-08-12 10:32:06

    盘点行业内近期发生的大事,Delta 2.0 的开源是最让人津津乐道的,尤其在 Databricks 官宣 delta2.0 时抛出了下面这张性能对比,颇有些引战的味道。 虽然 Databricks 的工程师反复强调性能测试来自第三方 Databeans,并且他们没有主动要求 Databeans 做这项测试,但如果全程看完 delta2.0

  • dremio 对于iceberg 的操作支持2022-07-01 01:02:45

    从dremio 22 开始iceberg 已经成为了dremio 标配的ctas 操作了,而且同时也支持直接创建iceberg 表了,此功能整个是很强大 支持的操作 create 支持ctas 以及普通的create 操作 ctas   create table mys3.demoapp.dalongtest as select * from pg.public.demoapp

  • dremio 22 变动体验2022-06-30 01:00:25

    主要是验证下官方发布 ctas iceberg 成为默认         iceberg dml 操作 比如update, 真的比较强大了         sql 自动提示 是更加友好了     arrow cache 废弃了     支持对于table 添加主键     说明 以上只是简单的测试,详细的其他功能打开可以测试,目前来

  • 李呈祥:bilibili在湖仓一体查询加速上的实践与探索2022-06-15 12:03:31

    导读: 本文主要介绍哔哩哔哩在数据湖与数据仓库一体架构下,探索查询加速以及索引增强的一些实践。主要内容包括: 什么是湖仓一体架构 哔哩哔哩目前的湖仓一体架构 湖仓一体架构下,数据的排序组织优化 湖仓一体架构下,索引增强与优化的实践探索 -- 01 什么是湖仓一体 当我们讲湖仓一

  • 大数据时代,数据湖技术Apache Iceberg的前世今生2022-03-21 09:01:59

    一种技术,从出现到广泛的使用,有着他与生俱来的天性,同样有后天物竞天择适者生存的妥协。 大数据时代,数据湖技术的广泛应运,有不同技术流派的剧烈碰撞,也有不同技术流派的相互学习。当下,数据湖技术天下三分,各有侧重,但它来自哪里,要去往何处,优势在哪里,需要补强的又是什么? 其他的姑且不

  • Flink读取Iceberg数据2022-03-20 13:01:40

    1.依赖 参考:https://iceberg.apache.org/docs/latest/flink/#reading-with-datastream <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</artifactId> <version>1.12.0</version>

  • Apache Iceberg 0.13 特性介绍-Flink/Spark新版本支持、增量删除等特性来袭2022-02-23 15:59:52

    来源 | https://tabular.io/blog/whats-new-in-iceberg-0.13/ 作者 | Ryan Blue (Apache Iceberg PMC) 翻译 | liliwei Apache Iceberg 社区刚刚发布了 0.13 版,其中有很多很棒的新增功能!在这篇文章中,我将介绍一些本版本的亮点功能。 完善对多个引擎支持 Iceberg 0.13 增加了对

  • 数据湖Delta、Hudi、Iceberg 在实际应用中的对比选型2022-02-10 12:34:30

    Hudi 先说 Hudi。Hudi 的设计目标正如其名,Hadoop Upserts Deletes and Incrementals(原为 Hadoop Upserts anD Incrementals),强调了其主要支持 Upserts、Deletes 和 Incremental 数据处理,其主要提供的写入工具是 Spark HudiDataSource API 和自身提供的 DeltaStreamer,均支持三

  • 【笔记】Apache Iceberg 原理介绍 | 阿里云 x StarRocks社区联合Meetup2022-02-04 16:59:46

    Iceberg是为了解决Hive上云诞生的一个工具 强烈推荐看下这篇学习日志,看下iceberg如何读写,实际如何使用?同时,了解下Hive的架构 Apache Iceberg 学习日志 https://xie.infoq.cn/article/61a82b983ef97c3e05a6e7d82 Hive架构,Metadata-store是什么? 存储了哪些信息? 有什么优化

  • Iceberg(三)对接Flink2022-01-20 23:32:03

    1、Flink基本操作 1.1、配置参数和jar包         Flink1.11开始就不在提供flink-shaded-hadoop-2-uber的支持,所以如果需要flink支持hadoop得配置环境变量HADOOP_CLASSPATH [root@hadoop1 flink-1.11.0]# vim bin/config.sh export HADOOP_COMMON_HOME=/opt/module/hado

  • Iceberg学习日记(1) 定位两个线上Iceberg查不到文件的问题2022-01-20 12:31:06

    前言 Iceberg是我们去年年底(2020)开始调研,目前上线了130多张表。主要用于流量日志清洗,数据报表,推荐特征基础数据。至今为也算是积累了一些使用及定位问题经验。 这篇文章会介绍两个线上Iceberg表查不到数据/快照文件的问题,希望对大家有帮助。 一.Rewrite操作有可能会误删数据文

  • Delta, Hudi, Iceberg对比2022-01-19 19:58:49

    概述 Delta商业版功能相对完善, 是由Databricks主推其他计算引擎的优先级是弱于Spark的并且付费, 社区版是商业版的简化, 功能支持没有商业版完善, 适合Spark为核心技术组件的公司.Hudi同样紧耦合Spark功能相对比较完善,但是扩展性比较差, 使用其他计算引擎的话开发工作量较

  • iceberg数据读取流程2021-11-29 18:00:48

        假设我们的表是存储在 Hive 的 MetaStore 里面的,表名为 iteblog,并且数据的组织结构如上如所示。 1.查询最新快照的数据 •通过数据库名和表名,从 Hive 的 MetaStore 里面拿到表的信息。从表的属性里面其实可以拿到 metadata_location 属性,通过这个属性可以拿到 iteblog 表的

  • Iceberg概述2021-11-05 18:02:00

    背景 随着大数据领域的不断发展, 越来越多的概念被提出并应用到生产中而数据湖概念就是其中之一, 其概念参照阿里云的简介: 数据湖是一个集中式存储库, 可存储任意规模结构化和非结构化数据, 支持大数据和AI计算.数据湖构建服务(Data Lake Formation, DLF)作为云原生数据湖架构核心

  • 还不知道什么是Iceberg?一篇文章带你走进Iceberg的世界!2021-07-15 12:00:40

    文章目录 1. Iceberg是什么?2. Iceberg能力与优势3. Iceberg能力验证3.1 Time travel3.2 table evolution 4. Iceberg应用场景参考文档 近年来“数据湖”的概念在大数据领域如火如荼。delta、Apache Iceberg和Apache Hudi是市面上流行的三大数据湖解决方案,那到底这些方案

  • 汽车之家:基于 Flink + Iceberg 的湖仓一体架构实践2021-07-02 12:02:00

    摘要:由汽车之家实时计算平台负责人邸星星在 4 月 17 日上海站 Meetup 分享的,基于 Flink + Iceberg 的湖仓一体架构实践,内容包括:   数据仓库架构升级的背景 基于 Iceberg 的湖仓一体架构实践 总结与收益 后续规划     一、数据仓库架构升级的背景   1. 基于 Hive 的数据

  • Flink + Iceberg 在去哪儿的实时数仓实践2021-06-14 23:32:48

    一、背景及痛点 背景 我们在使用 Flink 做实时数仓以及数据传输过程中,遇到了一些问题:比如 Kafka 数据丢失,Flink 结合 Hive 的近实时数仓性能等。Iceberg 0.11 的新特性解决了这些业务场景碰到的问题。对比 Kafka 来说,Iceberg 在某些特定场景有自己的优势,在此我们做了一些基

  • Impala 3.4 在网易的最新实践2021-06-14 10:56:16

      导读:Impala是Cloudera公司主导开发的交互式查询系统,它提供SQL语义和计算能力,但是本身并不存储数据。本次分享会聚焦于Impala在网易内部的一些新实践,以及基于Impala 3.4版本所做的优化和改进。 主要会围绕以下四点展开: Impala定位及使用 Impala对接Iceberg Impala管理系统

  • 数据湖解决方案关键一环,IceBerg会不会脱颖而出?2021-06-12 07:05:15

    点击上方蓝色字体,选择“设为星标” 回复”资源“获取更多资源 小编在之前的详细讲解过关于数据湖的发展历程和现状,《我看好数据湖的未来,但不看好数据湖的现在》 ,在最后一部分中提到了当前数据湖的解决方案中,目前跳的最凶的三巨头包括:Delta、Apache Iceberg 和 Apache Hudi。 本

  • 数据湖解决方案关键一环,IceBerg会不会脱颖而出?2021-06-12 07:05:05

    点击上方蓝色字体,选择“设为星标” 回复”资源“获取更多资源 小编在之前的详细讲解过关于数据湖的发展历程和现状,《我看好数据湖的未来,但不看好数据湖的现在》 ,在最后一部分中提到了当前数据湖的解决方案中,目前跳的最凶的三巨头包括:Delta、Apache Iceberg 和 Apache Hudi。 本

  • Data Lake 三剑客—Delta、Hudi、Iceberg 对比分析2021-06-11 23:52:04

    本文来源于云栖社区:https://yq.aliyun.com/articles/743514作者:xy_xin 共同点 定性上讲,三者均为 Data Lake 的数据存储中间层,其数据管理的功能均是基于一系列的 meta 文件。meta 文件的角色类似于数据库的 catalog/wal,起到 schema 管理、事务管理和数据管理的功能。与数据库不同的

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有