ICode9

精准搜索请尝试: 精确搜索
  • Dinky实时计算平台2022-08-13 16:02:32

    前言:Apache Flink 作为新一代的实时计算框架已经被应用到各个行业与领域,其岂存在着应用的痛点比如 FlinkSQL 在线IDE、作业提交不友好、作业无监控报警等。很大程度上说,FlinkSQL 加快了 Flink 的应用推广,而开源项目 Dinky 改善了 Flink 的部分痛点问题来优化 FlinkSQL 应用体验。

  • Apache Dolphinscheduler3.0.0-beta-1 版本发布,新增FlinkSQL、Zeppelin任务类型2022-06-15 16:02:32

    导读:近日,Apache Dolphin Scheduler 迎来了 3.0.0-beta-1 版本的正式发布。新版本主要针对 3.0.0-alpha 进行了代码和文档的修复,并引入了部分的功能,如支持 FlinkSQL 任务类型,新增 Zeppelin 任务类型,新增 Kubernetes namespace 管理功能,以及通过 bash 传参功能等,具体更新详见下文。

  • FlinkSQL 之乱序问题2022-06-10 00:01:23

    乱序问题 在业务编写 FlinkSQL 时, 非常常见的就是乱序相关问题, 在出现问题时,非常难以排查,且无法稳定复现,这样无论是业务方,还是平台方,都处于一种非常尴尬的地步。 在实时 join 中, 如果是 Regular Join, 则使用的是 Hash Join 方式, 左表和右表根据 Join Key 进行hash,保证具有相同 Joi

  • 新一代 FlinkSQL 平台,重新定义 Apache Flink 开发2022-01-26 19:05:41

    新一代 FlinkSQL 平台,重新定义 Apache Flink 开发 前言 Dinky 0.5.1 已发布,它将重新定义 Apache Flink 的开发运维,让其如虎添翼,降本增效。 现状 Flink Forward Asia 2021 刚刚结束,从 Apache Flink 中文社区发起人、阿里巴巴开源大数据平台负责人王峰(花名莫问)老师得知 Apache

  • FlinkSQL实践 -- 时态表/版本表2022-01-24 18:00:21

    1. 背景 在FlinkSQL关联时,必然会涉及到维表,维表又可能是不断变化的(aka 时态表 或 版本表)。 版本表: 如果时态表中的记录可以追踪和并访问它的历史版本,这种表我们称之为版本表,来自数据库的 changelog 可以定义成版本表。 普通表: 如果时态表中的记录仅仅可以追踪并和它的最新版本,这

  • flinksql 解析学习2022-01-23 15:02:19

    Flink sql 之sql 解析篇: 1.主要是为了实现 利用flink 原生引擎去解析sql 生成语法树,打印日志信息便于去维护。 2.flink解析之Calcite和sql 解析过程 sql 解析阶段:calcite parser 解析(sql -> AST,AST 即 SqlNode Tree) SqlNode 验证阶段:calcite validator 校验(SqlNode -> SqlNod

  • FlinkSQL实践记录22022-01-23 12:01:38

    1. 背景 昨天《FlinkSQL实践记录1》对FlinkSql做了简单的使用insert into .. select ..,今天对聚合运算做一些实践。 2. 代码实践 String mysql_sql = "CREATE TABLE mysql_sink (" + " name STRING," + " cn

  • FlinkSQL实践记录2022-01-22 17:31:18

    1.背景 Flink目前在国内发展的火热,笔者在2018首次接触了flink之后,总是在官网/公众号各个地方追踪它的新动态,但一直没机会在生产上使用,近期有流式计算的需求,且目前企业对计算的实时性也要求越来越高,今天先在本地环境测试一把。测试把kafka中数据通过flink处理后写入mysql。 环境: j

  • Day79_Flink(五) FlinkSQL和CEP2021-11-08 21:59:12

    课程大纲 课程内容 学习效果 掌握目标 FlinkSQL FlinkTable 掌握 FlinkSQL 掌握 FlinkCEP FlinkCEP 掌握 任务性能优化 operator chain 掌握 slot sharing 掌握 Flink异步IO 掌握 Checkpoint 优化 掌握 一、Table&SQL (一)概述 Table API是

  • 95-910-332-源码-FlinkSQL-Calcite-Flink SQL 整体执行框架2021-10-12 20:30:23

    文章目录 1.美图 2.概述 3.背景知识 4.可插拔的 SQL Runner 4.1 `Planner` 接口 4.2 `Executor` 接口 4.3 Blink Runner 4.3.1 SQL 解析 4.3.2 SQL 转换及优化 4.3.3 SQL 执行 1.美图 2.概述 ​ 在数据处理领域,无论是实时数据处理还是离线数据处理,使用 SQL 简

  • FlinkSQL自定义函数(UDF)维表转换2021-09-07 14:02:02

    前言 Table和SQL的关系:SQL是Table的继承封装(这点在Flink的概念有所体现),比如说:StreamTableEnvironment继承自TableEnvironment便可体现出来。故官文中Table的使用均可在SQL中体现出来,比如说自定义函数,Table API & SQL下的自定义函数中只给出了Table方式的TableEnvironment 创

  • 修改flinksql已经定义表的表结构2021-07-06 20:57:31

    flink版本:1.13.1 方案一:使用sql-client Flink SQL> set table.sql-dialect=default; Flink SQL> alter table `hive`.`default`.ods_dsp_kafka set('flink.connector.startup-mode'='timestamp'); 如果要新增字段,必须同时添加name和data-type,不然会导致表损坏,这个时候要用 hiv

  • FlinkSQL流表与维表join 和 双流join2021-07-06 10:33:39

    维表是数仓中的一个概念,维表中的维度属性是观察数据的角度,补充事实表的信息。在实时数仓中,同样也有维表与事实表的概念,其中事实表通常为kafka的实时流数据,维表通常存储在外部设备中(比如MySQL,HBase)。对于每条流式数据,可以关联一个外部维表数据源,为实时计算提供数据关联查询

  • Flink通过Catalog连接hive,使用FlinkSQL进行读写2021-07-02 14:59:15

    一、Flink1.13安装 1、官网下载链接 https://flink.apache.org/zh/downloads.html#apache-flink-1131 2、拷贝压缩包到服务器里解压 tar -xvf flink-1.13.1-bin-scala_2.12.tgz 3、进入flink的conf目录,对flink-conf.xml进行配置(本次测试以单机standalone部署) rest.address =

  • FlinkSQL演进过程,解析原理及一些优化策略2021-06-13 21:52:42

    本文整理自Flink Forward 全球在线会议 ,演讲者云邪,由浪尖整理。 1. Flink table/sql架构演变 flink 1.9之前的版本,对于Table API和SQL的底层实现结构如下图,可以看处流处理和批处理有各自独立的api (流处理DataStream,批处理DataSet)。而且有不同的执行计划解析过程,codegen过程也完

  • FlinkSql功能测试及实战演练2021-05-12 17:58:30

    FlinkSql功能测试及实战演练 前言:Flink在国内的占有率逐步提升的情况下,各项组件的功能与稳定性也得到逐步提升。为了解决目前已有的复杂需求,尝试研究flinksql的特性与功能,作为是否引入该组件的依据。同时尝试将现有需求通过简单demo的形式进行测试。本次测试主要集中在Kafka

  • FlinkSQL写入hive2021-05-06 18:02:53

    配置1:vim flink-conf.yml 流式写入hive需要配置检查点 # state.backend: filesystem state.backend: filesystem # 取消的时候保存检查点 execution.checkpointing.externalized-checkpoint-retention: RETAIN_ON_CANCELLATION # 60s 一次检查点 execution.checkpointing.interva

  • flinksql写入hudi 踩坑实录2021-04-08 15:34:35

    flinksql写入hudi 测试环境: Flink 1.11.1 hudi 0.8.0 Hadoop 3.0.0 Hive 2.1.1 准备工作: 1.安装flink 1.11.1,要下载带hadoop版本的; 2.下载hudi-flink-bundle_2.1?.jar,并放入$FLINK_HOME/lib下。下载地址: https://repo.maven.apache.org/maven2/org/apache/hudi/hudi-

  • FlinkSQL中的回退更新-Retraction2021-04-04 19:52:06

    FlinkSQL中的回退更新-Retraction 群主王知无 大数据技术与架构 前言 如果你在使用FlinkSQL时出现如下的报错: Table is not an append-only table. Use the toRetractStream() in order to handle add and retract messages. 那么你就有必要了解一下Flink中的回退更新。 简介

  • DWS 层-关键词主题表(FlinkSQL)2021-03-23 21:01:05

    1.1、需求分析与思路   关键词主题这个主要是为了大屏展示中的字符云的展示效果,用于感性的让大屏观看者,感知目前的用户都更关心的那些商品和关键词。   关键词的展示也是一种维度聚合的结果,根据聚合的大小来决定关键词的大小。   关键词的第一重要来源的就是用户在搜

  • FlinkSQL演进过程,解析原理及一些优化策略2021-03-15 12:04:21

    FlinkSQL演进过程,解析原理及一些优化策略 云邪 浪尖聊大数据 本文整理自Flink Forward 全球在线会议 ,演讲者云邪,由浪尖整理。 1. Flink table/sql架构演变 flink 1.9之前的版本,对于Table API和SQL的底层实现结构如下图,可以看处流处理和批处理有各自独立的api (流处理DataStream,批

  • FlinkSql中窗口(window)的使用2021-03-12 23:03:40

    FlinkSql中窗口(window)的使用 目录 FlinkSql中窗口(window)的使用一、Table API中使用窗口Group WindowsOver Windows 二、SQL API中使用窗口Group WindowsOver Windows 时间语义,要配合窗口操作才能发挥作用。最主要的用途,当然就是开窗口然后根据时间段做计算了。 在T

  • 五千字长文带你快速入门FlinkSQL2021-01-20 11:35:44

    一、前言         最近几天因为工作比较忙,已经几天没有及时更新文章了,在这里先给小伙伴们说声抱歉…临近周末,再忙再累,我也要开始发力了。接下来的几天,菌哥将为大家带来关于FlinkSQL的教程,之后还会更新一些大数据实时数仓的内容,和一些热门的组件使用!希望小伙伴们能点个关注

  • 干货 | 五千字长文带你快速入门FlinkSQL2021-01-19 22:32:42

    一、前言         最近几天因为工作比较忙,已经几天没有及时更新文章了,在这里先给小伙伴们说声抱歉…临近周末,再忙再累,我也要开始发力了。接下来的几天,菌哥将为大家带来关于FlinkSQL的教程,之后还会更新一些大数据实时数仓的内容,和一些热门的组件使用!希望小伙伴们能点

  • Flink编码:FlinkSQL全面指南2020-11-25 12:02:23

    文章目录 1. FlinkSQL定位2. 流与表的对偶性3. 持续查询/增量计算4. 回撤流5. Flink 1.11关于SQL的增强5.1 DDL写法5.2 主键5.3 Catalog 6. JOIN算子6.1 双流JOIN原理6.1.1 Inner Join6.1.2 Left Join6.1.3 State数据结构 7. 窗口7.1 OverWindow7.1.1 基于数据条目的overw

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有