ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

使用Kettle实现不同数据之间同步

2022-05-31 22:33:28  阅读:163  来源: 互联网

标签:同步 JDK 配置 Kettle 数据 双击


Contents

  • 1. 概述
  • 2. 软件安装
  • 3. 典型场景:Oracle-2-SqlServer
  • 4. 定期自动同步数据

1. 概述

Kettle是一个久负盛名的ETL数据传输工具,在我们接触过的许多IT企业中,几乎都有不同的开发或运维团队在使用这个工具。
Azure DevOps Server中存储着大量的开发过程数据,如果对于开发过程数据进行度量分析,为了避免大量读取实时库(AzureDevOps_DefaultCollection)导致性能问题,我们通常需要将实时数据库或清洗后数据仓库中的数据传输给第三方平台,实现数据分析和挖掘;为了完成这个数据传输功能,经过多方验证后,发现Kettle是一个比较理想的数据传输工具。本文主要介绍Kettle的基本使用场景。

2. 软件安装

  1. 配置Java环境:
    Kettle是一个开源软件,并且运行在Java环境中,如果需要在Windows系统中运行Kettle,一般需要安装JDK;在配置JDK的过程中,我们发现如果使用绿色版本的JDK配置环境变量后,Kettle是不能正常运行的,系统会提示找不到javaw的错误,因此建议用户下载JDK的Windows安装程序完成Java环境的配置。
  2. 下载Kettle程序包
    可以从官方完整http://www.kettle.be/中下载程序包,解压缩后就可以直接运行,无需安装
    image

3. 典型场景:Oracle-2-SqlServer

  1. 新建一个转换;在kettle中,转换实际上就是完成一个特定传输任务的脚本文件
    image
    选择表输入;表输入是指数据来源:
    image
    双击表输入,定义源数据库的连接:
    image
    Oracle的数据连接,一般都使用连接字符串,如下示意图:
    image

  2. 新建输出”插入/更新“
    插入/更新是指数据更新类型的同步,kettle可以按照主键更新数据;它可以实现对不存在的数据的就插入,已经存在的就更新;
    image
    双击输出信息,可以设置目标数据库的信息,例如数据库连接、主键、同步的字段等:
    image

  3. 运行数据同步
    配置完成后,我们可以点击运行按钮,数据就会从Oracle中同步到SQL Server了:
    image

4. 定期自动同步数据

在不同系统之间同步数据,我们一般都要求定期执行,尽量减少认为的工作。
Kettle中的作业功能,就是为了专门实现自动定期同步的。当我们将前面配置的转换存储为一个扩展名为ktr的文件后,就可以在配置一个作业流程,调用转换,并配置好定期运行的功能。下面我们来看一下作业的基本操作。

  1. 在Kettle中,新建一个作业文件
    image
  2. 配置作业
    从核心对象页签中拖住Start、转换、成功到编辑页面中
    image
    双击Start配置定时信息;
    双击转换选择前面已经配置的脚本文件;
    点击顶部的运行按钮,一个定时任务就启动起来了。

https://www.cnblogs.com/danzhang
Azure DevOps MVP 张洪君
在这里插入图片描述

标签:同步,JDK,配置,Kettle,数据,双击
来源: https://www.cnblogs.com/danzhang/p/16332547.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有