ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

业务人员可以进行自助ETL操作?这款BI工具你值得拥有

2020-11-30 23:33:13  阅读:227  来源: 互联网

标签:数据源 BI 自助 Smartbi 业务人员 数据 节点 ETL


​ETL是什么?

ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL是BI项目中重要的一个环节,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据模型,将数据加载到数据仓库中去,为后续的数据分析提供数据支撑。

市场面上大多BI工具都不含ETL功能,在进行数据分析项目时,通常会用到BI、ETL两个工具,成本高、花费时间长。而Smartbi推出可视化ETL功能,通过简单的拖拽就可以完成ETL过程。ETL通常是将多来源的异构数据,进行处理后得到具备完整性、一致性的数据模型。

我们将从Smartbi中的自助ETL的应用场景入手,带你了解使用自助ETL是如何高数据的质量!

自助ETL场景应用

操作步骤

1、在Smartbi系统主界面的快捷菜单中选择 数据准备 > 自助ETL,进入“自助ETL”管理界面。

图片27.png

2、在“自助ETL”管理界面中,选择 新建自助ETL 按钮,进入“新建ETL”定制界面。

图片28.png

3、在此界面可以设计定制ETL工作流。

图片29.png

数据源

1、将关系数据源节点拖入画布区,在节点配置区设置关系数据源的参数。

图片30.png

2、在关系数据源上右键选择 执行到此处 ,运行当前节点。

图片31.png

3、点击查看输出,可查看关系数据源节点输出的数据,如下:

图片32.png

将表的数据导入当前工作流完成,下面对数据进行 数据预处理 

数据预处理

需要在表中添加序号,并去除采购金额字段的小数位。

1、将增加序列号节点拖入画布区,连接两个节点,设置序列列名称。

图片33.png

2、将派生列节点拖入画布区,连接两个节点。在节点配置区选择 派生列配置 按钮。

图片34.png

3、将对应函数和字段分别拖入添加/编辑表达式区,点击 确定 按钮,添加一条“采购金额取整”的派生列。

图片35.png

4、在派生列节点上右键,选择 执行到此处  ,运行当前节点派生列节点输出的数据如下:

图片36.png

数据预处理完成,下面将处理好的数据输出。

目标源

将处理好的数据输出成一张新的表。

1、将关系目标源家待拖入画布区,选择输出表的数据源、SCHEMA,并选择 新建表 按钮。

图片37.png

2、新的表命名为“产品销售数据表”,点击 创建表 按钮。

图片38.png

3、点击 运行 按钮,创建一张新的表。

图片39.png

流程运行完成后,关系目标源节点输出的数据如下:

图片40.png

 

一般情况下,ETL过程设计是需要用到大量的代码,且重复利用率较低。但Smartbi的自助ETL功能充分结合大量项目人员实施习惯,操作敏捷易用,通过封装ETL算法,将技术分离,以数据源——数据预处理——目标源的形式,实现业务人员进行自助ETL操作。Smartbi自助ETL的主要应用场景是将多来源的异构数据,进行处理后得到具备完整性、一致性的数据模型。使用自助ETL可以提高数据的质量、适应不同的数据分析方法。

标签:数据源,BI,自助,Smartbi,业务人员,数据,节点,ETL
来源: https://www.cnblogs.com/mingyueshuoshuju/p/14065609.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有