上瘾
发布于

LittleBoy最佳实践样例:SQL算子介绍

在对数据进行预处理的过程中,我们可能需要根据需求对数据进行各种操作,而现有的数据处理算子不一定能满足我们的处理需求,此时我们就可以使用 SQL 算子自定义 SQL 进行数据处理,SQL 算子完全支持 SQL 相关的语法,可简单灵活的进行数据处理操作,方便工程、业务人员在画布中进行可视化数据处理。接下来,我们提供几个示例来展示 SQL 算子的简单用法。

1.合并数据集(union)流程

示例数据如下,准备 demo_0、demo_1 两份数据,将其拖入画布中

数据详情如图所示

1.1 接下来,拖动 SQL 算子连接两个数据集,编写合并数据集 SQL 语句

1.2 画布中的流程展示如图,点击运行画布

1.3 运行完成后点击预览算子,即可看到 SQL 的运行结果,对两个数据集进行了合并操作,合并结果如图

2.去重并计数流程

示例数据集详情如图,将其拖入画布

2.1 准备数据集 demo_0, 拖动 SQL 算子连接数据集,编写去重计数算子对 sku 字段进行去重

2.2 画布中的流程展示如图,点击运行画布

2.3 点击预览算子,即可看到 SQL 的运行结果,对 sku 字段去重之后计数结果为 9,而原数据总数为 10

以上就是对于 LittleBoy 可视化建模平台 SQL 算子的使用介绍,下一节我们为大家介绍如何使用 LittleBoy 数据处理算子

评论(2)
test