上瘾
发布于

LittleBoy最佳实践样例:特征工程算子介绍

上一节我们讲到了 LittleBoy 可视化机器学习建模平台中的数据处理算子,数据处理算子主要涉及数据预处理过程中的数据清洗和数据集成,而数据预处理过程中的另一部分——特征工程则由特征工程模块下相关的算子来实现,如数据规约和数据变换。接下来我们以新的特征工程实例演示特征工程算子的使用。

本次演示使用的数据如下,将其拖入画布中,作为数据输入

1.特征分箱

1.1 选择特征工程模块下的离散化算子,配置算子对数据集中的 unit_price 字段进行分箱,分箱方法选择分位数离散化

1.2 在离散化算子之后接入预览数据,来进行结果预览,运行画布,等待运行完成

1.3 运行完成后双击预览算子查看分箱结果如下所示,分箱已完成

2.归一化

2.1 同样的,我们在上面的元数据接入归一化算子,配置归一化字段 quantity,设置阈值

2.2 归一化算子之后接入预览算子,运行画布

2.3 下图为运行完成之后的结果,已完成 quantity 字段的归一化

评论
    test