上瘾
发布于

LittleBoy最佳实践样例:在画布中使用已训练好的模型对数据进行预测评估

上节我们讲到了如何在 LittleBoy 可视化机器学习建模平台画布中进行模型训练和预测评估,而模型完成之后会自动持久化保存到平台中,供我们后期做模型调用、模型比较、模型版本迭代等操作。下面来简单演示一下如何在画布中调用已训练好的模型对数据进行预测和评估。

1.本次调用的模型为上节训练好的多分类模型,使用该模型对 iris_test 数据集进行预测

下图为模型详情和数据集预览


1.1 从机器学习模块下拖动预测算子连接模型和数据集,连接之后打开预测算子进行配置,模型中有记录特征字段,会自动匹配进行预测

1.2 预测算子之后接入多分类评估算子,对预测结果进行评估,验证模型效果

1.3 整体流程如图所示,点击运行画布

1.4 如图,画布已运行完成,接下来我们就可以查看运行结果

1.5 点击预览算子即可查看模型对 iris_test 数据集的预测结果

1.6 点击多分类评估算子,查看对测试数据集预测结果的评估值



以上就是在 LittleBoy 可视化机器学习建模平台画布中使用已训练好的模型对数据进行预测评估的流程。

评论(4)
  • zdsg
    zdsg 回复
    罗名岳 罗名岳 2022-01-18 10:12:25

    手动补充自动导入示例数据步骤(执行前先停止 LB standby,仅在 LB master 节点的命令行里操作)
    1、cd /usr/local/oushu/littleboy/note/sampledata/
    2、执行下列四条语句,其中的”1“和”postgres“分别代表要插数据的数据源 ID 和 DB 名
    sed -i "s @@DBCluster@@ 1 g" demo_workflow.sql
    sed -i "s @@DBDataBase@@ postgres g" demo_workflow.sql
    sed -i "s @@DBCluster@@ 1 g" public_dataset.xml
    sed -i "s @@DBDataBase@@ postgres g" public_dataset.xml

    sed -i "" "s @@DBCluster@@ 9 g" demo_workflow.sql
    sed -i "" "s @@DBDataBase@@ testimport g" demo_workflow.sql
    sed -i "" "s @@DBCluster@@ 9 g" public_dataset.xml
    sed -i "" "s @@DBDataBase@@ testimport g" public_dataset.xml

    3、找到 OushuDB master 所在机器,建立/tmp/sampledata 文件夹
    4、 复制 LB 目录下的 CSV、SQL 后缀文件到 OushuDB 所在的机器 执行 importdata.sql (psql postgres -U gpadmin -f /tmp/sampledata/importdata.sql)
    5、在 LittleBoy 页面中,删除“公共数据集”里面的全部 7 条数据,删除“可视化建模”页面中“流程模板”里全部 2 个流程
    6、重启 LittleBoy Master 节点
    7、如果导入成功,就可以将”可视化建模“页面中”流程模板“复制一份并顺利执行

    好的,感谢哈~

  • 罗名岳
    罗名岳 回复
    zdsg zdsg 2022-01-18 10:06:03

    机器学习的预先准备的数据集,比如鸢尾花数据集等,怎么导入呀,我看 lava 管理平台有新建集群选中导入数据集的 tab,但是最终创建好集群没有效果

    手动补充自动导入示例数据步骤(执行前先停止 LB standby,仅在 LB master 节点的命令行里操作)
    1、cd /usr/local/oushu/littleboy/note/sampledata/
    2、执行下列四条语句,其中的”1“和”postgres“分别代表要插数据的数据源 ID 和 DB 名
    sed -i "s @@DBCluster@@ 1 g" demo_workflow.sql
    sed -i "s @@DBDataBase@@ postgres g" demo_workflow.sql
    sed -i "s @@DBCluster@@ 1 g" public_dataset.xml
    sed -i "s @@DBDataBase@@ postgres g" public_dataset.xml

    sed -i "" "s @@DBCluster@@ 9 g" demo_workflow.sql
    sed -i "" "s @@DBDataBase@@ testimport g" demo_workflow.sql
    sed -i "" "s @@DBCluster@@ 9 g" public_dataset.xml
    sed -i "" "s @@DBDataBase@@ testimport g" public_dataset.xml

    3、找到 OushuDB master 所在机器,建立/tmp/sampledata 文件夹
    4、 复制 LB 目录下的 CSV、SQL 后缀文件到 OushuDB 所在的机器 执行 importdata.sql (psql postgres -U gpadmin -f /tmp/sampledata/importdata.sql)
    5、在 LittleBoy 页面中,删除“公共数据集”里面的全部 7 条数据,删除“可视化建模”页面中“流程模板”里全部 2 个流程
    6、重启 LittleBoy Master 节点
    7、如果导入成功,就可以将”可视化建模“页面中”流程模板“复制一份并顺利执行

  • zdsg
    zdsg 回复

    机器学习的预先准备的数据集,比如鸢尾花数据集等,怎么导入呀,我看 lava 管理平台有新建集群选中导入数据集的 tab,但是最终创建好集群没有效果

test