- 发布于2021-12-08 18:34:42
LittleBoy最佳实践样例:SQL算子介绍
在对数据进行预处理的过程中,我们可能需要根据需求对数据进行各种操作,而现有的数据处理算子不一定能满足我们的处理需求,此时我们就可以使用 SQL 算子自定义 SQL 进行数据处理,SQL 算子完全支持 SQL 相关的语法,可简单灵活的进行数据处理操作,方便工...赞 3评论 2浏览 1465 - 发布于2021-12-09 12:24:54
LittleBoy最佳实践样例:数据处理算子介绍
熟悉数据挖掘和机器学习的小伙伴们都知道,数据处理相关的工作时间占据了整个项目 70% 以上。数据的质量,直接决定了模型的预测和泛化能力的好坏。它涉及很多因素,包括:标准型、完整性、一致性、时效性、可信性和解释性。而在真实数据中,我们拿到的数据可能包含了大量...赞 1评论浏览 1273 - 发布于2021-12-08 10:35:48赞 2评论 2浏览 1210
- 发布于2021-12-02 15:32:20
4.1. safe mode
➢ 分析 当收到来自 datanode 的状态报告后,namenode 根据配置,确定 可用的 block 占总数的比例。 可用的数据节点数量符合要求之后,离开安全模式。 ➢ 解答 如果有必要,也可以通过命令强制离开安全模式:hadoop dfsadmi...赞 1评论浏览 963 - 发布于2021-12-02 15:32:02
4.2. zookeeper listener port起不来
➢ 解答 zookeeper 配置文件用的 hostname,在/etc/hosts 里 hostname 被 resolve 成 127.0.0.1,需要让 hostname 能被正确 resolve 成内部 ip 地址赞评论浏览 1021