Eason
发布于

关于SQL监控

偶数数据云平台,不止可以监控系统的指标,也可以监控 SQL 的执行,包括有哪些 SQL 在执行,SQL 的执行历史,SQL 执行过程中各个时间点对资源(CPU、内存等)的占用情况。
因为 SQL 监控必然会占用一定的资源,对性能有少许的影响,所以默认这个功能是关闭的,如果想使用这个功能,需要打开如下配置文件 SQL 监控的开关。
1:登录偶数数据云平台 Lava 的节点,编辑/usr/local/oushu/lava-cloud/conf/basicPrivate.config.xml,设置参数为 true,保存。

      <Sqlrs>
        <monitorSql>false</monitorSql>
        <liveInterval>10</liveInterval>
        <historyInterval>60</historyInterval>
        <historyExpired>60</historyExpired>
    </Sqlrs>

2:重启 Lava。用 root 用户执行如下命令:

lava stop master
lava start master

3:登录偶数数据云平台页面,在 OushuDB/SQL 监控页面,可以查看 SQL 运行的情况。

4:点击某一条 SQL 可以查看某一条具体的 SQL 的监控指标,包括对整个集群的资源占用,对具体某节点的资源占用,起了多少个进程等等。

评论(7)
  • zdsg
    zdsg 回复

  • zdsg
    zdsg 回复
    Eason Eason 2022-01-19 14:45:37

    比如三个节点,本 SQL 在节点 1 上占用 220% 的 CPU,在第二个节点 100% 的 CPU,在第三个节点上占用 130% 的 CPU。那么本 SQL 集群总 CPU 占用=(220%+100%+130%)/3 = 150%

    嗯嗯,理解了,那这个参数有什么实际意义?

  • Eason
    Eason 回复
    Eason Eason 2022-01-19 14:41:14

    总逻辑 CPU 指在整个集群(比如 32 个节点)上,本 SQL 执行时所占用的每一台机器的逻辑 CPU 的总数除以集群节点数。相当于平均到每一个节点上本 SQL 所占用的 CPU 的数目。

    比如三个节点,本 SQL 在节点 1 上占用 220% 的 CPU,在第二个节点 100% 的 CPU,在第三个节点上占用 130% 的 CPU。那么本 SQL 集群总 CPU 占用=(220%+100%+130%)/3 = 150%

  • Eason
    Eason 回复
    zdsg zdsg 2022-01-18 18:55:01

    这里监控页面显示的正在执行的 SQL 的总逻辑 CPU 超过了 100%,这个总逻辑 CPU 是什么含义呢?

    总逻辑 CPU 指在整个集群(比如 32 个节点)上,本 SQL 执行时所占用的每一台机器的逻辑 CPU 的总数除以集群节点数。相当于平均到每一个节点上本 SQL 所占用的 CPU 的数目。

  • Eason
    Eason 回复
    亚平宁的眼泪 亚平宁的眼泪 2022-01-18 17:06:54

    看起来很不错,听说最近在开发新的云平台的监控,是否对现有的 SQL 监控进行了优化?

    无论是监控的准确度还是可视化,都有本质的提升,因为 OushuDB 底层会做 SQL 监控的支撑,对资源使用的监控可以精确到小数点后 5 位数。

  • zdsg
    zdsg 回复

    这里监控页面显示的正在执行的 SQL 的总逻辑 CPU 超过了 100%,这个总逻辑 CPU 是什么含义呢?

  • 亚平宁的眼泪
    亚平宁的眼泪 回复

    看起来很不错,听说最近在开发新的云平台的监控,是否对现有的 SQL 监控进行了优化?

test