偶小梦
发布于

OushuDB中如何进行硬件及操作系统监控

OushuDB 中如何进行硬件及操作系统监控

评论(1)
  • 偶小梦
    偶小梦 回复

    方法: 检查操作系统,网络以及磁盘状态,以及磁盘剩余空间。
    推荐频率 : 每隔 30 分钟
    发现问题解决方法
    如果发现操作系统,网络及磁盘出现异常,需要修复问题,然后重新加入该节点。

    如果磁盘剩余空间不足 30% 的话,需要准备系统扩容。否则容易出现磁盘空间不足情况。因为有些 SQL 在运行过程中需要使用临时存储空间来存放中间结果。

    如果发现性能问题,建议运行 hawq checkperf 命令来查看性能问题。例如下面的硬件配置,

    12 15K RPM SAS 盘,2 RAID 卡, RAID 0
    2 dual-port 10Gb NICs (NIC bonding)
    正常情况下,有如下性能指标:

    I/O 读写: 2GB/s
    网络性能:2GB/s
    统计信息维护

    方法: 通过执行下面的命令检查没有进行 Analyze 的表,即没有统计信息的表,没有搜集统计信息可能产生不优化的查询计划,带来性能问题。
    SELECT * FROM hawq_toolkit.hawq_stats_missing;
    推荐频率 : 每天
    发现问题解决方法
    如果发现有些表没有统计数据,运行 Analyze 命令收集统计数据。

test