OushuDB中如何进行硬件及操作系统监控
OushuDB 中如何进行硬件及操作系统监控
OushuDB 中如何进行硬件及操作系统监控
方法: 检查操作系统,网络以及磁盘状态,以及磁盘剩余空间。
推荐频率 : 每隔 30 分钟
发现问题解决方法
如果发现操作系统,网络及磁盘出现异常,需要修复问题,然后重新加入该节点。
如果磁盘剩余空间不足 30% 的话,需要准备系统扩容。否则容易出现磁盘空间不足情况。因为有些 SQL 在运行过程中需要使用临时存储空间来存放中间结果。
如果发现性能问题,建议运行 hawq checkperf 命令来查看性能问题。例如下面的硬件配置,
12 15K RPM SAS 盘,2 RAID 卡, RAID 0
2 dual-port 10Gb NICs (NIC bonding)
正常情况下,有如下性能指标:
I/O 读写: 2GB/s
网络性能:2GB/s
统计信息维护
方法: 通过执行下面的命令检查没有进行 Analyze 的表,即没有统计信息的表,没有搜集统计信息可能产生不优化的查询计划,带来性能问题。
SELECT * FROM hawq_toolkit.hawq_stats_missing;
推荐频率 : 每天
发现问题解决方法
如果发现有些表没有统计数据,运行 Analyze 命令收集统计数据。