xiaokissoo
发布于

10.3. 有部分任务随机hang住

➢ 问题

➢ 分析&&解答
分析:并发大的时候会有个别任务 hang 住,直到 3600 秒报错,通过日志、栈分析发现是 gp_vmem_idle_resource_timeout 参数设置不正确导致的,因为之前处理其他问题时,改过这个参数测试,改回来时设置参数错误导致,之前这个参数默认值是 18s 后来改回为 18ms,因为系统本身在任务并发大的时候有丢包现象,丢包加上这个参数设置过小会出现节点间任务退出不一致,导致节点间进程收发失败。
处理:将 gp_vmem_idle_resource_timeout 参数修改为 18s,没有出现 hang 住现象。

评论
    test