徐帆,x10000报错1 client(s) failing to respond to cache pressure
1676539731,
问题描述
ceph -s可以查看到有如下告警:
1 client(s) failing to respond to cache pressure
过程分析
当 mds 需要的内存超出设置的默认阈值后, mds 会向系统申请额外内存保障业务运行,在压力过后, mds 需要释放额外申请内存,如果这部分释放占用的时间比较久,超过超时时间 60s ,就会产生该告警,仅该告警正常不会影响业务运行
解决方法
1、可以选择适当增加分配给mds的内存资源,默认分配8G,可增加到10G或15G
ceph tell mds.* injectargs –mdscachememory_limit=10737418240 调大内存阈值到10G(10*1024*1024*1024)
上面是临时调整,需要到各个节点的/etc/ceph/ceph.conf文件中在mds下添加:
mds_cache_memory_limit = 10737418240
2、若增大内存后,仍持续产生告警,可延长mds内存恢复告警时间:
ceph tell mds.* injectargs -- mds_recall_state_timeout=31536000 (单位秒)
同样要更新每个节点上配置文件/etc/ceph/ceph.conf
CRM论坛(CRMbbs.com)——一个让用户更懂CRM的垂直性行业内容平台,CRM论坛致力于互联网、客户管理、销售管理、SCRM私域流量内容输出5年。 如果您有好的内容,欢迎向我们投稿,共建CRM多元化生态体系,创建CRM客户管理一体化生态解决方案。本文来源:知了社区基于知识共享署名-相同方式共享3.0中国大陆许可协议,X10000报错1 client(s) failing to respond to cache pressure