这个现在遇到一个问题就是我的rbd-api组件会频繁的变成unready的状态,然后页面上显示集群失去响应,我删除monitor组件后在创建容器时还会卡住,日志显示是无法挂载目录到nfs,每次都需要删除rbd-monitor,df-h 查询磁盘挂载的时候会卡住。
有时删除monitor组件sts 好一小会然后就api就又挂了。我感觉就是pod去挂载nfs的时候有时能挂载上有时挂载不上,但网络都是通的,有的时候把nfs删了pod就立马创建成功了,但是一会之后api就又会挂掉,测试过在api里ping eventlog的pod和两个node的,网络应该都是通的。也尝试删除过api,重启的时候事件里也会出现挂载失败的事件
想问一下有没有什么好的排查方向,只要时pod的状态是在creating时,在服务器上运行df -h 就会卡住,会不会是网络插件的的问题,网络插件用的flannel,感觉这个挂载时好时坏,有时候能挂载上,挂载不上的时候,有时删除nfs就能挂载上了,但挂上了之后一会api就又会变成unready状态。