vzrs 从反馈的第二张图来看你的k8s集群貌似有问题
SmallQi 就是完全按照这个“https://www.rainbond.com/docs/installation/install-with-ui/”文档装的,没有进行别的操作,我也换了环境重新装了,问题依旧。
vzrs kubectl get node,查查您的k8s节点都正常吗,首先需保证k8s节点是正常的,从您的截图看 no route host 这个报错是不是服务器之间的网络有问题?
SmallQi 查看过,一开始添加节点时所有节点都是Ready,每个节点查看都正常。但开始初始化时就开始有问题了,然后就会发现有一台主机会非常卡,但3个节点互相ping都是通的。 另外我还有一点疑惑,单机安装完控制台后,进行集群部署时,控制台这台服务器能不能当做一个节点,还是说需要另外3台服务器组件集群。
vzrs 1. 卡是什么卡,能否描述清楚,服务器负载高还是什么?2. 控制台的这个台服务器可以用做节点
SmallQi 我是用虚拟机装的,ssh和控制台都访问不了,从vcenter看负载确实很高。8cpu用了9500MHz,8G内存用了6G。就算增加配置,也是一秒钟全占满,依然不能访问。
vzrs 光给内存、cpu使用率过高,看不出是哪里的问题,你需要查查是哪些服务占用的过多,然后再贴出来
SmallQi 我尝试换了个环境,也是VMware的虚拟化环境。区别是CPU和网络配置不一样。之前的是Gold 5318H,现在是E7-4820。之前网络配置是分布式交换,现在就是简单交换。 等待了20分钟后,除了“↉ nodes are available: 3 pod has unbound immediate PersistentVolumeClaims.”这个错误,没有发现之前遇到的其他错误,node状态都是ready,只有nfs-provisioner频繁重启,rbd-node,rbd-chaos,rbd-monitor,rbd-worker,rbd-resource-proxy,rbd-api,rbd-hub,rbd-eventlog这些pod都是pending状态。查看日志只有一个节点有错误,日志如下:
另外,还发现了一个有意思的事情。查看磁盘分区情况,控制台服务器将所有文件目录都创建到了sdb上,原本应该是在sda,sdb只是给了200G空间,并没有格式化。
vzrs
rpc.statd failed with error signal killed
SmallQi 了解了,但是E7-4820这款CPU已经是多年前的型号了,感觉不会出现什么兼容性问题,手动部署k8s集群也是正常的。能否提供一下你们配置成功过得VMware环境参数,比如包括esxi版本和cpu等。
vzrs 上述只是猜测,因为目前是 nfs 这个pod无法启动,这个是一个官方的镜像,就是把nfs-server运行在容器中,你可以根据这个报错排查下问题
或者你可以在本地部署nfs,然后对接你本地的nfs再继续安装 Rainbond https://www.rainbond.com/docs/installation/install-with-helm/vaules-config#%E9%85%8D%E7%BD%AE%E5%A4%96%E9%83%A8%E5%AD%98%E5%82%A8
因为Rainbond本身对环境对操作系统都没有特殊要求,Rainbond是在Pod方式在k8s上运行的
我可以提供给你我们自己的esxi服务器配置,esxi版本6.7.0 CPU Intel(R) Xeon(R) CPU E5-2620 0 @ 2.00GHz,我们这个版本和CPU也是很老的了
6.7.0
Intel(R) Xeon(R) CPU E5-2620 0 @ 2.00GHz
SmallQi 今天跟我们一个以前用过rainbond v5.11的老哥又测试了几个环境,最终发现是操作系统的问题,在最新版本的centos stream 9上部署无论什么硬件环境都不行,nfs无法创建pv,可能是兼容性问题吧,没有更详细的进行测试验证。使用centos 7.9打上5.4内核补丁5分钟就完成集群初始化了,过程也没任何错误。 建议:毕竟centos7已经终止迭代,还是希望能适配最新的centos stream 9。
非常感谢您的解答!