集群添加异常: Page 2 - Rainbond 社区

集群添加异常

SmallQi

vzrs 从反馈的第二张图来看你的k8s集群貌似有问题

vzrs

SmallQi 就是完全按照这个“https://www.rainbond.com/docs/installation/install-with-ui/”文档装的，没有进行别的操作，我也换了环境重新装了，问题依旧。

SmallQi

vzrs kubectl get node，查查您的k8s节点都正常吗，首先需保证k8s节点是正常的，从您的截图看 no route host 这个报错是不是服务器之间的网络有问题？

vzrs

SmallQi 查看过，一开始添加节点时所有节点都是Ready，每个节点查看都正常。但开始初始化时就开始有问题了，然后就会发现有一台主机会非常卡，但3个节点互相ping都是通的。
另外我还有一点疑惑，单机安装完控制台后，进行集群部署时，控制台这台服务器能不能当做一个节点，还是说需要另外3台服务器组件集群。

SmallQi

vzrs 1. 卡是什么卡，能否描述清楚，服务器负载高还是什么？2. 控制台的这个台服务器可以用做节点

vzrs

SmallQi 我是用虚拟机装的，ssh和控制台都访问不了，从vcenter看负载确实很高。8cpu用了9500MHz，8G内存用了6G。就算增加配置，也是一秒钟全占满，依然不能访问。
Image description

SmallQi

vzrs 光给内存、cpu使用率过高，看不出是哪里的问题，你需要查查是哪些服务占用的过多，然后再贴出来

vzrs

SmallQi
我尝试换了个环境，也是VMware的虚拟化环境。区别是CPU和网络配置不一样。之前的是Gold 5318H，现在是E7-4820。之前网络配置是分布式交换，现在就是简单交换。
等待了20分钟后，除了“↉ nodes are available: 3 pod has unbound immediate PersistentVolumeClaims.”这个错误，没有发现之前遇到的其他错误，node状态都是ready，只有nfs-provisioner频繁重启，rbd-node，rbd-chaos，rbd-monitor，rbd-worker，rbd-resource-proxy，rbd-api，rbd-hub，rbd-eventlog这些pod都是pending状态。查看日志只有一个节点有错误，日志如下：
Image description

另外，还发现了一个有意思的事情。查看磁盘分区情况，控制台服务器将所有文件目录都创建到了sdb上，原本应该是在sda，sdb只是给了200G空间，并没有格式化。
Image description

SmallQi

vzrs

从你提供的截图来看是nfs这个pod没有正常启动导致后续都无法正常创建，rpc.statd failed with error signal killed 这个报错曾经我遇到过，在一个特殊的cpu上，不是英特尔，不管启动什么服务都会被自动杀死进程，尽管是使用systemd启动mysql也需要16G才能启动。所以我怀疑这跟你的CPU有关系。
你提供这俩截图我有点没看懂，第一个图 boot 分区在 sdb，第二个图 boot 分区在 sda

vzrs

SmallQi 了解了，但是E7-4820这款CPU已经是多年前的型号了，感觉不会出现什么兼容性问题，手动部署k8s集群也是正常的。能否提供一下你们配置成功过得VMware环境参数，比如包括esxi版本和cpu等。

SmallQi

vzrs 上述只是猜测，因为目前是 nfs 这个pod无法启动，这个是一个官方的镜像，就是把nfs-server运行在容器中，你可以根据这个报错排查下问题
Image description

或者你可以在本地部署nfs，然后对接你本地的nfs再继续安装 Rainbond https://www.rainbond.com/docs/installation/install-with-helm/vaules-config#%E9%85%8D%E7%BD%AE%E5%A4%96%E9%83%A8%E5%AD%98%E5%82%A8

因为Rainbond本身对环境对操作系统都没有特殊要求，Rainbond是在Pod方式在k8s上运行的

我可以提供给你我们自己的esxi服务器配置，esxi版本6.7.0 CPU Intel(R) Xeon(R) CPU E5-2620 0 @ 2.00GHz，我们这个版本和CPU也是很老的了

vzrs

SmallQi 今天跟我们一个以前用过rainbond v5.11的老哥又测试了几个环境，最终发现是操作系统的问题，在最新版本的centos stream 9上部署无论什么硬件环境都不行，nfs无法创建pv，可能是兼容性问题吧，没有更详细的进行测试验证。使用centos 7.9打上5.4内核补丁5分钟就完成集群初始化了，过程也没任何错误。
建议：毕竟centos7已经终止迭代，还是希望能适配最新的centos stream 9。

非常感谢您的解答！

« 上一页