如何缩减集群规模?

Rainbond版本: v5.2.2-release-def9248-2020-10-24-11
有相关文档吗? 我在官网上找了下,好像没有,因为是测试,所以我直接把集群中一台机器关机了,然后,该节点上的组件全部异常,而且导致整个集群不正常了,grctl和kubectl命令时不时会出现超时的现象


抄送: @dazuimao1990

你的情况比较特殊,如果有需要,可以申请 14 天小群支持来解决你的问题

因为是测试的,这次我直接把集群重建了。。。但是集群规模缩减有什么办法吗? 我现在在测试这一块的问题,公司正式上线前需要有个答案,不然不可能直接上线的,因为我们公司都用的自己的机器,没有用云,机房有时会更换,这样的话,就必须要有可靠的扩容缩减方式,不然根本没法用的。。

机房有时会更换?是指换某一台服务器?

不是,是指整个机房更换,现在公司的机器是自己买的,放到机房托管,但有些机房服务并不是那么好,所以偶尔会换机房

兄弟儿啊,你这个,不是一个很常规的问题啊。

Rainbond 可以支持在有序的情况下进行计算节点的扩容缩容。方式的话,你可以理解为 k8s 怎么加减计算节点,我们就怎么搞。这取决于你怎么安装 K8s 集群。

管理节点一般不建议随便扩缩容,因为涉及到 ETCD 集群机制的问题,不是很好处理。建议的情况是集群规划之初就做好这个管理节点集群,不要乱动,如果要动,请由有相关技能的专人处理,当然,这个扩缩容依然取决于怎么处理 K8s 集群。

像你这种情况,我给你的建议是即使换机房,也不要变动服务器的 IP 地址,可以最大限度的减少你恢复集群的工作量,甚至它可以自己恢复。

如果涉及到集群对外提供服务的地址的改动,建议读下这个文档 :
https://www.rainbond.com/docs/practices/operator/gateway-node/ 中的 修改流量入口的地址 一节。

我能直接给你的建议就是这么多了。

可能我说的不是太清楚。。比如我们公司有1000台服务器,分别在10个机房,我现在把这1000台服务器组成k8s集群,装上rainbond,现在其中某个机房要更换,100台机器需要下架搬迁到其他机房,不用考虑这100台机器上的数据,换机房的同时,数据也全清空重装系统,那么,在换之前需要做什么操作吗?还是说直接把这100台下掉,让系统自动调度把pod转移动到其他节点上就行了?

大概明白你的意思了。

首先哈,master节点不能动,动起来很麻烦。不过你可以购买企业服务,让我们来做这件事 :stuck_out_tongue_winking_eye:

其次,如果只是下掉node节点,deployment无状态应用默认五分钟未响应就会迁移到可用的节点,statefulset有状态服务不会迁移,这是k8s的默认规则。不过statefulset想让他自动迁移也是有办法的。需要定制化开发。

补充一句,你可以申请 企业POC测试,会有专业的工程师配合您进行测试
https://cloud.goodrain.com/page/price