集群端失去响应

请问下,单机部署的rainbond,有时候在团队点击集群资源时,有时候会报错集群端失去响应,刷新后恢复但是会报一个服务端异常一会也会恢复,

请问下什么原因

请提供rbd-api相关报错日志
kubectl logs -fl name=rbd-api -n rbd-system

看起来证书有问题了,通过 grctl config 查看,对比下跟目前的证书是否一致

我这是单机离线部署 然后是在其他机器下载放在内网环境上安装的;在哪执行grctl config,我这个是报错没这命令;查出来和哪个证书对比,证书的具体位置在哪

离线部署比较特殊。不确定因素有很多。

  1. 根据文档下载grctl工具,拷贝到你的离线环境。https://www.rainbond.com/docs/user-operations/tools/grctl/
  2. 安装grctl之后执行 grctl config ,然后打开7070控制台,进如集群视图,点击编辑会看到有3个证书,分别对应grctl config 打印出来的证书列表,如果不对,以grctl config证书为主,替换7070控制台中的证书。
    如果集群内没有团队或应用,可直接在控制台集群视图页面导入集群,复制grctl config打印出来的信息。
  3. 复制证书后如果集群还不正常,请提供API日志,kubectl logs -fl name=rbd-api -n rbd-system

证书一致,这是api的日志

请尝试重启下API组件,kubectl delete pod -l name=rbd-api -n rbd-system
在贴出日志

看起来日志没报错了,集群还是失去响应吗

偶尔 我的服务器是和通过vpn连接 这个会影响吗

下次出现这情况,打开F12,贴出接口报错信息。

kubectl exec -it $(kubectl get pod -n rbd-system | grep rbd-app-ui | awk '{print $1}') -n rbd-system sh
 tail -f /app/logs/goodrain.log

贴出日志



看起来是集群通信有问题,看下k8s的kubelet日志,看rbd-system的所有pod正常吗,kube-system的pod都正常么

kubelet 日志
journalctl -fu kubelet

kubectl get pod -n kube-system

image

看起来没什么报错,离线环境比较复杂,请问是根据这边文档安装的么https://www.rainbond.com/docs/install/install-from-linux/offline-install/

是的 按照离线部署步骤来的