完成验证
当上述安装步骤全都完成以后,默认将会自动启动云空间管理后台所有组件,以及依赖的第三方中间件服务(例如数据库服务器、消息服务器、文件服务器等)。
⚠️ 核心操作规范:
执行位置:除非特别说明,下述所有
kubectl命令、as6tui工具及运维脚本 必须在主节点 (Master) 上执行。权限要求:所有操作均需要
sudo权限。建议以xspace用户登录后,在命令前添加sudo执行。
一、 运行状态检查
由于系统组件间存在复杂的运行时依赖,整体启动完成通常需要 10~15 分钟。具体时间取决于虚拟机的处理器性能及底层存储读写的实际速度。
等待期间,您可以随时执行以下脚本检测当前的运行状态:
[xspace@host151 ~]# sudo /opt/installation/scripts/env_check.sh 0
注意:
该脚本将会依次检查所有组件和中间件的运行状态是否正常。
如果存在尚未就绪的异常状态,脚本输出将会以 告警红色 显示。
如果安装现场执行该检查脚本发现长时间未能进入正常运行状态,请联系技术支持人员。
如果后续虚拟机环境发生了重启,也需要等待一段时间,期间可以用该脚本检测状态。
二、 容器集群维护
云空间管理后台所有组件运行在容器化集群中,日常运维将频繁使用 kubectl 命令。
具体使用方法可参考 kubectl 官方文档。
2.1 常用维护命令示例
查看集群节点状态:
[xspace@host151 ~]$ sudo kubectl get nodes
NAME STATUS ROLES AGE VERSION
host153 Ready elk,namesrv,rocketmq 12d v1.24.9+k3s1
host151 Ready control-plane,master,namesrv,rocketmq,xspace 12d v1.24.9+k3s1
host152 Ready namesrv,rocketmq,xspace 12d v1.24.9+k3s1
注:如果存在节点未处于 Ready 状态,请检查该节点对应的虚拟机启动情况以及网络是否正常。
查看所有命名空间:
[xspace@host151 ~]# sudo kubectl get ns
NAME STATUS AGE
default Active 11d
kube-system Active 11d
kube-public Active 11d
kube-node-lease Active 11d
xspace Active 11d
bream Active 11d
mist Active 11d
middleware Active 11d
nginx Active 11d
查看 xspace 命名空间中的 Pod 组件列表和状态(结果示例):
[xspace@host151 ~]# sudo kubectl get pods -n xspace
NAME READY STATUS RESTARTS AGE
bream-migrate-dwm6w 0/1 Completed 0 11d
panda-migrate-46z8x 0/1 Completed 0 11d
tunny-migrate-bzrgs 0/1 Completed 0 11d
zebra-migrate-5btlx 0/1 Completed 0 11d
app-file-server-6fd9d849b7-zsph7 2/2 Running 0 11d
app-instance-service-7ccbf484cc-fhm6n 2/2 Running 0 11d
app-zebra-config-service-67b6db6f5d-sk567 2/2 Running 0 11d
app-platform-service-546dbc5c6d-69pbt 2/2 Running 0 11d
app-policy-service-6c8d697c9d-8xnkq 2/2 Running 0 11d
app-gateway-server-7f6469f6b7-2mlms 2/2 Running 0 11d
app-image-service-55c4494d8b-c7gtx 2/2 Running 0 11d
app-log-server-649d6885cb-x8cd7 2/2 Running 0 11d
app-tunny-config-service-5f8998f6b4-7zjdw 2/2 Running 0 11d
app-region-service-64d4d69869-v47gz 2/2 Running 0 11d
app-tenant-service-5c6b7f8b97-pm8j6 2/2 Running 0 11d
app-search-server-78c7b86695-mtbtf 2/2 Running 0 11d
app-vpc-service-57b8f4489-r2bgp 2/2 Running 0 11d
app-session-service-644cb868b5-k4v7t 2/2 Running 0 11d
app-uaa-server-9b947756f-mt56x 2/2 Running 0 11d
app-bff-service-85f869747f-7njvz 2/2 Running 0 11d
app-data-sync-server-555f8dd8c6-5cfqr 2/2 Running 0 11d
app-project-service-548d789cf5-25fkt 2/2 Running 0 11d
app-volume-service-775fbdd4-4tr6t 2/2 Running 0 11d
app-access-gateway-service-7448948955-fpb5p 2/2 Running 0 11d
app-terminal-service-7c8d77b74-wrmp7 2/2 Running 0 11d
app-template-service-6bf584b8cf-v6qfg 2/2 Running 0 11d
app-resource-template-service-754f56c78f-hzsgk 2/2 Running 0 11d
app-panda-config-service-799bfff7dc-sqfgc 2/2 Running 0 11d
app-version-service-78f875dfd-9xkfp 2/2 Running 0 11d
app-flavor-service-7df445896-v7dwv 2/2 Running 0 11d
app-desktop-service-5b59d6b6b9-z4kk6 2/2 Running 0 11d
app-user-service-bdf5f4ff9-qmvdb 2/2 Running 1 (11d ago) 11d
app-cluster-service-846f5c74c9-wgxc9 2/2 Running 1 (11d ago) 11d
注:正常运行期间,组件 POD 状态应为 Completed 或 Running。
2.2 使用 as6tui 图形化控制台
除了手工执行命令,也可以输入 as6tui 命令使用字符控制台界面直接进行操作:
[xspace@host151 ~]# sudo su
[root@host151 ~]# as6tui
- 输入问号字符
?:查看所有完整的帮助文字。 - 输入
s:进入当前选中的组件内部 Shell 交互。 - 输入
:q:退出整个字符控制台界面。 - 更多的按键操作参见界面上方的提示说明。
三、 自动化运维与节点负载再平衡
系统预置了自动维护脚本并已加入计划任务:
[root@host151 ~]# crontab -l
0 * * * * /opt/installation/scripts/resolve_env.sh >> /var/log/resolve_env.log
0 3 * * * /opt/installation/scripts/rebalance_env.sh >> /var/log/rebalance_env.log
功能说明:
- 环境修复 (
resolve_env.sh):如果发现服务的xxl-job一直没有注册,可手动执行此脚本修复。
[root@host151 ~]# /opt/installation/scripts/env_check.sh 6
----------------------------------------------------------------------
[Xxljob Condition]
----------------------------------------------------------------------
xxljob executor cluster-service registered.
xxljob executor instance-service registered.
xxljob executor project-service registered.
xxljob executor terminal-service registered.
xxljob executor desktop-service registered.
xxljob executor platform-service registered.
xxljob executor session-service registered.
xxljob executor resource-template-service registered.
- 负载平衡 (
rebalance_env.sh):通过sudo kubectl top nodes查看各节点负载。如果负载极度不均(如最大内存 >80%,最小内存 <60%),执行此脚本通过重启 POD 触发重新调度,实现节点负载再平衡。
[root@host151 ~]# kubectl top nodes
NAME CPU(cores) CPU% MEMORY(bytes) MEMORY%
host151 1501m 18% 12367Mi 79%
host152 841m 10% 9180Mi 59%
host153 1284m 16% 10015Mi 64%
