查看多集群监控数据
本节介绍如何查看多集群监控数据。
前提条件
操作步骤
以具有 platform-admin 角色的用户登录 KubeSphere 企业版 Web 控制台。
在页面右上角点击
图标,选择 Whizard 可观测中心。
Whizard 可观测中心的概览页面显示所有集群的监控信息。
功能区 描述 已创建资源数量
显示当前平台管理的所有集群、节点、项目、容器组、部署、有状态副本集、守护进程集、任务、定时任务、卷、服务、应用路由的数量。
资源使用情况
显示当前平台管理的所有集群的所有节点的 CPU、内存、磁盘使用情况,以及可已创建容器组数量占可创建容器组最大数量的百分比。默认情况下每个节点最多可以创建 110 个容器组。
对于 CPU 和内存,将光标悬停在
可查看已分配给容器和项目的资源预留和上限数量。
集群成员和集群角色
显示当前平台管理的所有集群的集群成员和集群角色数量。
全局告警
显示全局告警规则组产生的告警数量及最近的告警消息。此处显示的告警不包括集群和项目告警规则组产生的告警。全局告警规则组由平台管理员在 Whizard 可观测中心管理。
告警级别的类型包括提醒、警告、重要和紧急。
告警状态的类型包括:
验证中:监控指标满足预设的条件,但未满足预设的持续时间。
已触发:监控指标满足预设的条件,并且满足预设的持续时间。
资源用量排行
显示当前平台资源用量最多的集群、节点、项目和容器组。
点击下拉列表可选择对象类型和排序依据。
在列表上方点击
/
可按升序/降序排序。
点击查看更多可查看集群、节点、项目和容器组的资源用量详情。
容器组
显示当前平台管理的所有集群的各种类型容器组的数量。
容器组状态类型包括:
运行中:容器组已分配给某个节点,容器组中的所有容器都已被创建,至少有一个容器正在运行、启动或重启。
等待中:容组器已被系统接受,但有至少一个容器尚未创建也未运行。此状态下,容器组可能正在等待调度,或等待容器镜像下载完成。
已完成:容器组中的所有容器都成功终止(以 0 退出码终止),并且不再重启。
失败:容器组中的所有容器都已终止,并且至少有一个容器以非 0 退出码终止。
未知:系统无法获取容器组状态。出现这种状态通常是由于系统与容器组所在的主机通信失败。
容器组 QoS(服务质量)类型包括:
Guaranteed:容器组中的每个容器都具有内存上限、内存请求、CPU 上限、CPU 请求,并且内存上限等于内存请求,CPU 上限等于 CPU 请求。
Burstable:容器组中至少有一个容器不满足 Guaranteed 类型的要求。
BestEffort:容器组中的容器没有配置任何内存上限、内存请求、CPU 上限或CPU 请求。
容器组的 QoS 类型将决定容器组运行的优先级。当系统中资源不足以运行所有容器组时,系统优先保证运行 QoS 类型为 Guaranteed 的容器组,其次保证运行 QoS 类型为 Burstable 的容器组,最后保证运行 QoS 类型为 BestEffort 的容器组。
在左侧导航栏点击集群的名称,可查看集群的详细监控信息。
在页面右上角,点击选择集群,选择需要监控的集群。
反馈
这篇文章对您有帮助吗?
通过邮件接收 KubeSphere 最新的技术博客与产品更新的通知
感谢您的反馈。如果您有关于如何使用 KubeSphere 的具体问题,请在 Slack 上提问。如果您想报告问题或提出改进建议,请在 GitHub 存储库中打开问题。