以下是在 CentOS7 系统上部署 Kubernetes 集群监控及报警通知的步骤:

  1. 安装 Prometheus 和 Grafana

在 Kubernetes 集群中部署 Prometheus 和 Grafana,可以使用 Helm Charts 工具,也可以手动安装。具体安装步骤请参考官方文档。

  1. 配置 Prometheus 监控 Kubernetes 集群状态

将 Prometheus 配置为监控 Kubernetes 集群状态,需要在 Prometheus 配置文件中添加以下内容:

- job_name: 'kubernetes-apiservers'
  kubernetes_sd_configs:
  - role: endpoints
  scheme: https
  tls_config:
    ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
    cert_file: /var/run/secrets/kubernetes.io/serviceaccount/client.crt
    key_file: /var/run/secrets/kubernetes.io/serviceaccount/client.key
  bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
  relabel_configs:
  - source_labels: [__meta_kubernetes_namespace, __meta_kubernetes_service_name, __meta_kubernetes_endpoint_port_name]
    action: keep
    regex: default;kubernetes;https
- job_name: 'kubernetes-nodes'
  kubernetes_sd_configs:
  - role: node
  relabel_configs:
  - action: labelmap
    regex: __meta_kubernetes_node_label_(.+)  
  - target_label: __address__
    replacement: kubernetes.default.svc:443
  - source_labels: [__meta_kubernetes_node_name]
    regex: (.+)
    target_label: __metrics_path__
    replacement: /api/v1/nodes/${1}/proxy/metrics
  1. 配置 Grafana 展示监控数据

在 Grafana 中创建 Dashboard,展示 Prometheus 采集的监控数据。例如,可以创建一个展示 Kubernetes 集群节点资源使用情况的 Dashboard。

  1. 配置 Alertmanager 发送报警通知

在 Prometheus 中配置 Alertmanager,当监控数据出现异常时,可以发送报警通知。具体配置步骤请参考官方文档。

  1. 配置企业微信报警通知

在 Alertmanager 中配置企业微信报警通知,需要在 Alertmanager 配置文件中添加以下内容:

receivers:
- name: 'wechat'
  webhook_configs:
  - url: 'https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=xxxxx'
    send_resolved: false
    http_config:
      bearer_token_file: /etc/alertmanager/wechat.token

其中,key 为企业微信机器人的 access_token。

  1. 测试报警通知

在 Kubernetes 集群中模拟一个异常情况,例如关闭一个 Pod,观察 Alertmanager 是否能够发送报警通知到企业微信。

以上就是在 CentOS7 系统上部署 Kubernetes 集群监控及报警通知的步骤。

CentOS7 上部署 Kubernetes 集群监控与企业微信报警

原文地址: https://www.cveoy.top/t/topic/na11 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录