CentOS7 上部署 Kubernetes 集群监控与企业微信报警
以下是在 CentOS7 系统上部署 Kubernetes 集群监控及报警通知的步骤:
- 安装 Prometheus 和 Grafana
在 Kubernetes 集群中部署 Prometheus 和 Grafana,可以使用 Helm Charts 工具,也可以手动安装。具体安装步骤请参考官方文档。
- 配置 Prometheus 监控 Kubernetes 集群状态
将 Prometheus 配置为监控 Kubernetes 集群状态,需要在 Prometheus 配置文件中添加以下内容:
- job_name: 'kubernetes-apiservers'
kubernetes_sd_configs:
- role: endpoints
scheme: https
tls_config:
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
cert_file: /var/run/secrets/kubernetes.io/serviceaccount/client.crt
key_file: /var/run/secrets/kubernetes.io/serviceaccount/client.key
bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
relabel_configs:
- source_labels: [__meta_kubernetes_namespace, __meta_kubernetes_service_name, __meta_kubernetes_endpoint_port_name]
action: keep
regex: default;kubernetes;https
- job_name: 'kubernetes-nodes'
kubernetes_sd_configs:
- role: node
relabel_configs:
- action: labelmap
regex: __meta_kubernetes_node_label_(.+)
- target_label: __address__
replacement: kubernetes.default.svc:443
- source_labels: [__meta_kubernetes_node_name]
regex: (.+)
target_label: __metrics_path__
replacement: /api/v1/nodes/${1}/proxy/metrics
- 配置 Grafana 展示监控数据
在 Grafana 中创建 Dashboard,展示 Prometheus 采集的监控数据。例如,可以创建一个展示 Kubernetes 集群节点资源使用情况的 Dashboard。
- 配置 Alertmanager 发送报警通知
在 Prometheus 中配置 Alertmanager,当监控数据出现异常时,可以发送报警通知。具体配置步骤请参考官方文档。
- 配置企业微信报警通知
在 Alertmanager 中配置企业微信报警通知,需要在 Alertmanager 配置文件中添加以下内容:
receivers:
- name: 'wechat'
webhook_configs:
- url: 'https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=xxxxx'
send_resolved: false
http_config:
bearer_token_file: /etc/alertmanager/wechat.token
其中,key 为企业微信机器人的 access_token。
- 测试报警通知
在 Kubernetes 集群中模拟一个异常情况,例如关闭一个 Pod,观察 Alertmanager 是否能够发送报警通知到企业微信。
以上就是在 CentOS7 系统上部署 Kubernetes 集群监控及报警通知的步骤。
原文地址: https://www.cveoy.top/t/topic/na11 著作权归作者所有。请勿转载和采集!