CentOS 7 上 Kubernetes 1.20.15 安装 Prometheus 和 Grafana 监控 GPU 信息
以下是 CentOS 7 系统上安装 Prometheus 和 Grafana 的步骤:
- 配置 Yum 源
在 CentOS 7 系统上安装 Prometheus 和 Grafana,需要先配置 Yum 源。
创建文件 /etc/yum.repos.d/prometheus.repo,内容如下:
[prometheus]
name=Prometheus
baseurl=https://packagecloud.io/prometheus-rpm/release/el/7/$basearch
enabled=1
gpgcheck=1
gpgkey=https://packagecloud.io/prometheus-rpm/release/gpgkey
创建文件 /etc/yum.repos.d/grafana.repo,内容如下:
[grafana]
name=Grafana
baseurl=https://packages.grafana.com/oss/rpm
enabled=1
gpgcheck=1
gpgkey=https://packages.grafana.com/gpg.key
- 安装 Prometheus
使用以下命令安装 Prometheus:
sudo yum install prometheus
- 配置 Prometheus
编辑文件 /etc/prometheus/prometheus.yml,添加以下内容:
global:
scrape_interval: 15s
evaluation_interval: 15s
scrape_configs:
- job_name: 'node_exporter'
static_configs:
- targets: ['localhost:9100']
- job_name: 'gpu_exporter'
static_configs:
- targets: ['localhost:9114']
- 安装 node_exporter 和 gpu_exporter
node_exporter 可以收集系统的 CPU、内存、磁盘等信息,gpu_exporter 可以收集 GPU 的使用情况。
使用以下命令安装 node_exporter:
sudo useradd --no-create-home --shell /bin/false node_exporter
sudo curl -LO https://github.com/prometheus/node_exporter/releases/download/v1.2.2/node_exporter-1.2.2.linux-amd64.tar.gz
sudo tar xvf node_exporter-1.2.2.linux-amd64.tar.gz
sudo cp node_exporter-1.2.2.linux-amd64/node_exporter /usr/local/bin/
sudo chown node_exporter:node_exporter /usr/local/bin/node_exporter
sudo curl -s https://raw.githubusercontent.com/prometheus/node_exporter/master/examples/systemd/node_exporter.service > /etc/systemd/system/node_exporter.service
sudo systemctl daemon-reload
sudo systemctl start node_exporter
sudo systemctl enable node_exporter
使用以下命令安装 gpu_exporter:
sudo useradd --no-create-home --shell /bin/false gpu_exporter
sudo git clone https://github.com/mindprince/gpu-exporter.git
sudo cd gpu-exporter
sudo make
sudo cp gpu-exporter /usr/local/bin/
sudo chown gpu_exporter:gpu_exporter /usr/local/bin/gpu-exporter
sudo curl -s https://raw.githubusercontent.com/mindprince/gpu-exporter/master/gpu-exporter.service > /etc/systemd/system/gpu-exporter.service
sudo systemctl daemon-reload
sudo systemctl start gpu-exporter
sudo systemctl enable gpu-exporter
- 安装 Grafana
使用以下命令安装 Grafana:
sudo yum install grafana
- 启动 Grafana
使用以下命令启动 Grafana:
sudo systemctl start grafana-server
- 访问 Grafana
使用浏览器访问 http://localhost:3000,使用默认用户名 admin 和密码 admin 登录 Grafana。
- 添加数据源
在 Grafana 中添加数据源,选择 Prometheus,设置 URL 为 http://localhost:9090。
- 导入 dashboard
在 Grafana 中导入 dashboard,选择 Import,输入 dashboard ID 12239,选择刚才添加的数据源,点击 Import。
- 查看监控信息
Grafana 中可以查看 CPU、内存、GPU 等监控信息,也可以设置警报和通知。
原文地址: https://www.cveoy.top/t/topic/na2A 著作权归作者所有。请勿转载和采集!