centos7上设置k8s nvidia GPU设置Shared Access to GPUs with CUDA Time-Slicing设置工序虚拟gpu数量为10请问具体操作步骤是什么
要在CentOS 7上设置Kubernetes(k8s)的NVIDIA GPU共享访问和CUDA时间切片,以及将虚拟GPU数量设置为10,可以按照以下步骤进行操作:
-
首先,确保您的系统已经安装了NVIDIA显卡驱动程序,以及CUDA工具包和NVIDIA容器运行时(nvidia-docker2)。
-
安装NVIDIA Device Plugin for Kubernetes,这是一个Kubernetes插件,用于管理GPU资源。可以使用以下命令进行安装:
kubectl create -f https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/v0.9.0/nvidia-device-plugin.yml
- 在Kubernetes集群的节点上,编辑kubelet的配置文件(/etc/default/kubelet),并添加以下参数:
KUBELET_EXTRA_ARGS="--feature-gates=DevicePlugins=true"
- 重新启动kubelet服务:
sudo systemctl restart kubelet
- 创建一个文件(例如,gpu-pod.yaml),并将以下内容复制到文件中:
apiVersion: v1
kind: Pod
metadata:
name: gpu-pod
spec:
containers:
- name: gpu-container
image: nvidia/cuda:11.0-base
resources:
limits:
nvidia.com/gpu: 1
- 使用kubectl命令创建Pod:
kubectl create -f gpu-pod.yaml
- 检查Pod的状态,确保它已经运行并且没有出现错误:
kubectl get pod gpu-pod
- 现在,您可以使用NVIDIA的设备插件来设置虚拟GPU数量为10。编辑kubelet的配置文件(/etc/default/kubelet),并添加以下参数:
KUBELET_EXTRA_ARGS="--feature-gates=DevicePlugins=true --resource-reservations=^nvidia\\.com/gpu$"
- 重新启动kubelet服务:
sudo systemctl restart kubelet
- 创建一个文件(例如,virtual-gpu.yaml),并将以下内容复制到文件中:
apiVersion: v1
kind: Pod
metadata:
name: virtual-gpu-pod
spec:
containers:
- name: virtual-gpu-container
image: nvidia/cuda:11.0-base
resources:
limits:
virtual-gpu.kubeflow.org/gpu: 10
- 使用kubectl命令创建Pod:
kubectl create -f virtual-gpu.yaml
- 检查Pod的状态,确保它已经运行并且没有出现错误:
kubectl get pod virtual-gpu-pod
现在,您应该已经成功地在CentOS 7上设置了Kubernetes的NVIDIA GPU共享访问和CUDA时间切片,并将虚拟GPU数量设置为10
原文地址: https://www.cveoy.top/t/topic/ixsP 著作权归作者所有。请勿转载和采集!