python实现利用Onnxruntime推理其运行在什么设备上代码如何设置可以保证其在GPU上进行运行

Onnxruntime是一个支持跨平台和异构硬件的高性能推理引擎，它可以在CPU、GPU和FPGA等设备上运行。为了保证其在GPU上进行运行，需要在代码中指定使用GPU作为计算设备。

以下是一个使用Onnxruntime进行推理，并在GPU上运行的Python代码示例：

import onnxruntime as ort
import numpy as np

# 加载模型
model_path = "model.onnx"
sess_options = ort.SessionOptions()
sess_options.graph_optimization_level = ort.GraphOptimizationLevel.ORT_ENABLE_ALL
sess = ort.InferenceSession(model_path, sess_options=sess_options)

# 设置输入数据
input_name = sess.get_inputs()[0].name
input_data = np.random.rand(1, 3, 224, 224).astype(np.float32)

# 在GPU上进行推理
providers = ['CUDAExecutionProvider']
sess.set_providers(providers)
output_name = sess.get_outputs()[0].name
result = sess.run([output_name], {input_name: input_data})

print(result)

在上述代码中，我们首先加载了一个Onnx模型，并设置了推理会话的选项。然后，我们生成了一个随机的输入数据，并将其设置为模型的输入。接着，我们将推理会话设置为在GPU上运行，并执行推理操作。最后，我们打印了推理结果。

要注意的是，在使用GPU进行推理时，需要确保计算机上已经安装了适当的GPU驱动程序和CUDA库。

python实现利用Onnxruntime推理其运行在什么设备上代码如何设置可以保证其在GPU上进行运行