如何利用onnx模型在GPU上进行推理其代码该如何写
要在GPU上进行ONNX模型推理,需要使用ONNX运行时库,并使用CUDA或OpenCL进行加速。以下是一个简单的Python代码示例,展示如何使用ONNX运行时库在GPU上进行推理:
import onnxruntime as ort
import numpy as np
# 加载模型
model_path = 'path/to/model.onnx'
session = ort.InferenceSession(model_path)
# 准备输入数据
input_data = np.random.randn(1, 3, 224, 224).astype(np.float32)
# 进行推理
input_name = session.get_inputs()[0].name
output_name = session.get_outputs()[0].name
result = session.run([output_name], {input_name: input_data})
# 输出结果
print(result)
在上面的代码中,我们首先加载了ONNX模型,并使用随机生成的数据准备了输入。然后,我们通过调用run方法在GPU上进行了推理。最后,我们输出了结果。请注意,run方法返回的是一个列表,因为模型可能有多个输出。因此,我们需要提供输出名称来指定我们需要的输出。
原文地址: https://www.cveoy.top/t/topic/bq9F 著作权归作者所有。请勿转载和采集!