__cudaPushCallConfiguration 和 __cudaPopCallConfiguration 是 CUDA 运行时 API 中的函数,用于在 CUDA 函数调用之间保存和恢复 CUDA 调用配置。

在 CUDA 编程中,使用 global 修饰的函数称为 CUDA 核函数(CUDA kernel),它们在 GPU 上运行。在调用 CUDA 核函数之前,需要配置其调用参数,例如:GPU 线程块大小、线程块数量等。__cudaPushCallConfiguration 函数用于保存当前的 CUDA 调用配置,以便在调用下一个 CUDA 核函数时恢复配置。

__cudaPopCallConfiguration 函数用于恢复之前保存的 CUDA 调用配置,以确保下一个 CUDA 核函数使用正确的配置。

这两个函数通常与 cudaLaunchCooperativeKernel 函数一起使用,以实现协作式多任务并发执行。

CUDA 10.0 中 __cudaPushCallConfiguration 和 __cudaPopCallConfiguration 函数详解

原文地址: https://www.cveoy.top/t/topic/oma4 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录