cuda100中__cudaPushCallConfiguration和__cudaPopCallConfiguration作用是什么
__cudaPushCallConfiguration和__cudaPopCallConfiguration是CUDA运行时API中的函数,用于在CUDA函数调用之间保存和恢复CUDA调用配置。
在CUDA编程中,使用__global__修饰的函数称为CUDA核函数(CUDA kernel),它们在GPU上运行。在调用CUDA核函数之前,需要配置其调用参数,例如:GPU线程块大小、线程块数量等。__cudaPushCallConfiguration函数用于保存当前的CUDA调用配置,以便在调用下一个CUDA核函数时恢复配置。
__cudaPopCallConfiguration函数用于恢复之前保存的CUDA调用配置,以确保下一个CUDA核函数使用正确的配置。
这两个函数通常与cudaLaunchCooperativeKernel函数一起使用,以实现协作式多任务并发执行。
原文地址: https://www.cveoy.top/t/topic/fGpL 著作权归作者所有。请勿转载和采集!