可以使用以下 runtime API 获取核函数的地址和符号等信息:

  1. cudaGetSymbolAddress():获取核函数的地址。

  2. cudaGetSymbolSize():获取核函数的大小。

  3. cudaFuncGetAttributes():获取核函数的属性,如最大线程块大小、共享内存大小、参数大小等。

  4. cudaFuncSetCacheConfig():设置核函数在共享内存中的缓存方式。

  5. cudaFuncSetSharedMemConfig():设置核函数在共享内存中的内存分配方式。

  6. cudaFuncSetAttribute():设置核函数的属性,如最大线程块大小、共享内存大小、参数大小等。

  7. cudaFuncSetBlockShape():设置核函数的线程块大小。

  8. cudaFuncSetSharedSize():设置核函数使用的共享内存大小。

  9. cudaFuncSetCacheConfig():设置核函数在共享内存中的缓存方式。

CUDA 核函数信息获取:地址、符号、属性等

原文地址: https://www.cveoy.top/t/topic/nuWO 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录