CUDA基础
cuda程序的后缀:.cu
编译:nvcc hello_world.cu
执行:./hello_world.cu
使用语言还是C++。
1. 核函数
__global__ void add(int *a, int *b, int *c) {
*c = *a + *b;
}
核函数只能访问GPU的内存。也就是显存。CPU的存储它是碰不到的。
并且核函数不能使用变长参数、静态变量、函数指针。
核函数具有异步性。GPU无法控制CPU,CPU也不会去等GPU,所以需要同步,也就是显式调用同步函数。有些线程也是需要同步的。
编写CUDA程序:
int main(void){
主机代码
核函数调用
主机代码
return 0;
}
核函数不支持C++的iostream。
#include<stdio.h>
__global__ void hello_from_gpu(){
printf("Hello from GPU!\n");
__syncthreads();// 显式同步
}
int main(){
hello_from_gpu<<<1,1>>>();// 显式调用核函数
cudaDeviceSynchronize();// 显式同步
return 0;
}