0%

CUDA学习笔记

核函数,设备函数,主机函数

1
2
3
__host__ 主机函数
__global__ 核函数
__device__ 设备函数

内存管理,数据传递,内存初始化,内存释放

1
2
3
4
5
6
7
//use of malloc
float *fpHost_A;
fpHost_A = (float*) malloc(nBytes);

//use of cudaMalloc
float *fpDevice_A
cudaMalloc((float**)&fpDevice_A, nBytes);

1
2
3
4
5
6
7
8
9
10
//use of memcpy
memcpy((void*)d, (void*)s, nBytes);

//use of cudaMemcpy
cudaMemcpy(Device_A, Host_A, nBytes, cudaMemcpyHostToHost);
kind:
cudaMemcpyHostToHost 主机->主机
cudaMemcpyHostToDevice 主机->设备
cudaMemcpyDeviceToHost 设备->主机
cudaMemcpyDeviceToDevice 设备->设备

1
2
3
4
5
//use of memset
memset(fpHost_A, 0, nBytes);

//use of cudaMemset
cudaMemset(fpDevice_A, 0, nBytes);

1
2
3
4
5
//use of free
free(pHost_A);

//use of cudaFree
cudaFree(pDevice_A);