- Potřeba prvně
copyin(this)! zkopíruje member prvně
- poté až můžeme
create(arr[0:n])
present(arr[0:n], v) - v.arr už tyto data jsou na kartě
- stažení dat z gpu na host
#pragma acc update self/host
- nahrání dat na gpu
#pragma acc update device
__device__ = #pragma acc routine seq
async(id) - id streamu,
- čekání na nějaký stream -
wait(id)
- čekání na všechny
#pragma acc wait
- při používání cuda + openacc si vytvoří vlastní vlákna a je nutno použít
#pragma acc wait
- alternativa k eventům
- uděláme si pole s flagy, kde ukazují, jaká část je hotova
use_device
deviceptr
acc_hostptr(x)
acc_devptr(x)
- gang = blok
- worker = warp