- speciální funkce zařízení jsou exposed jako special kernely
- např DSP umí konvoluci, fft, …
- nelze editovat jen používat
- shared v cudě je local v HIPu a OpenCL
- založeno na tascích
- čekání
taskwait vs dependency
- od OpenMP 5.0 - shared address space
#pragma omp requires unified_shared_memory
#pragma omp declare mapper(Type_t v) - copy konstruktor pro přenos hlubokých typů, např strom
- pointers mapped as ZERO length arrays
#pragma omp parallel - bariéra = lze pouze nad cuda blokem / sm procesorem
- liga
- teams = není synchronizace mezi týmy, maximálně skončení kernelu
- thread
- můžeme se zeptat na id vlákna
- nelze kritická sekce!
use_device_ptr(x), potom cuda kernel s x
is_device_ptr(x), cuda pointer s openmp kernelem
- impl nic co by nepřesahovalo projekt
- z posledních 2 přednášek: max dynamický paralelismus