- např. načítání přes tiles je lepší v cudě - pomocí texturních jednotek - než přes directives
- inkrementální paralelismus
- OpenACC - open accelerators
- koupila nvidia - dost podporovala
- velice omezený standard, nechává hodně na kompilátoru
gang - cuda block
vector - cuda vlákna
- `` -
- OpenMP
- “košatější”, podpora pro fpga, …
#pragma acc kernel
- může selhat - v tom případě vypíše chybu a nechá kód sekvenčně
- matlab - pole $N^2$ prvků + pole $N^2 \times N^2$ $n$-okolí s $n$-diagonály pro okolů
- všechno co je pole je sdílené
- skalary jsou ?
#pragma acc routine seq - pro funkce volané 1 vláknem - obdoba __device__
- funguje pouze pro levou část!
x += ...
+= - atomicky
... - NENÍ atomické!!
- přibalení knihovny z openCL nebo cudy do openACC je potřeba dát bacha, protože knihovna defaultně běží na jiném streamu