"optimization" 태그가 달린 포스트
undefined분 읽기
GPU 시스템 05 - Coalescing, Shared Memory, Reduction 패턴
CUDA kernel 최적화에서 가장 자주 마주치는 memory coalescing과 reduction 패턴
undefined분 읽기
GPU 시스템 11 - Shared Memory Bank Conflict
shared memory가 빠르다고 끝이 아닌 이유와 bank conflict를 피하는 기본 원리
undefined분 읽기
GPU 시스템 13 - Reduction Kernel Deep Dive
reduction kernel을 통해 shared memory, warp primitive, synchronization을 한 번에 이해하기