재영의 기술 블로그

January 28, 2026 undefined분 읽기

GPU 시스템 00 - 이 시리즈를 보기 전에 필요한 것들

GPU 시스템 시리즈를 제대로 따라가기 전에 어떤 배경지식이 필요한지 정리하기

Lectures

January 30, 2026 undefined분 읽기

GPU 아키텍처부터 CUDA, Triton, 커널 최적화까지 어떤 순서로 공부하면 되는지

Lectures

February 1, 2026 undefined분 읽기

GPU의 thread, warp, block, grid가 실제 실행에서 어떤 의미를 가지는지

Lectures

February 3, 2026 undefined분 읽기

GPU 성능을 좌우하는 메모리 계층과 bandwidth 병목을 어떻게 봐야 하는지

Lectures

February 5, 2026 undefined분 읽기

CUDA kernel을 직접 작성할 때 indexing과 launch configuration을 어떤 기준으로 잡아야 하는지

Lectures

February 7, 2026 undefined분 읽기

CUDA kernel 최적화에서 가장 자주 마주치는 memory coalescing과 reduction 패턴

Lectures

February 11, 2026 undefined분 읽기

occupancy를 숫자로만 외우지 않고 latency hiding과 연결해서 이해하기

Lectures

February 15, 2026 undefined분 읽기

naive matrix multiply를 통해 GPU 메모리 병목과 재사용 문제를 읽는 법

Lectures

February 17, 2026 undefined분 읽기

tiled matmul에서 shared memory와 block 협업이 왜 큰 성능 차이를 만드는지

Lectures