재영의 기술 블로그

January 6, 2026 undefined분 읽기

분산 LLM 학습 01 - 왜 LLM 학습은 분산 시스템 문제가 되는가

여러 GPU를 붙이는 순간 학습 코드는 계산만의 문제가 아니라 메모리와 통신, 장애 복구까지 포함한 시스템 문제가 된다

Lectures

March 4, 2026 undefined분 읽기

분산 학습 전략은 멋있는 기법을 조합하는 일이 아니라 현재 병목에 맞는 최소 구조를 선택하고 검증하는 일이다

Lectures

January 30, 2026 undefined분 읽기

GPU 아키텍처부터 CUDA, Triton, 커널 최적화까지 어떤 순서로 공부하면 되는지

Lectures

February 9, 2026 undefined분 읽기

Triton과 실제 커널 최적화를 연결해서 GPU kernel engineer 관점의 감각을 잡기

Lectures