여기서 시작하기

이 블로그는 주제가 꽤 넓어서 아무 글이나 랜덤하게 들어가면 오히려 흐름을 놓치기 쉽다.

조금 더 좋은 방법은 먼저 방향을 정하는 것이다.

시스템 감각을 먼저 키우고 싶다면

다음부터 시작하는 편이 좋다.

왜 이 순서가 좋은가:

이 세 시리즈는 이후의 글들을 읽는 바닥 감각을 만들어 준다. 성능, 메모리, 스케줄링, 런타임 동작, 디버깅을 덜 추상적으로 보게 해 준다.

다음 세 시리즈를 하나의 흐름으로 보는 편이 좋다.

왜 이 흐름이 좋은가:

GPU 시스템은 하드웨어와 커널이 어떻게 동작하는지 설명하고, PyTorch 내부 구조는 그 커널이 실제 학습 코드와 어떻게 연결되는지 설명하며, 분산 LLM 학습은 여러 GPU와 노드로 학습이 커졌을 때 어떤 문제가 생기는지를 설명한다.

다음부터 시작하면 좋다.

왜 이 흐름이 좋은가:

이 두 시리즈는 모델 자체보다 실제 시스템 운영에 가깝다. 파이프라인, 배포, 관측성, 셀프서비스, 운영 제약, 팀 생산성 같은 문제를 더 직접적으로 다룬다.

다음부터 읽는 편이 좋다.

왜 이 조합이 좋은가:

컴파일러는 형식 언어 이론만으로 이해하면 추상적으로 남기 쉽다. 하드웨어와 런타임 감각을 같이 가져가면 IR, 최적화, 코드 생성이 훨씬 잘 읽힌다.

다음 시리즈가 비교적 진입 장벽이 낮다.

이 두 시리즈는 상대적으로 덜 무겁지만, 나중에 더 깊은 시스템 글로 넘어갈 때 연결점이 많다.

이 순서도 무난하다.

이것이 유일한 정답은 아니지만, 꽤 일관된 읽기 흐름이다.