이 블로그는 주제가 꽤 넓어서 아무 글이나 랜덤하게 들어가면 오히려 흐름을 놓치기 쉽다.
조금 더 좋은 방법은 먼저 방향을 정하는 것이다.
- 시스템 감각을 키우고 싶은가
- GPU / LLM 인프라를 깊게 공부하고 싶은가
- 언어와 컴파일러 기초를 다지고 싶은가
- 프로덕션 ML과 플랫폼 운영을 보고 싶은가
시스템 감각을 먼저 키우고 싶다면
다음부터 시작하는 편이 좋다.
왜 이 순서가 좋은가:
이 세 시리즈는 이후의 글들을 읽는 바닥 감각을 만들어 준다. 성능, 메모리, 스케줄링, 런타임 동작, 디버깅을 덜 추상적으로 보게 해 준다.
추천 순서:
GPU / LLM 인프라를 공부하고 싶다면
다음 세 시리즈를 하나의 흐름으로 보는 편이 좋다.
왜 이 흐름이 좋은가:
GPU 시스템은 하드웨어와 커널이 어떻게 동작하는지 설명하고, PyTorch 내부 구조는 그 커널이 실제 학습 코드와 어떻게 연결되는지 설명하며, 분산 LLM 학습은 여러 GPU와 노드로 학습이 커졌을 때 어떤 문제가 생기는지를 설명한다.
추천 순서:
ML을 실제 운영 환경에서 보고 싶다면
다음부터 시작하면 좋다.
왜 이 흐름이 좋은가:
이 두 시리즈는 모델 자체보다 실제 시스템 운영에 가깝다. 파이프라인, 배포, 관측성, 셀프서비스, 운영 제약, 팀 생산성 같은 문제를 더 직접적으로 다룬다.
추천 순서:
언어 / 컴파일러 기초를 보고 싶다면
다음부터 읽는 편이 좋다.
왜 이 조합이 좋은가:
컴파일러는 형식 언어 이론만으로 이해하면 추상적으로 남기 쉽다. 하드웨어와 런타임 감각을 같이 가져가면 IR, 최적화, 코드 생성이 훨씬 잘 읽힌다.
조금 더 가볍게 들어오고 싶다면
다음 시리즈가 비교적 진입 장벽이 낮다.
이 두 시리즈는 상대적으로 덜 무겁지만, 나중에 더 깊은 시스템 글로 넘어갈 때 연결점이 많다.
블로그 전체를 하나의 긴 학습 경로로 본다면
이 순서도 무난하다.
이것이 유일한 정답은 아니지만, 꽤 일관된 읽기 흐름이다.