재영의 기술 블로그

Jae의 기술 노트

개념을 깊게 이해하고 싶은 엔지니어를 위한 시스템 중심 글쓰기.

플랫폼 엔지니어링, 리눅스, 컴파일러, MLOps, 컴퓨터 구조를 다루는 긴 글들을 모았습니다. 용어만 훑는 대신, 실제로 판단할 때 필요한 감각을 만드는 데 초점을 둡니다.

여기서 시작하기 추천 시리즈

처음 들어온 독자에게 좋은 시작점입니다.

최근 글 둘러보기 총 119개 글

새로 올라온 글과 진행 중인 시리즈를 모아봤습니다.

총 21개 글 총 49분

GPU 시스템

GPU 아키텍처, CUDA 커널, Triton, 그리고 실제 커널 최적화까지 이어지는 흐름

GPU가 실제로 어떻게 계산을 수행하는지 이해하고, 나중에는 직접 커널을 작성하고 최적화하고 싶은 엔지니어.

MLOps 기초

데이터 파이프라인부터 프로덕션 모니터링까지, ML 시스템 운영의 기초

모델 실험에서 프로덕션 운영으로 넘어가려는 ML 엔지니어, 데이터 사이언티스트, 백엔드 엔지니어.

오토마타와 컴파일러

유한 오토마타와 형식 언어부터 컴파일러 구현까지

언어 처리 이론과 실제 컴파일러 구현 사이의 연결을 함께 보고 싶은 독자.

GPU 시스템

GPU 아키텍처, CUDA 커널, Triton, 그리고 실제 커널 최적화까지 이어지는 흐름

21 개 글

시리즈 소개 보기 →

MLOps 기초

데이터 파이프라인부터 프로덕션 모니터링까지, ML 시스템 운영의 기초

10 개 글

시리즈 소개 보기 →

오토마타와 컴파일러

유한 오토마타와 형식 언어부터 컴파일러 구현까지

12 개 글

시리즈 소개 보기 →

리눅스 내부 구조

프로세스와 메모리부터 컨테이너까지, 리눅스 커널의 내부 동작 이해하기

10 개 글

시리즈 소개 보기 →

컴퓨터 구조

CPU 내부 구조와 권한 수준부터 메모리 계층과 현대 멀티코어 프로세서까지

10 개 글

시리즈 소개 보기 →

플랫폼 엔지니어링 기초

내부 개발자 플랫폼, 골든 패스, 개발자 셀프서비스의 원리를 이해하기

11 개 글

시리즈 소개 보기 →

분산 LLM 학습

data parallel부터 tensor parallel, FSDP, ZeRO, 그리고 현대 LLM 학습 프레임워크까지

20 개 글

시리즈 소개 보기 →

PyTorch 내부 구조

텐서, autograd, CUDA extension을 이해하고 커스텀 커널을 실제 학습 코드에 연결하기

20 개 글

시리즈 소개 보기 →

Python 강좌 시리즈

깊이있게 배우는 Python 프로그래밍 강좌

5 개 글

시리즈 소개 보기 →

January 21, 2026 undefined분 읽기

오토마타와 컴파일러 06 - 어휘 분석

소스 코드를 토큰으로 쪼개는 어휘 분석기의 원리와 오토마타 이론이 실제로 적용되는 지점

Lectures

January 21, 2026 undefined분 읽기

분산 LLM 학습 06 - LLM 학습의 메모리는 어디에 쓰이는가

파라미터만 보는 순간 분산 학습 판단을 잘못하게 된다. activation, gradient, optimizer state를 함께 봐야 한다

Lectures

January 20, 2026 undefined분 읽기

PyTorch 내부 구조 06 - Custom Autograd Function을 언제 어떻게 써야 하는가

custom autograd function은 빠른 실험 도구이기도 하지만 backward 책임을 직접 지는 계층이기도 하다

Lectures

January 19, 2026 undefined분 읽기

리눅스 내부 구조 04 - 메모리 관리

가상 메모리의 개념과 리눅스 커널이 메모리를 관리하는 방법

Lectures

January 18, 2026 undefined분 읽기

컴퓨터 구조 04 - 파이프라인과 병렬 처리

명령어 파이프라이닝, 해저드 처리, 분기 예측, 슈퍼스칼라와 비순차 실행

Lectures

January 18, 2026 undefined분 읽기

분산 LLM 학습 05 - Global Batch Size, Gradient Accumulation, Learning Rate Scaling

GPU 수를 늘리는 일은 단순한 throughput 증가가 아니라 optimizer가 보는 batch 의미를 바꾸는 일이다

Lectures

January 17, 2026 undefined분 읽기

플랫폼 엔지니어링 04 - 골든 패스 설계하기

개발자가 실제로 따르고 싶은 골든 패스를 설계하는 방법 — 원칙, 단계별 프로세스, 이탈 팀 대응법

Lectures

January 17, 2026 undefined분 읽기

PyTorch 내부 구조 05 - Autograd Graph와 Engine은 어떻게 동작하는가

autograd는 단순 미분 기능이 아니라 연산 그래프와 gradient propagation을 조직하는 런타임이다

Lectures

January 15, 2026 undefined분 읽기

분산 LLM 학습 04 - PyTorch DDP는 내부에서 무엇을 하는가

DDP는 단순 래퍼가 아니라 autograd hook, gradient bucket, process group을 사용해 동기화를 조직하는 런타임이다

Lectures