재영의 기술 블로그

Jae의 기술 노트

개념을 깊게 이해하고 싶은 엔지니어를 위한 시스템 중심 글쓰기.

플랫폼 엔지니어링, 리눅스, 컴파일러, MLOps, 컴퓨터 구조를 다루는 긴 글들을 모았습니다. 용어만 훑는 대신, 실제로 판단할 때 필요한 감각을 만드는 데 초점을 둡니다.

여기서 시작하기 추천 시리즈

처음 들어온 독자에게 좋은 시작점입니다.

최근 글 둘러보기 총 119개 글

새로 올라온 글과 진행 중인 시리즈를 모아봤습니다.

총 21개 글 총 49분

GPU 시스템

GPU 아키텍처, CUDA 커널, Triton, 그리고 실제 커널 최적화까지 이어지는 흐름

GPU가 실제로 어떻게 계산을 수행하는지 이해하고, 나중에는 직접 커널을 작성하고 최적화하고 싶은 엔지니어.

MLOps 기초

데이터 파이프라인부터 프로덕션 모니터링까지, ML 시스템 운영의 기초

모델 실험에서 프로덕션 운영으로 넘어가려는 ML 엔지니어, 데이터 사이언티스트, 백엔드 엔지니어.

오토마타와 컴파일러

유한 오토마타와 형식 언어부터 컴파일러 구현까지

언어 처리 이론과 실제 컴파일러 구현 사이의 연결을 함께 보고 싶은 독자.

GPU 시스템

GPU 아키텍처, CUDA 커널, Triton, 그리고 실제 커널 최적화까지 이어지는 흐름

21 개 글

시리즈 소개 보기 →

MLOps 기초

데이터 파이프라인부터 프로덕션 모니터링까지, ML 시스템 운영의 기초

10 개 글

시리즈 소개 보기 →

오토마타와 컴파일러

유한 오토마타와 형식 언어부터 컴파일러 구현까지

12 개 글

시리즈 소개 보기 →

리눅스 내부 구조

프로세스와 메모리부터 컨테이너까지, 리눅스 커널의 내부 동작 이해하기

10 개 글

시리즈 소개 보기 →

컴퓨터 구조

CPU 내부 구조와 권한 수준부터 메모리 계층과 현대 멀티코어 프로세서까지

10 개 글

시리즈 소개 보기 →

플랫폼 엔지니어링 기초

내부 개발자 플랫폼, 골든 패스, 개발자 셀프서비스의 원리를 이해하기

11 개 글

시리즈 소개 보기 →

분산 LLM 학습

data parallel부터 tensor parallel, FSDP, ZeRO, 그리고 현대 LLM 학습 프레임워크까지

20 개 글

시리즈 소개 보기 →

PyTorch 내부 구조

텐서, autograd, CUDA extension을 이해하고 커스텀 커널을 실제 학습 코드에 연결하기

20 개 글

시리즈 소개 보기 →

Python 강좌 시리즈

깊이있게 배우는 Python 프로그래밍 강좌

5 개 글

시리즈 소개 보기 →

February 2, 2026 undefined분 읽기

분산 LLM 학습 10 - Sequence Parallel과 긴 컨텍스트의 비용

모델 크기만 커지는 것이 아니라 컨텍스트 길이도 길어지면 activation 메모리와 통신 패턴이 다시 달라진다

Lectures

February 1, 2026 undefined분 읽기

GPU 시스템 02 - Thread, Warp, Block 실행 모델

GPU의 thread, warp, block, grid가 실제 실행에서 어떤 의미를 가지는지

Lectures

February 1, 2026 undefined분 읽기

PyTorch 내부 구조 10 - CUDA Extension으로 Custom Kernel 연결하기

CUDA kernel을 PyTorch operator로 만들려면 kernel 코드뿐 아니라 tensor contract와 runtime semantics를 함께 맞춰야 한다

Lectures

January 31, 2026 undefined분 읽기

플랫폼 엔지니어링 06 - 개발자 포털과 서비스 카탈로그

Backstage 같은 개발자 포털이 흩어진 문서, 도구, 암묵지의 혼란을 어떻게 정리하는지

Lectures

January 30, 2026 undefined분 읽기

분산 LLM 학습 09 - Transformer에서 Tensor Parallel이 실제로 들어가는 위치

tensor parallel은 추상 개념이 아니라 attention projection, output projection, MLP 같은 구체적인 지점에 들어간다

Lectures

January 30, 2026 undefined분 읽기

GPU 시스템 01 - GPU Kernel Engineer 로드맵

GPU 아키텍처부터 CUDA, Triton, 커널 최적화까지 어떤 순서로 공부하면 되는지

Lectures

January 30, 2026 undefined분 읽기

MLOps 05 - 모델 서빙과 배포 전략

학습된 모델을 프로덕션에서 서빙하는 방법과 안전한 배포 전략

Lectures

January 29, 2026 undefined분 읽기

PyTorch 내부 구조 09 - C++ Extension의 기본 경로

C++ extension은 PyTorch runtime과 사용자 정의 연산을 연결하는 첫 번째 실전 관문이다

Lectures

January 28, 2026 undefined분 읽기

GPU 시스템 00 - 이 시리즈를 보기 전에 필요한 것들

GPU 시스템 시리즈를 제대로 따라가기 전에 어떤 배경지식이 필요한지 정리하기

Lectures