재영의 기술 블로그

February 8, 2026 undefined분 읽기

컴퓨터 구조 07 - 메모리 계층 구조

레지스터에서 HDD까지 이어지는 메모리 계층과 캐시의 동작 원리

Lectures

February 17, 2026 undefined분 읽기

가상 메모리가 프로세스 격리를 가능하게 하는 원리와 MMU, 페이지 테이블, TLB의 동작

Lectures

February 24, 2026 undefined분 읽기

CPU가 외부 장치와 데이터를 주고받는 방식과 DMA를 통한 효율적 데이터 전송의 원리

Lectures

March 5, 2026 undefined분 읽기

클럭 속도의 한계를 넘어 멀티코어로 전환된 이유와 현대 프로세서 아키텍처의 핵심 개념

Lectures

January 6, 2026 undefined분 읽기

여러 GPU를 붙이는 순간 학습 코드는 계산만의 문제가 아니라 메모리와 통신, 장애 복구까지 포함한 시스템 문제가 된다

Lectures

January 9, 2026 undefined분 읽기

가장 기본적인 분산 학습 방식인 data parallel은 단순해 보이지만 gradient 동기화와 메모리 복제 비용을 함께 안고 있다

Lectures

January 12, 2026 undefined분 읽기

분산 학습에서 가장 자주 등장하는 collective인 all-reduce를 이해해야 gradient synchronization 비용을 제대로 읽을 수 있다

Lectures

January 15, 2026 undefined분 읽기

DDP는 단순 래퍼가 아니라 autograd hook, gradient bucket, process group을 사용해 동기화를 조직하는 런타임이다

Lectures

January 18, 2026 undefined분 읽기

GPU 수를 늘리는 일은 단순한 throughput 증가가 아니라 optimizer가 보는 batch 의미를 바꾸는 일이다

Lectures