재영의 기술 블로그
홈 아카이브 소개 게임

"sharding" 태그가 달린 포스트

February 14, 2026 undefined분 읽기

분산 LLM 학습 14 - ZeRO Stage 1, 2, 3는 각각 무엇을 없애는가

ZeRO는 하나의 기술이 아니라 어떤 메모리 복제를 줄일 것인지 단계적으로 선택하는 체계다

Lectures
더 읽기
February 17, 2026 undefined분 읽기

분산 LLM 학습 15 - FSDP는 DDP와 무엇이 다르고 언제 유리한가

FSDP는 전체 파라미터를 shard한 채 필요할 때만 모아 쓰는 방식으로 메모리 문제를 직접 겨냥한다

Lectures
더 읽기

© 2025 Jae · Notes on systems, software, and building things carefully.

RSS