재영의 기술 블로그
홈 아카이브 소개 게임

"cuda" 태그가 달린 포스트

January 26, 2026 undefined분 읽기

PyTorch 내부 구조 08 - CUDA Stream, Event, Asynchronous Execution

PyTorch의 CUDA 연산은 기본적으로 비동기이기 때문에 실제 병목을 읽으려면 stream semantics를 알아야 한다

Lectures
더 읽기
February 16, 2026 undefined분 읽기

PyTorch 내부 구조 15 - PyTorch Profiling으로 Operator 병목 읽기

internals를 이해하는 목적은 결국 profile에서 시간을 어디서 잃는지 읽고 바꿀 수 있게 되는 데 있다

Lectures
더 읽기
← Previous
1 2 3
Next →

© 2025 Jae · Notes on systems, software, and building things carefully.

RSS