orangingq
메뉴
orangingq
컨텐츠 검색
태그
transport protocols
centralized traffic engineering
datacenter transport
NVSHMEM
wide-area networks
spmd
performance isolation
memory efficiency
computer vision
roce
Network
Distributed_Learning
datacenter networks
software-defined network
stochastic depth
architectures
training efficiency
GPUDirect RDMA
infiniband
IBGDA
최근글
댓글
공지사항
아카이브
Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism
2024. 4. 30. 22:39
ㆍ
논문 정리
보호되어 있는 글입니다. 내용을 보시려면 비밀번호를 입력하세요.
확인
티스토리툴바
orangingq
구독하기