GPU 가상화의 목적
•
하드웨어 자원 최적화를 통해 불필요한 자원 낭비와 투자 최소화
•
효율적인 자원 공유를 통한 딥러닝, 머신 러닝 워크로드의 생산성을 향상
•
가상화 환경에서 원할한 Data Science 작업의 수행을 지원
탄력적 GPU 인프라
탄력적 On-demand 방식
- PCIe 또는 Network를 사용한 통신
- 수요 기반 리소스 Spin Up/Down 능력 제공
종류
1) Liquid, H3 Platform을 활용하는 PCIe 패브릭 사용 방식
- PCIe 패브릭 빌드를 통해 베어메탈 서버에 추가 (GPU, FPGA, NVMe 등)
2) Bitfusion FlexDirect를 활용하는 방식
- 컴퓨팅 서버와 GPU 서버 풀 간 원격 연결 (Ethernet, Infiniband RDMA, RoCE)
GPU 가상화 방법의 종류
1.
DirectPath I/O
•
VM에서 하이퍼바이저를 거치지 않고 물리적 하드웨어의 PCI에 직접 접근할 수 있도록 하는 기술
ESXi 호스트가 설치된 서버에 장착된 물리적인 GPU에 VM이 Direct 접근 가능
2. GRID
•
서버에 설치된 물리적 GPU를 공유할 수 있도록 모든 가상 시스템(VM)을 지원하는 가상 GPU를 생성하는 기술 및 솔루션
•
NVIDIA GPU 가속 프로토콜을 사용하여 전체 시스템 지연시간과 호스트 CPU 사용률을 절감하는 효과 제공
3. FlexDirect
호스트 단위의 가상화가 아닌 데이터센터 측면의 GPU 가상화와 자원 통합을 지원하는 유연성 제공