Search
Duplicate

GPU 가상화 - Bitfusion

태그

Bitfusion FlexDirect

VMware vSphere의 FlexDirect는 여러 VM간에 부분, 전체 또는 여러 GPU를 공유 할 수 있는 기능을 제공한다
GPU를 기존 컴퓨팅 리소스와 유사하게 추상화, 분할 및 공유할 수 있는 리소스로 만들어준다
모든 크기의 부분 GPU로 분할 가능하며, 네트워크를 통해 VM에서 GPU에 엑세스를 가능하게 해주며 즉, 데이터 센터 어느 곳에서나 실행되는 VM은 별도의 ESXi 호스트에 물리적으로 설치된 GPU 리소스에 엑세스 가능하다

Bitfusion FlexDirect 장점

1. 효율적 런타임 최적화
Bitfusion 가상화 계층에는 다음과 같은 여러 가지 런타임 최적화가 있어서 최적의 전송 조합을 자동으로 조정할 수 있다
호스트 CPU 복사본, PCIe, 이더넷, Infiniband, GPU Direct RDMA를 통해 탁월한 결과를 얻을 수 있다
2. 모든 환경에서의 이용성
Bitfusion FlexDirect는 기존 베어메탈, 가상머신, 하이퍼바이저, 컨테이너형 어플리케이션 등과 완벽히 통합되고 운영체제, 하드웨어 그리고 코드 변경이 불필요하다.
3 . TCO 절감 및 가속기 활용도 증가
FlexDirect를 사용하면 GPU를 원격으로 모든 시스템에 연결할 수 있을 뿐만 아니라, TCO를 절감할 수 있으면서, 단일 GPU를 모든 크기의 여러 가상 GPU로 분할함과 동시에, 동일 GPU에서 병렬 실행할 더 많은 워크로드를 패키징함을 통해 사용률을 높일 수 있다.
4. Elastic GPU 풀 제공
물리적 위치와 관계없이 모든 GPU 서버가 조직의 모든 AI 요구를 Elastic하고 최대 유틸리티로 통합 클러스터로 지원
가상 클러스터는 낮에 짧은 사용 주기가 있는 개발 등 여러 개인 데이터로 구성될 수 있으며, 밤에는 클러스터가 더 긴 교육 주기 동안 할당됨

Bitfusion FlexDirect 아키텍처

Server – VM 또는 컨테이너 안에 모든 Bitfusion 구성요소와 GPU 제조업체에 필요한 드라이버가 내장 Client – VM 또는 컨테이너 안에 있는 구성요소로 CUDA 또는 OpenCL 기반 APP을 실행한다.