I et tidligere indlæg, Build a Pro Deep Learning Workstation… for Half the Price, delte jeg alle detaljer om at købe dele og bygge en dyb læringsrig i professionel kvalitet for næsten halvdelen af prisen på færdigbyggede rigs fra virksomheder som Lambda og Bizon. Indlægget gik viralt på Reddit, og i de efterfølgende uger sænkede Lambda prisen på deres 4-GPU-arbejdsstation til omkring 1.200 dollars.
Det er en god start på vejen mod at gøre deep learning mere tilgængeligt, men hvis du hellere vil bruge 7.000 dollars i stedet for 11.250+ dollars, kan du se her hvordan.
I det foregående indlæg sagde jeg, at “der findes ikke noget perfekt build”, men hvis der fandtes et perfekt build til den laveste pris, hvad ville det så være? Det er det, jeg viser her. Tjek det tidligere indlæg for komponentforklaringer, benchmarking og yderligere muligheder for denne 4-GPU deep learning rig.
Målet med dette indlæg er at liste præcis hvilke dele der skal købes for at bygge en state-of-the-art 4-GPU deep learning rig til den billigst mulige pris. Baseret på feedback om, at der var for mange muligheder i det tidligere indlæg, opregner jeg kun en bedste mulighed for hver komponent. Jeg byggede tre variationer af multi-GPU-rigge, og den, jeg præsenterer her, giver den bedste ydelse og pålidelighed uden termisk throttling til den billigste pris.
Jeg har inkluderet min kvittering, der viser købet af alle dele til at bygge to af disse rigge for 14000 dollars (7000 dollars hver).
- Helt præcist hvilke dele jeg skal købe
- 4 RTX 2080 Ti GPU’er (hurtigste GPU under 2000 $, sandsynligvis i et par år)
- Rosewill Hercules 1600W PSU (billigste 1600W strømforsyning)
- 1TB m.2 SSD (til ultrahurtig dataindlæsning i deep learning)
- 20-thread CPU (vælg Intel frem for AMD for hurtig enkelttrådshastighed)
- X299 Bundkort (dette bundkort understøtter fuldt ud 4 GPU’er)
- Kuffert (høj luftgennemstrømning holder GPU’erne kølige)
- 3 TB harddisk (til data og modeller, som du ikke har regelmæssig adgang til)
- 128 GB RAM (flere RAM reducerer flaskehalsen mellem GPU og disk)
- CPU-køler (denne køler blokerer ikke case airflow)
- Sammenligning med Lambdas 4-GPU-arbejdsstation
- Bedriftssystem og ydeevne
Helt præcist hvilke dele jeg skal købe
Jeg bestilte alt online via NeweggBusiness, men enhver forhandler (f.eks. Amazon) virker. Hvis du har en lokal MicroCenter butik i nærheden, har de ofte billige CPU priser, hvis du køber i en fysisk butik. Lad være med at betale skat, hvis du ikke behøver det (f.eks. non-profit- eller uddannelsesinstitutioner). Både NeweggBusiness og Amazon accepterer skattefritagelsesdokumenter. Se min kvittering for to af disse 4-GPU rigs.
Her er hver enkelt komponent:
4 RTX 2080 Ti GPU’er (hurtigste GPU under 2000 $, sandsynligvis i et par år)
Gigabyte RTX 2080 Ti Turbo 11GB, 1280 $ (16/04/2019)
Disse 2-PCI-slot blower-style RTX 2080 TI GPU’er vil også fungere:
1. ASUS GeForce RTX 2080 Ti 11G Turbo Edition GD, $1209 (21/03/2019)
2. ZOTAC Gaming GeForce RTX 2080 Ti Blower 11GB, $1299 (21/03/2019)
Rosewill Hercules 1600W PSU (billigste 1600W strømforsyning)
Rosewill HERCULES 1600W Gold PSU, $209 (21/03/19)
1TB m.2 SSD (til ultrahurtig dataindlæsning i deep learning)
HP EX920 M.2 1 TB PCIe NVMe NAND SSD, $150 (16/04/2019)
20-thread CPU (vælg Intel frem for AMD for hurtig enkelttrådshastighed)
Intel Core i9-9820X Skylake X 10-Core 3.3Ghz, $850 (21/03/19)
X299 Bundkort (dette bundkort understøtter fuldt ud 4 GPU’er)
ASUS WS X299 SAGE LGA 2066 Intel X299, $492.26 (21/03/19)
Kuffert (høj luftgennemstrømning holder GPU’erne kølige)
Corsair Carbide Series Air 540 ATX-kasse, 115 $ (16/04/2019)
3 TB harddisk (til data og modeller, som du ikke har regelmæssig adgang til)
Seagate BarraCuda ST3000DM008 3TB 7200 RPM, $75 (16/04/2019)
128 GB RAM (flere RAM reducerer flaskehalsen mellem GPU og disk)
8 sticks CORSAIR Vengeance 16 GB DRAM, $640 (16/04/2019)
CPU-køler (denne køler blokerer ikke case airflow)
Corsair Hydro Series H100i PRO Low Noise, $130 (16/04/2019)
Sammenligning med Lambdas 4-GPU-arbejdsstation
Denne $7000 4-GPU-rig ligner Lambdas $11.250 Lambdas 4-GPU-arbejdsstation. De eneste forskelle er (1) de bruger en 12-core CPU i stedet for en 10-core CPU og (2) de inkluderer et hot swap-drevsskakt ($50).
Bedriftssystem og ydeevne
Det styresystem, jeg bruger, er Ubuntu Server 18.04 LTS. Jeg bruger Cuda 10.1 med TensorFlow (installeret ved hjælp af conda) og PyTorch (installeret ved hjælp af conda). Jeg har trænet flere af disse maskiner med 100% GPU-udnyttelse på alle fire GPU’er i over en måned uden problemer eller termisk throttling.
- Relativ positionering af GPU’er for optimal hastighed:
- Hvordan man opbygger en multi-GPU dyb læringsmaskine:
- Benchmarking af RTX 20-seriens GPU’er til dyb læring: