Într-o postare anterioară, Build a Pro Deep Learning Workstation… for Half the Price (Construiți o stație de lucru profesională de învățare profundă… la jumătate de preț), am împărtășit fiecare detaliu pentru a cumpăra piese și a construi o platformă de învățare profundă de calitate profesională pentru aproape jumătate din costul platformelor pre-construite de la companii precum Lambda și Bizon. Postarea a devenit virală pe Reddit și, în săptămânile care au urmat, Lambda a redus prețul stației lor de lucru cu 4-GPU la aproximativ 1.200 de dolari.
Este un început bun pentru a face învățarea profundă mai accesibilă, dar dacă preferați să cheltuiți 7.000 de dolari în loc de peste 11.250 de dolari, iată cum.
În postarea anterioară am afirmat că „nu există o construcție perfectă”, dar dacă ar exista o construcție perfectă la cel mai mic cost, care ar fi aceasta? Asta este ceea ce arăt eu aici. Consultați postarea anterioară pentru explicații despre componente, analize comparative și opțiuni suplimentare pentru această platformă de învățare profundă cu 4-GPU.
Obiectivul acestei postări este de a enumera exact ce componente să cumpărați pentru a construi o platformă de învățare profundă cu 4-GPU de ultimă generație la cel mai mic cost posibil. Pe baza feedback-ului conform căruia au existat prea multe opțiuni în postarea anterioară, am enumerat doar o cea mai bună opțiune pentru fiecare componentă. Am construit trei variante de platforme multi-GPU și cea pe care o prezint aici oferă cea mai bună performanță și fiabilitate, fără thermal throttling, la cel mai ieftin cost.
Am inclus chitanța mea, care arată cumpărarea tuturor pieselor pentru a construi două dintre aceste platforme pentru 14000 $ (7000 $ fiecare).

- Exact ce piese să cumpărați
- 4 GPU RTX 2080 Ti (cel mai rapid GPU sub 2.000 de dolari, probabil pentru câțiva ani)
- Rosewill Hercules 1600W PSU (cea mai ieftină sursă de alimentare de 1600W)
- 1TB m.2 SSD (pentru încărcarea ultrarapidă a datelor în învățarea profundă)
- CPU cu 20 de fire (alegeți Intel în locul AMD pentru viteza rapidă a unui singur fir)
- Placă de bază X299 (această placă de bază suportă complet 4 GPU)
- Carcasă (fluxul mare de aer menține GPU-urile reci)
- 3TB Hard-disk (pentru date și modele pe care nu le accesați în mod regulat)
- 128GB RAM (mai multă memorie RAM reduce gâtul de gâtul de la GPU la disc)
- CPU Cooler (acest cooler nu blochează fluxul de aer din carcasă)
- Comparare cu stația de lucru cu 4-GPU de la Lambda
- Sistem de operare și performanță
Exact ce piese să cumpărați
Am comandat totul online prin NeweggBusiness, dar orice vânzător (de exemplu, Amazon) funcționează. Dacă aveți un magazin local MicroCenter în apropiere, aceștia au adesea prețuri ieftine la procesoare dacă achiziționați într-un magazin fizic. Nu plătiți taxe dacă nu este necesar (de exemplu, instituții non-profit sau de învățământ). Atât NeweggBusiness, cât și Amazon acceptă documente de scutire de taxe. Vizualizați chitanța mea pentru două dintre aceste platforme cu 4-GPU.
Iată fiecare componentă:
4 GPU RTX 2080 Ti (cel mai rapid GPU sub 2.000 de dolari, probabil pentru câțiva ani)
Gigabyte RTX 2080 Ti Turbo 11GB, 1280$ (04/16/2019)
Aceste GPU RTX 2080 TI cu 2 sloturi PCI în stil blower vor funcționa și ele:
1. ASUS GeForce RTX 2080 Ti 11G Turbo Edition GD, $1209 (21/03/2019)
2. ZOTAC Gaming GeForce RTX 2080 Ti Blower 11GB, 1299$ (21/03/2019)
Rosewill Hercules 1600W PSU (cea mai ieftină sursă de alimentare de 1600W)
Rosewill HERCULES 1600W Gold PSU, 209$ (21/03/19)
1TB m.2 SSD (pentru încărcarea ultrarapidă a datelor în învățarea profundă)
HP EX920 M.2 1TB PCIe NVMe NAND SSD de 1TB, 150$ (16/04/2019)
CPU cu 20 de fire (alegeți Intel în locul AMD pentru viteza rapidă a unui singur fir)
Intel Core i9-9820X Skylake X 10-Core 3.3Ghz, 850$ (21/03/19)
Placă de bază X299 (această placă de bază suportă complet 4 GPU)
ASUS WS X299 SAGE LGA 2066 Intel X299, 492$.26 (21/03/19)
Carcasă (fluxul mare de aer menține GPU-urile reci)
Corsair Carbide Series Air 540 ATX Case, 115 dolari (16/04/2019)
3TB Hard-disk (pentru date și modele pe care nu le accesați în mod regulat)
Seagate BarraCuda ST3000DM008 3TB 7200 RPM, 75 $ (16/04/2019)
128GB RAM (mai multă memorie RAM reduce gâtul de gâtul de la GPU la disc)
8 stick-uri de CORSAIR Vengeance 16GB DRAM, 640 $ (16/04/2019)
CPU Cooler (acest cooler nu blochează fluxul de aer din carcasă)
GPU Corsair Hydro Series H100i PRO Low Noise, 130 $ (16/04/2019)

Comparare cu stația de lucru cu 4-GPU de la Lambda
Această platformă cu 4-GPU de 7000 $ este similară cu stația de lucru cu 4-GPU de la Lambda de 11.250 $. Singurele diferențe sunt (1) folosesc un CPU cu 12 nuclee în loc de un CPU cu 10 nuclee și (2) includ un bay pentru unitățile hot swap (50 $).
Sistem de operare și performanță
Sistemul de operare pe care îl folosesc este Ubuntu Server 18.04 LTS. Folosesc Cuda 10.1 cu TensorFlow (instalat prin conda) și PyTorch (instalat prin conda). Am antrenat mai multe dintre aceste mașini cu o utilizare de 100% a GPU-urilor pe toate cele patru GPU-uri timp de peste o lună, fără probleme sau gâtuire termică.
- Posibilizarea relativă a GPU-urilor pentru o viteză optimă:
- Cum să construiți o mașină de învățare profundă multi-GPU:
- Benchmarking RTX 20-series GPUs for deep learning: