W poprzednim poście, Build a Pro Deep Learning Workstation… for Half the Price, podzieliłem się każdym szczegółem, aby kupić części i zbudować profesjonalnej jakości platformę do głębokiego uczenia za prawie połowę kosztów gotowych platform od firm takich jak Lambda i Bizon. Post rozszedł się wirusowo na Reddit i w kolejnych tygodniach Lambda obniżyła cenę swojej stacji roboczej z 4-GPU o około $1200.
To dobry początek w kierunku uczynienia głębokiego uczenia bardziej dostępnym, ale jeśli wolisz wydać $7000 zamiast $11,250+, oto jak.
W poprzednim poście stwierdziłem, że „nie ma idealnej konstrukcji”, ale gdyby istniała idealna konstrukcja przy najniższych kosztach, co by to było? To jest to, co pokazuję tutaj. Sprawdź poprzedni post, aby zapoznać się z objaśnieniami komponentów, benchmarkami i dodatkowymi opcjami dla tego zestawu 4-GPU deep learning rig.
Celem tego postu jest dokładne wyszczególnienie części, które należy kupić, aby zbudować najnowocześniejszy zestaw 4-GPU deep learning rig po najniższych możliwych kosztach. W oparciu o opinie, że w poprzednim poście było zbyt wiele opcji, wymieniam tylko najlepszą opcję dla każdego komponentu. Zbudowałem trzy warianty platform multi-GPU i ten, który tu przedstawiam, zapewnia najlepszą wydajność i niezawodność, bez dławienia termicznego, za najniższą cenę.
Dołączyłem mój paragon, pokazujący zakup wszystkich części do zbudowania dwóch takich platform za 14000 dolarów (7000 dolarów każda).
- Dokładnie, które części kupić
- 4 procesory graficzne RTX 2080 Ti (najszybszy procesor graficzny poniżej 2000 USD, prawdopodobnie przez kilka lat)
- Rosewill Hercules 1600W PSU (najtańszy zasilacz 1600W)
- 1TB m.2 SSD (do ultraszybkiego ładowania danych w głębokim uczeniu)
- 20-wątkowy procesor (wybierz Intela zamiast AMD dla szybkiej prędkości pojedynczego wątku)
- Płyta główna X299 (ta płyta główna w pełni obsługuje 4 GPU)
- Obudowa (wysoki przepływ powietrza utrzymuje chłodzenie GPU)
- 3TB Hard-drive (na dane i modele, do których nie masz regularnego dostępu)
- 128GB RAM (więcej RAM zmniejsza wąskie gardło między GPU a dyskiem)
- CPU Cooler (ten cooler nie blokuje przepływu powietrza w obudowie)
- Porównanie z 4-GPU stacją roboczą Lambda
- System operacyjny i wydajność
Dokładnie, które części kupić
Zamówiłem wszystko online przez NeweggBusiness, ale każdy sprzedawca (np. Amazon) działa. Jeśli masz w pobliżu lokalny sklep MicroCenter, często mają tanie ceny procesorów, jeśli kupujesz w sklepie fizycznym. Nie płać podatku, jeśli nie musisz (np. instytucje non-profit lub edukacyjne). Zarówno NeweggBusiness jak i Amazon akceptują dokumenty zwolnienia z podatku. Zobacz mój paragon za dwa z tych 4-GPU rigs.
Oto każdy komponent:
4 procesory graficzne RTX 2080 Ti (najszybszy procesor graficzny poniżej 2000 USD, prawdopodobnie przez kilka lat)
Gigabyte RTX 2080 Ti Turbo 11GB, 1280 USD (04/16/2019)
Te 2-PCI-slot dmuchane w stylu RTX 2080 TI GPU również będą działać:
1. ASUS GeForce RTX 2080 Ti 11G Turbo Edition GD, 1209 dolarów (03/21/2019)
2. ZOTAC Gaming GeForce RTX 2080 Ti Blower 11GB, $1299 (03/21/2019)
Rosewill Hercules 1600W PSU (najtańszy zasilacz 1600W)
Rosewill HERCULES 1600W Gold PSU, $209 (03/21/19)
1TB m.2 SSD (do ultraszybkiego ładowania danych w głębokim uczeniu)
HP EX920 M.2 1TB PCIe NVMe NAND SSD, 150$ (04/16/2019)
20-wątkowy procesor (wybierz Intela zamiast AMD dla szybkiej prędkości pojedynczego wątku)
Intel Core i9-9820X Skylake X 10-Core 3.3Ghz, 850$ (03/21/19)
Płyta główna X299 (ta płyta główna w pełni obsługuje 4 GPU)
ASUS WS X299 SAGE LGA 2066 Intel X299, 492$.26 (03/21/19)
Obudowa (wysoki przepływ powietrza utrzymuje chłodzenie GPU)
Corsair Carbide Series Air 540 ATX Case, $115 (04/16/2019)
3TB Hard-drive (na dane i modele, do których nie masz regularnego dostępu)
Seagate BarraCuda ST3000DM008 3TB 7200 RPM, 75$ (04/16/2019)
128GB RAM (więcej RAM zmniejsza wąskie gardło między GPU a dyskiem)
8 kijów CORSAIR Vengeance 16GB DRAM, $640 (04/16/2019)
CPU Cooler (ten cooler nie blokuje przepływu powietrza w obudowie)
Corsair Hydro Series H100i PRO Low Noise, $130 (04/16/2019)
Porównanie z 4-GPU stacją roboczą Lambda
Ta platforma 4-GPU o wartości 7000 USD jest podobna do 4-GPU stacji roboczej Lambda o wartości 11 250 USD. Jedyne różnice to (1) użycie 12-rdzeniowego procesora zamiast 10-rdzeniowego i (2) wnęka na dysk hot swap (50$).
System operacyjny i wydajność
System operacyjny, którego używam to Ubuntu Server 18.04 LTS. Używam Cuda 10.1 z TensorFlow (zainstalowanym za pomocą conda) i PyTorch (zainstalowanym za pomocą conda). Trenowałem wiele z tych maszyn ze 100% wykorzystaniem GPU na wszystkich czterech układach GPU przez ponad miesiąc bez żadnych problemów lub dławienia termicznego.
- Relatywne pozycjonowanie układów GPU w celu uzyskania optymalnej prędkości:
- Jak zbudować maszynę do głębokiego uczenia z wieloma układami GPU:
- Benchmarking procesorów graficznych RTX serii 20 dla głębokiego uczenia: