In einem früheren Beitrag, Build a Pro Deep Learning Workstation… for Half the Price, teilte ich jedes Detail, um Teile zu kaufen und eine professionelle Qualität Deep Learning Rig für fast die Hälfte der Kosten von vorgefertigten Rigs von Unternehmen wie Lambda und Bizon zu bauen. Der Beitrag ging auf Reddit viral und in den darauffolgenden Wochen senkte Lambda den Preis für seine 4-GPU-Workstation auf etwa 1200 US-Dollar.
Das ist ein guter Anfang, um Deep Learning zugänglicher zu machen, aber wenn Sie lieber 7000 US-Dollar statt 11.250 US-Dollar ausgeben möchten, erfahren Sie hier, wie das geht.
Im vorherigen Beitrag habe ich erklärt, dass es „kein perfektes System“ gibt, aber wenn es ein perfektes System zu den niedrigsten Kosten gäbe, wie würde es aussehen? Das ist es, was ich hier zeige. Im vorherigen Beitrag finden Sie Erklärungen zu den Komponenten, Benchmarking und zusätzliche Optionen für dieses 4-GPU Deep Learning Rig.
Das Ziel dieses Beitrags ist es, genau aufzulisten, welche Teile Sie kaufen müssen, um ein hochmodernes 4-GPU Deep Learning Rig zu möglichst geringen Kosten zu bauen. Aufgrund des Feedbacks, dass es im vorherigen Beitrag zu viele Optionen gab, liste ich nur eine beste Option für jede Komponente auf. Ich habe drei Varianten von Multi-GPU-Rigs gebaut, und das, das ich hier vorstelle, bietet die beste Leistung und Zuverlässigkeit, ohne thermisches Throttling, zu den günstigsten Kosten.
Ich habe meine Quittung beigefügt, die den Kauf aller Teile zeigt, um zwei dieser Rigs für $14000 ($7000 pro Stück) zu bauen.
- Exakt, welche Teile man kaufen sollte
- 4 RTX 2080 Ti GPUs (schnellste GPU unter $2000, wahrscheinlich für ein paar Jahre)
- Rosewill Hercules 1600W PSU (günstigstes 1600W-Netzteil)
- 1TB m.2 SSD (für ultraschnelles Laden von Daten beim Deep Learning)
- 20-Thread-CPU (wählen Sie Intel statt AMD für schnelle Single-Thread-Geschwindigkeit)
- X299 Motherboard (dieses Motherboard unterstützt vollständig 4 GPUs)
- Gehäuse (hoher Luftstrom hält die GPUs kühl)
- 3TB-Festplatte (für Daten und Modelle, auf die Sie nicht regelmäßig zugreifen)
- 128GB RAM (mehr RAM reduziert den Engpass zwischen GPU und Festplatte)
- CPU-Kühler (dieser Kühler blockiert den Luftstrom im Gehäuse nicht)
- Vergleich mit der 4-GPU-Workstation von Lambda
- Betriebssystem und Leistung
Exakt, welche Teile man kaufen sollte
Ich habe alles online über NeweggBusiness bestellt, aber jeder Anbieter (z.B. Amazon) funktioniert. Wenn Sie einen MicroCenter-Laden in der Nähe haben, haben sie oft günstige CPU-Preise, wenn Sie in einem Ladengeschäft kaufen. Zahlen Sie keine Steuern, wenn Sie das nicht müssen (z. B. gemeinnützige oder Bildungseinrichtungen). Sowohl NeweggBusiness als auch Amazon akzeptieren Dokumente zur Steuerbefreiung. Sehen Sie sich meine Quittung für zwei dieser 4-GPU-Rigs an.
Hier ist jede Komponente:
4 RTX 2080 Ti GPUs (schnellste GPU unter $2000, wahrscheinlich für ein paar Jahre)
Gigabyte RTX 2080 Ti Turbo 11GB, $1280 (16.04.2019)
Diese 2-PCI-Slot Blower-Style RTX 2080 TI GPU wird auch funktionieren:
1. ASUS GeForce RTX 2080 Ti 11G Turbo Edition GD, $1209 (21.03.2019)
2. ZOTAC Gaming GeForce RTX 2080 Ti Blower 11GB, $1299 (21.03.2019)
Rosewill Hercules 1600W PSU (günstigstes 1600W-Netzteil)
Rosewill HERCULES 1600W Gold PSU, $209 (21.03.19)
1TB m.2 SSD (für ultraschnelles Laden von Daten beim Deep Learning)
HP EX920 M.2 1TB PCIe NVMe NAND SSD, $150 (16.04.2019)
20-Thread-CPU (wählen Sie Intel statt AMD für schnelle Single-Thread-Geschwindigkeit)
Intel Core i9-9820X Skylake X 10-Core 3.3Ghz, $850 (03/21/19)
X299 Motherboard (dieses Motherboard unterstützt vollständig 4 GPUs)
ASUS WS X299 SAGE LGA 2066 Intel X299, $492.26 (21.03.19)
Gehäuse (hoher Luftstrom hält die GPUs kühl)
Corsair Carbide Series Air 540 ATX Case, $115 (16.04.2019)
3TB-Festplatte (für Daten und Modelle, auf die Sie nicht regelmäßig zugreifen)
Seagate BarraCuda ST3000DM008 3TB 7200 RPM, $75 (16.04.2019)
128GB RAM (mehr RAM reduziert den Engpass zwischen GPU und Festplatte)
8 Sticks CORSAIR Vengeance 16GB DRAM, $640 (16.04.2019)
CPU-Kühler (dieser Kühler blockiert den Luftstrom im Gehäuse nicht)
Corsair Hydro Series H100i PRO Low Noise, $130 (16.04.2019)
Vergleich mit der 4-GPU-Workstation von Lambda
Dieses 7000 $ 4-GPU-Rig ist ähnlich wie die 11.250 $ 4-GPU-Workstation von Lambda. Die einzigen Unterschiede sind (1) eine 12-Kern-CPU anstelle einer 10-Kern-CPU und (2) ein Hot-Swap-Laufwerksschacht ($50).
Betriebssystem und Leistung
Das von mir verwendete Betriebssystem ist Ubuntu Server 18.04 LTS. Ich verwende Cuda 10.1 mit TensorFlow (installiert mit conda) und PyTorch (installiert mit conda). Ich habe mehrere dieser Maschinen mit 100% GPU-Auslastung auf allen vier GPUs über einen Monat lang ohne Probleme oder thermische Drosselung trainiert.
- Relative Positionierung der GPUs für optimale Geschwindigkeit:
- Wie man eine Multi-GPU Deep Learning Maschine baut:
- Benchmarking von RTX 20-Serien-GPUs für Deep Learning: