V předchozím příspěvku Sestavte si profesionální pracovní stanici pro hluboké učení… za poloviční cenu jsem se podělil o všechny podrobnosti k nákupu dílů a sestavení profesionální kvalitní platformy pro hluboké učení za téměř poloviční cenu oproti předpřipraveným platformám od společností jako Lambda a Bizon. Příspěvek se stal virálním na Redditu a v následujících týdnech Lambda snížila cenu své pracovní stanice se 4 GPU na přibližně 1 200 dolarů.
Je to dobrý začátek směrem k větší dostupnosti hlubokého učení, ale pokud byste raději utratili 7 000 dolarů místo více než 11 250 dolarů, zde je návod, jak na to.
V předchozím příspěvku jsem uvedl, že „neexistuje dokonalá sestava“, ale kdyby existovala dokonalá sestava za nejnižší cenu, jaká by to byla? To je to, co zde ukazuji. Podívejte se na předchozí příspěvek, kde najdete vysvětlení komponent, benchmarky a další možnosti této sestavy pro hluboké učení se 4 GPU.
Cílem tohoto příspěvku je přesně vyjmenovat, které součástky koupit, abyste si mohli postavit nejmodernější sestavu pro hluboké učení se 4 GPU za co nejnižší cenu. Na základě zpětné vazby, že v předchozím příspěvku bylo příliš mnoho možností, uvádím u každé komponenty pouze nejlepší možnost. Postavil jsem tři varianty multi-GPU rigů a ten, který zde uvádím, poskytuje nejlepší výkon a spolehlivost, bez tepelného škrcení, za nejnižší cenu.
Přiložil jsem účtenku, na které je uveden nákup všech dílů k sestavení dvou těchto rigů za 14 000 USD (7000 USD každý).
- Přesně které díly koupit
- 4 GPU RTX 2080 Ti (nejrychlejší GPU pod 2000 USD, pravděpodobně na několik let)
- Rosewill Hercules 1600W PSU (nejlevnější 1600W zdroj)
- 1TB m.2. SSD (pro ultrarychlé načítání dat při hlubokém učení)
- 20vláknový procesor (pro rychlou práci s jedním vláknem zvolte Intel místo AMD)
- Základní deska X299 (tato základní deska plně podporuje 4 GPU)
- Skříň (vysoký průtok vzduchu udržuje GPU chladné)
- 3TB pevný disk (pro data a modely, ke kterým nemáte pravidelný přístup)
- 128 GB RAM (více RAM snižuje úzké hrdlo mezi GPU a diskem)
- Chladič CPU (tento chladič neblokuje proudění vzduchu ve skříni)
- Srovnání se 4-GPU pracovní stanicí Lambda
- Provozní systém a výkon
Přesně které díly koupit
Objednal jsem vše online přes NeweggBusiness, ale funguje jakýkoli prodejce (např. Amazon). Pokud máte poblíž místní prodejnu MicroCenter, často mají levné ceny procesorů, pokud nakupujete v kamenné prodejně. Neplaťte daň, pokud nemusíte (např. neziskové nebo vzdělávací instituce). NeweggBusiness i Amazon přijímají doklady o osvobození od daně. Prohlédněte si můj účet za dvě z těchto sestav se 4 grafickými procesory.
Tady jsou jednotlivé komponenty:
4 GPU RTX 2080 Ti (nejrychlejší GPU pod 2000 USD, pravděpodobně na několik let)
Gigabyte RTX 2080 Ti Turbo 11GB, 1280 USD (16. 4. 2019)
Tyto GPU RTX 2080 TI s 2 sloty PCI ve stylu blower budou také fungovat:
1. ASUS GeForce RTX 2080 Ti 11G Turbo Edition GD, 1209 USD (21.03.2019)
2. ZOTAC Gaming GeForce RTX 2080 Ti Blower 11GB, 1299 USD (21.03.2019)
Rosewill Hercules 1600W PSU (nejlevnější 1600W zdroj)
Rosewill HERCULES 1600W Gold PSU, 209 USD (21.03.2019)
1TB m.2. SSD (pro ultrarychlé načítání dat při hlubokém učení)
HP EX920 M.2 1TB PCIe NVMe NAND SSD, 150 USD (16. 4. 2019)
20vláknový procesor (pro rychlou práci s jedním vláknem zvolte Intel místo AMD)
Intel Core i9-9820X Skylake X 10-Core 3.3Ghz, 850 USD (21.3.2019)
Základní deska X299 (tato základní deska plně podporuje 4 GPU)
ASUS WS X299 SAGE LGA 2066 Intel X299, 492 USD.26 (21.3.2019)
Skříň (vysoký průtok vzduchu udržuje GPU chladné)
Corsair Carbide Series Air 540 ATX Case, 115 USD (16.4.2019)
3TB pevný disk (pro data a modely, ke kterým nemáte pravidelný přístup)
Seagate BarraCuda ST3000DM008 3TB 7200 ot, $75 (16.4.2019)
128 GB RAM (více RAM snižuje úzké hrdlo mezi GPU a diskem)
8 pamětí CORSAIR Vengeance 16GB DRAM, $640 (16.04.2019)
Chladič CPU (tento chladič neblokuje proudění vzduchu ve skříni)
Corsair Hydro Series H100i PRO Low Noise, $130 (16.04.2019)
Srovnání se 4-GPU pracovní stanicí Lambda
Tato 4-GPU sestava za 7000 USD je podobná 4-GPU pracovní stanici Lambda za 11 250 USD. Liší se pouze tím, že (1) používá 12jádrový procesor místo 10jádrového a (2) obsahuje pozici pro hot swap disky (50 USD).
Provozní systém a výkon
Operační systém, který používám, je Ubuntu Server 18.04 LTS. Používám Cuda 10.1 s TensorFlow (nainstalováno pomocí conda) a PyTorch (nainstalováno pomocí conda). Více než měsíc jsem trénoval několik těchto strojů se 100% využitím všech čtyř GPU bez jakýchkoli problémů nebo tepelného přiškrcení.
- Relativní umístění GPU pro optimální rychlost:
- Jak sestavit stroj pro hluboké učení s více GPU:
- Benchmarking GPU řady RTX 20 pro hluboké učení: