Dans un post précédent, Build a Pro Deep Learning Workstation… for Half the Price, j’ai partagé tous les détails pour acheter des pièces et construire un rig d’apprentissage profond de qualité professionnelle pour près de la moitié du coût des rigs pré-construits de sociétés comme Lambda et Bizon. Le post est devenu viral sur Reddit et dans les semaines qui ont suivi, Lambda a réduit le prix de sa station de travail à 4 GPU autour de 1200 $.
C’est un bon début pour rendre l’apprentissage profond plus accessible, mais si vous préférez dépenser 7000 $ au lieu de 11 250 $ et plus, voici comment.
Dans le post précédent, j’ai déclaré, « il n’y a pas de construction parfaite », mais s’il y avait une construction parfaite au plus bas coût, qu’est-ce que ce serait ? C’est ce que je montre ici. Consultez le post précédent pour des explications sur les composants, des analyses comparatives et des options supplémentaires pour ce rig d’apprentissage profond 4-GPU.
Le but de ce post est de lister exactement les pièces à acheter pour construire un rig d’apprentissage profond 4-GPU de pointe au coût le plus bas possible. Sur la base des commentaires selon lesquels il y avait trop d’options dans le post précédent, je ne liste qu’une meilleure option pour chaque composant. J’ai construit trois variations de rigs multi-GPU et celui que je présente ici fournit les meilleures performances et la fiabilité, sans étranglement thermique, pour le coût le moins cher.
J’ai inclus mon reçu, montrant l’achat de toutes les pièces pour construire deux de ces rigs pour 14000 $ (7000 $ chacun).
- Exactement quelles pièces acheter
- 4 GPU RTX 2080 Ti (GPU le plus rapide sous les 2000 $, probablement pour quelques années)
- Rosewill Hercules 1600W PSU (alimentation 1600W la moins chère)
- 1TB m.2. SSD (pour le chargement ultra-rapide de données dans l’apprentissage profond)
- Processeur à 20 threads (choisissez Intel plutôt qu’AMD pour une vitesse rapide à un seul thread)
- Carte mère X299 (cette carte mère supporte entièrement 4 GPU)
- Coffre (le flux d’air élevé garde les GPU au frais)
- Disque dur 3TB (pour les données et les modèles auxquels vous n’accédez pas régulièrement)
- 128 Go de RAM (plus de RAM réduit le goulot d’étranglement entre le GPU et le disque)
- Refroidisseur de CPU (ce refroidisseur ne bloque pas le flux d’air du boîtier)
- Comparaison avec la station de travail 4-GPU de Lambda
- Système d’exploitation et performances
Exactement quelles pièces acheter
J’ai tout commandé en ligne via NeweggBusiness, mais tout vendeur (par exemple Amazon) fonctionne. Si vous avez un magasin MicroCenter local à proximité, ils ont souvent des prix de CPU bon marché si vous achetez dans un magasin physique. Ne payez pas de taxe si vous n’en avez pas besoin (par exemple, les institutions à but non lucratif ou les établissements d’enseignement). NeweggBusiness et Amazon acceptent tous deux les documents d’exonération fiscale. Voir mon reçu pour deux de ces rigs 4-GPU.
Voici chaque composant :
4 GPU RTX 2080 Ti (GPU le plus rapide sous les 2000 $, probablement pour quelques années)
Gigabyte RTX 2080 Ti Turbo 11 Go, 1280 $ (04/16/2019)
Ces GPU RTX 2080 TI à 2 fentes PCI de type souffleur fonctionneront également :
1. ASUS GeForce RTX 2080 Ti 11G Turbo Edition GD, 1209 $ (21/03/2019)
2. ZOTAC Gaming GeForce RTX 2080 Ti Blower 11GB, 1299 $ (21/03/2019)
Rosewill Hercules 1600W PSU (alimentation 1600W la moins chère)
Rosewill HERCULES 1600W Gold PSU, 209 $ (21/03/19)
1TB m.2. SSD (pour le chargement ultra-rapide de données dans l’apprentissage profond)
HP EX920 M.2 1 To PCIe NVMe NAND SSD, 150 $ (16/04/2019)
Processeur à 20 threads (choisissez Intel plutôt qu’AMD pour une vitesse rapide à un seul thread)
Intel Core i9-9820X Skylake X 10-Core 3.3Ghz, 850 $ (21/03/19)
Carte mère X299 (cette carte mère supporte entièrement 4 GPU)
ASUS WS X299 SAGE LGA 2066 Intel X299, 492 $.26 (21/03/19)
Coffre (le flux d’air élevé garde les GPU au frais)
Coffre Corsair Carbide Series Air 540 ATX, 115 $ (16/04/2019)
Disque dur 3TB (pour les données et les modèles auxquels vous n’accédez pas régulièrement)
Seagate BarraCuda ST3000DM008 3TB 7200 RPM, 75 $ (16/04/2019)
128 Go de RAM (plus de RAM réduit le goulot d’étranglement entre le GPU et le disque)
8 bâtons de CORSAIR Vengeance 16 Go DRAM, 640 $ (16/04/2019)
Refroidisseur de CPU (ce refroidisseur ne bloque pas le flux d’air du boîtier)
Corsair Hydro Series H100i PRO Low Noise, 130 $ (16/04/2019)
Comparaison avec la station de travail 4-GPU de Lambda
Cette rig 4-GPU de 7000 $ est similaire à la station de travail 4-GPU de 11 250 $ de Lambda. Les seules différences sont (1) qu’ils utilisent un processeur à 12 cœurs au lieu d’un processeur à 10 cœurs et (2) qu’ils incluent une baie de lecteur hot swap (50 $).
Système d’exploitation et performances
Le système d’exploitation que j’utilise est Ubuntu Server 18.04 LTS. J’utilise Cuda 10.1 avec TensorFlow (installé en utilisant conda) et PyTorch (installé en utilisant conda). J’ai entraîné plusieurs de ces machines avec une utilisation de 100% du GPU sur les quatre GPU pendant plus d’un mois sans aucun problème ou étranglement thermique.
- Positionnement relatif des GPU pour une vitesse optimale :
- Comment construire une machine d’apprentissage profond multi-GPU :
- Benchmarking des GPU RTX série 20 pour l’apprentissage profond :