En un post anterior, Build a Pro Deep Learning Workstation… for Half the Price, compartí todos los detalles para comprar piezas y construir un equipo de aprendizaje profundo de calidad profesional por casi la mitad de lo que cuestan los equipos preconstruidos de empresas como Lambda y Bizon. El post se hizo viral en Reddit y, en las semanas siguientes, Lambda redujo el precio de su estación de trabajo de 4 GPU en torno a los 1200 dólares.
Este es un buen comienzo para hacer que el aprendizaje profundo sea más accesible, pero si prefieres gastar 7000 dólares en lugar de más de 11.250 dólares, aquí tienes cómo hacerlo.
En el post anterior afirmé que «no hay una construcción perfecta», pero si hubiera una construcción perfecta al menor coste, ¿cuál sería? Eso es lo que muestro aquí. Consulta el post anterior para ver las explicaciones de los componentes, la evaluación comparativa y las opciones adicionales para este equipo de aprendizaje profundo de 4 GPUs.
El objetivo de este post es enumerar exactamente qué piezas comprar para construir un equipo de aprendizaje profundo de 4 GPUs de última generación al menor coste posible. Basado en la retroalimentación de que había demasiadas opciones en el post anterior, sólo una lista de la mejor opción para cada componente. Construí tres variaciones de equipos multi-GPU y el que presento aquí proporciona el mejor rendimiento y fiabilidad, sin estrangulamiento térmico, por el costo más barato.
He incluido mi recibo, mostrando la compra de todas las partes para construir dos de estos equipos por $ 14000 ($ 7000 cada uno).
- Qué partes comprar
- 4 GPUs RTX 2080 Ti (la GPU más rápida por debajo de los $2000, probablemente durante unos años)
- Fuente de alimentación Rosewill Hercules 1600W (la fuente de alimentación de 1600W más barata)
- 1TB m.2 SSD (para la carga ultrarrápida de datos en el aprendizaje profundo)
- Cpu de 20 hilos (elija Intel en lugar de AMD para una velocidad rápida de un solo hilo)
- Placa base X299 (esta placa base soporta completamente 4 GPUs)
- Caja (el alto flujo de aire mantiene las GPUs frescas)
- Disco duro de 3TB (para datos y modelos a los que no accedes regularmente)
- 128GB RAM (más RAM reduce el cuello de botella de la GPU al disco)
- Enfriador de la CPU (este enfriador no bloquea el flujo de aire de la caja)
- Comparación con la estación de trabajo de 4-GPU de Lambda
- Sistema operativo y rendimiento
Qué partes comprar
Pedí todo en línea a través de NeweggBusiness, pero cualquier vendedor (por ejemplo, Amazon) funciona. Si tienes una tienda local de MicroCenter cerca, suelen tener precios baratos de CPU si compras en una tienda física. No pagues impuestos si no lo necesitas (por ejemplo, instituciones educativas o sin ánimo de lucro). Tanto NeweggBusiness como Amazon aceptan documentos de exención de impuestos. Ver mi recibo para dos de estos equipos de 4 GPU.
Aquí está cada componente:
4 GPUs RTX 2080 Ti (la GPU más rápida por debajo de los $2000, probablemente durante unos años)
Gigabyte RTX 2080 Ti Turbo 11GB, $1280 (16/04/2019)
Estas GPUs RTX 2080 TI de 2 ranuras PCI también funcionarán:
1. ASUS GeForce RTX 2080 Ti 11G Turbo Edition GD, 1209 dólares (21/03/2019)
2. ZOTAC Gaming GeForce RTX 2080 Ti Blower 11GB, 1299 $ (21/03/2019)
Fuente de alimentación Rosewill Hercules 1600W (la fuente de alimentación de 1600W más barata)
Fuente de alimentación Rosewill HERCULES 1600W Gold, 209 $ (21/03/2019)
1TB m.2 SSD (para la carga ultrarrápida de datos en el aprendizaje profundo)
HP EX920 M.2 SSD NVMe NAND de 1TB, 150 dólares (16/04/2019)
Cpu de 20 hilos (elija Intel en lugar de AMD para una velocidad rápida de un solo hilo)
Intel Core i9-9820X Skylake X de 10 núcleos a 3.3Ghz, $850 (21/03/19)
Placa base X299 (esta placa base soporta completamente 4 GPUs)
ASUS WS X299 SAGE LGA 2066 Intel X299, $492.26 (21/03/19)
Caja (el alto flujo de aire mantiene las GPUs frescas)
Corsair Carbide Series Air 540 ATX Case, $115 (16/04/2019)
Disco duro de 3TB (para datos y modelos a los que no accedes regularmente)
Seagate BarraCuda ST3000DM008 3TB 7200 RPM, 75$ (16/04/2019)
128GB RAM (más RAM reduce el cuello de botella de la GPU al disco)
8 sticks de DRAM CORSAIR Vengeance 16GB, 640$ (16/04/2019)
Enfriador de la CPU (este enfriador no bloquea el flujo de aire de la caja)
Corsair Hydro Series H100i PRO Low Noise, 130$ (16/04/2019)
Comparación con la estación de trabajo de 4-GPU de Lambda
Este equipo de 4-GPU de 7000 dólares es similar a la estación de trabajo de 4-GPU de Lambda de 11.250 dólares. Las únicas diferencias son (1) que utilizan una CPU de 12 núcleos en lugar de una de 10 núcleos y (2) que incluyen una bahía de unidades de intercambio en caliente (50 dólares).
Sistema operativo y rendimiento
El sistema operativo que estoy utilizando es Ubuntu Server 18.04 LTS. Estoy usando Cuda 10.1 con TensorFlow (instalado conda) y PyTorch (instalado conda). He entrenado varias de estas máquinas con el 100% de utilización de la GPU en las cuatro GPUs durante más de un mes sin ningún problema o estrangulamiento térmico.
- Colocación relativa de las GPUs para una velocidad óptima:
- Cómo construir una máquina de aprendizaje profundo multi-GPU:
- Benchmarking de las GPU de la serie RTX 20 para el aprendizaje profundo: