NVIDIA предложила новую платформу на базе Tesla M40 и Tesla M4. На сегодня это самый мощный ускоритель для глубинного обучения нейронных сетей. Tesla M4 упрощенная версия, её предназначение реализация разработанной на конечных серверах с веб-сервисами. Tesla M40 сокращает время обучения нейронных сетей на несколько дней или недель. Он в восемь раз быстрее чем CPU. Система легко масштабируется с GPUDirect.
Ускорители могут работать в режиме «24/7». Tesla M4 оптимизирована для преобразования видео из одного формата в другой, обработки изображений. Ускорители отличаются низкопрофильным дизайном.
Характеристики Tesla M40/M4:
- Количество потоковых процессоров: 3072/1024;
- Частота ядра: 1140/1075 МГц;
- Эффективная частота GDDR5-памяти: 6/5,5 ГГц;
- Разрядность шины памяти: 384/128 бит;
- Количество VRAM: 12/4 Гбайт;
- Пропускная способность памяти: 188/88 Гбайт/с;
- Производительность в операциях одинарной точности: 7/2,2 Тфлопс;
- Производительность в операциях двойной точности: 0,21/0,07 Тфлопс;
- Количество транзисторов: 8/2,94 млрд;
- Уровень TDP: 250 Вт/50–75 Вт;
- Техпроцесс: 28 нм, разработан TSMC;
- GPU: GM200/GM206.