Как мне использовать распределенное обучение DNN в TensorFlow?

Google выпустил TensorFlow сегодня.

Я копался в коде, и я не вижу ничего в коде или API в обучении на кластере серверов GPU.

Есть ли у него распределенные функции обучения?

12 голосов | спросил solvingPuzzles 9 12015vEurope/Moscow11bEurope/MoscowMon, 09 Nov 2015 22:23:22 +0300 2015, 22:23:22

3 ответа


0

Обновлено:

Релиз произошел 26.02.2016 и был объявлен соавтором Дереком Мюрреем в оригинальном выпуске здесь и использует gRPC для взаимодействия между процессами.

Предыдущая:

До вышеприведенного обновления распределенная реализация TensorFlow еще не была выпущена. Поддержка распределенной реализации была темой этой проблемы , где соавтор Виджай Васудеван wrote :

  

мы работаем над тем, чтобы сделать распределенную реализацию доступной, это   в настоящее время нет в первоначальном выпуске

и Джефф Дин позже предоставили обновление :

  

Наши текущие внутренние распределенные расширения несколько запутаны   с внутренней инфраструктурой Google, поэтому мы выпустили   первая версия для одной машины Код еще не в GitHub, потому что   у него есть зависимости от других частей базы кода Google на   момент, большинство из которых были урезаны, но есть некоторые оставшиеся   из них.

     

Мы понимаем, что распределенная поддержка действительно важна, и это одна   из главных функций мы расставляем приоритеты на данный момент.

ответил Cosmo Harrigan 11 32015vEurope/Moscow11bEurope/MoscowWed, 11 Nov 2015 03:00:48 +0300 2015, 03:00:48
0

Это заняло у нас несколько месяцев, но сегодня отмечается выпуск начальной распределенной среды выполнения TensorFlow . Это включает в себя поддержку нескольких компьютеров, каждый из которых имеет несколько графических процессоров, и обеспечивает связь, предоставляемую gRPC .

Текущая версия включает в себя необходимые внутренние компоненты, чтобы вы могли собрать кластер вручную и подключиться к нему из клиентской программы. Более подробная информация доступна в readme .

ответил mrry 26 FebruaryEurope/MoscowbFri, 26 Feb 2016 16:58:53 +0300000000pmFri, 26 Feb 2016 16:58:53 +030016 2016, 16:58:53
0

Update

Как вы могли заметить. Tensorflow уже поддерживает распределенное обучение DNN в течение достаточно долгого времени. Пожалуйста, обратитесь к его официальному веб-сайту для получения подробной информации.

=============================================== ==========================

Предыдущая

Нет, пока не поддерживается распространение обучения, что немного разочаровывает. Но я не думаю, что сложно продвинуться от одной машины до нескольких машин. По сравнению с другими библиотеками с открытым исходным кодом, такими как Caffe, структура графиков данных TF больше подходит для задач, связанных с несколькими машинами.

ответил ROBOT AI 10 22015vEurope/Moscow11bEurope/MoscowTue, 10 Nov 2015 06:33:47 +0300 2015, 06:33:47

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132