OpenCL / AMD: глубокое обучение


в то время как" googl'ING " и делать некоторые исследования я не смог найти любой серьезный / популярный фреймворк / sdk для научных GPGPU-вычислений и OpenCL on AMD оборудование. Есть ли литература и/или программное обеспечение, которое я пропустил?

особенно меня интересует глубокое изучение.

насколько я знаю deeplearning.net рекомендует NVIDIA оборудование и CUDA основы. Кроме того, все большие рамки глубокого обучения, которые я знаю, такие как кафе,Феано,Факел,DL4J, ... сосредоточены на CUDA и не планирую поддерживать OpenCL / AMD.

кроме того, можно найти много научных работ, а также соответствующую литературу для CUDA на основе задач глубокого обучения, но почти ничего для OpenCL / AMD решений.

Is есть ли шанс, что новые или существующие научные рамки появятся для OpenCL / AMD решений в 2015/16?

Что такое хорошее начало для глубокое изучение С OpenCL / AMD? Есть литература? Учебники? Разные источники?

8 51

8 ответов:

изменить 1 посмотреть Микаэль городе Руссон это ответ-Amazon теперь путь вперед, как вы можете "арендовать" вычислительную мощность от них.

Edit 2 я создал

--- август 2017 Обновление прохладно новые вещи произошли в стороне AMD - - -

теперь фактически можно запускать любую библиотеку на большинстве аппаратных средств AMD Регистрация Здесь

по состоянию на 25 октября 2015 года

похоже, что AMD и другие расширили свои руки на разработку нескольких ускоренных фреймворков OpenCL для deeplearning. Так что да поддержка OpenCL теперь существует для deeplearning :)

Это список ускоренных OpenCL рамки или инструменты, которые были разработаны с учетом глубокого обучения в первую очередь. Я надеюсь, что они будут обновлены в течение ближайших лет

мы знаем, что прямо сейчас (25 октября 2015 года) есть три глубоких рамок обучения, которые очень популярны для исследователей и видел некоторые коммерческие продукты

  1. Феано

  2. кафе

  3. Факел


кафе имеет довольно хорошая поддержка OpenCL, потому что amd разработала полную версию caffe, которая поддерживает почти все функции caffe, а также активно развивается. он называется OpenCL Caffe. а вот и репозиторий

OpenCL Caffe

Если вы думаете о производительности, то согласно этому сайту(я сам не отмечал его) он дает около 261 изображений в секунду или 22,5 миллионов изображений в день в аппаратном обеспечении AMD R9 Fury (обучение). для сравнения: nvidia K40, которая может обрабатывать 40 миллионов изображений в день. так что по данным сайта он может дать половину производительности в одну шестую денег.(учитывая, что K40-это карта 3000$, а R9 fury-около 600$). однако использование любой потребительской карты даст вам проблему с памятью (vram), которая очень важна в глубоком обучении.


Факел в последние дни также, похоже, имеет приличную поддержку OpenCL. Однако он поддерживается одним человеком. Он утверждает, что имеет полную поддержку всех функций факел. Однако это не дает представления о производительности. Вот это хранилище. он активно поддерживается.

cltorch


В настоящее время, похоже, не существует достойного бэкэнда opencl для структуры theano, но работа продолжается. и простые программы могут быть сделаны с текущей версией.


есть и другие фреймворки opencl для deeplearning. Это займет некоторое время, чтобы разобраться в них, чтобы увидеть, если они работают правильно или нет.

альтернативой является использование экземпляров GPU в Amazon Web Services. Вы можете найти AMIs с обычно используемыми пакетами глубокого обучения, уже установленными. Например:

совет: используйте спотовые экземпляры, чтобы получить более дешевую цену (около 10 центов / час для g2. 2xlarge).

PlaidML (https://github.com/plaidml/plaidml)-это полностью открытая среда глубокого обучения с открытым исходным кодом, которая работает поверх OpenCL и интегрируется с Keras, чтобы обеспечить знакомый пользовательский API. README в репо имеет более подробный статус, в настоящее время convnet inference на Linux хорошо поддерживается, но мы (http://vertex.ai) работают над расширением полноты и поддержки платформы так быстро, как мы можем. В нашей непрерывной интеграции автоматы включают в ассортимент компании AMD и графические процессоры NVIDIA, все Linux на данный момент, но мы также работаем над добавлением Mac и Windows.

Я пишу поддержку opencl 1.2 для Tensorflow. https://github.com/hughperkins/tensorflow-cl В настоящее время поддерживает:

  • умножение матрицы blas
  • градиенты
  • собственные операции, такие как: сокращения, argmin/argmax, операции над элементами (двоичные и унарные)

TensorFlow теперь есть поддержка OpenCL на план.

посмотреть: выпуск Github.

надеюсь, не так далеко от рабочей версии.

пожалуйста, проверьте https://01.org/intel-deep-learning-framework - Intel® Deep Learning Framework (IDLF) обеспечивает унифицированную структуру для платформ Intel®, ускоряющих глубокие сверточные нейронные сети. Это с открытым исходным кодом, так что вы можете перенести его на оборудование AMD, а также. Самое классное: он может работать на MacBook Pro с графикой Intel Iris.

Проверьте платформа ROCm, который управляется AMD. Это первая платформа с открытым исходным кодом HPC/Hyperscale-class для вычислений на GPU, которая также не зависит от языка программирования.

в частности: