Обучение программированию онлайн

Tensorflow: Как написать op с градиентом в python?

Я хотел бы написать TensorFlow op на python, но я хотел бы, чтобы он был дифференцируемым (чтобы иметь возможность вычислять градиент). Этот вопрос задает, как написать ОП в python, и ответ предлагает использовать py_func (который не имеет градиента): Tensorflow: написание ОП в Python Документация TF описы...

2

9

Градиентный спуск не удается для нескольких переменных, приводит к NaN

Я пытаюсь реализовать алгоритм градиентного спуска, чтобы минимизировать функцию стоимости для множественного линейного алгоритма. Я использую концепции, объясненные в классе машинного обучения Эндрю Нг. Я использую Октаву. Однако, когда я пытаюсь выполнить код, он, кажется, не может предоставить решение, пос...

2

machine-learning linear-regression gradient-descent octave

Градиентный спуск с ограничениями (множители Лагранжа)

Я пытаюсь найти min функции в N параметрах, используя градиентный спуск. Однако я хочу сделать это, ограничив сумму абсолютных значений параметров 1 (или Теперь, как я понимаю, градиент этой функции будет только 0, когда g (x)=1, так что метод нахождения локального минимума должен найти минимум моей функци...

2

10

machine-learning gradient-descent

Имеет ли выбор функции активации и начальных Весов какое-либо отношение к тому, застревает ли нейронная сеть в локальных минимумах?

Вчера я опубликовалэтот вопрос , спрашивая, не застряла ли моя нейронная сеть (которую я тренирую с помощью обратного распространения стохастического градиентного спуска) в локальных минимумах. В следующих статьях рассматривается проблема локальных минимумов в нейронной сети XOR. Первый говорит, что нет пробл...

1

2

neural-network artificial-intelligence gradient-descent

Как накапливать градиенты в тензорном потоке?

У меня есть вопрос, подобный этому. Поскольку у меня ограниченные ресурсы и я работаю с глубокой моделью (VGG-16), используемой для обучения триплетной сети, я хочу накапливать градиенты для 128 пакетов обучающего примера размера один, а затем распространять ошибку и обновлять веса. Мне непонятно, как это с...

1

5

tensorflow conv-neural-network gradient-descent

почему градиентный спуск, когда мы можем решить линейную регрессию аналитически

в чем преимущество использования градиентного спуска в пространстве линейной регрессии? похоже, что мы можем решить проблему (найти theta0-n, что минимизирует стоимость func) с помощью аналитического метода, поэтому почему мы все еще хотим использовать градиентный спуск, чтобы сделать то же самое? спасибо ...

4

63

machine-learning linear-regression gradient-descent