lstm
Я хотел бы создать класс LSTM самостоятельно, однако я не хочу снова переписывать классические функции LSTM с нуля. Копаясь в коде PyTorch, я нахожу только грязную реализацию, включающую по крайней мере 3-4 класса с наследованием: https://github.com/pytorch/pytorch/blob/98c24fae6b6400a7d1e13610b20aa05f86f7...
Существует ли способ вычисления общего числа параметров в сети LSTM. Я нашел пример, но я не уверен, насколько правильно это или если я правильно понял его. Для примера рассмотрим следующий пример:- from keras.models import Sequential from keras.layers import Dense, Dropout, Activation from keras.layers i...
Как входные измерения преобразуются в выходные измерения для слоя LSTM в Керасе? Из чтения сообщения в блоге Колаха , кажется, что число "timesteps" (он же input_dim или первое значение в input_shape) должно равняться числу нейронов, которые должны равняться числу выходов из этого слоя LSTM (очерченного аргу...
Существует ли канонический способ поддерживать состояние LSTM и т. д. с Тензорфлоу порцией? Использование API Tensorflow напрямую это просто - но я не уверен, как лучше всего выполнить сохранение состояния LSTM между вызовами после экспорта модели в Serving. Есть ли какие-либо примеры, которые выполняют выш...
Я пытаюсь реализовать сиамскую нейронную сеть в TensorFlow (пример сиамской сети ), но я не могу найти ни одного рабочего примера в Интернете (см.статью Янна Лекуна ). Архитектура, которую я пытаюсь построить, будет состоять из двух LSTM, разделяющих веса и подключенных только в конце сети. Мой вопрос: Как ...
Я использую рекуррентные нейронные сети (RNN) для прогнозирования, но по какой-то странной причине он всегда выдает 1. Здесь я объясняю это на примере игрушки следующим образом: Пример Рассмотрим матрицу M размерностей (360, 5) и Вектор Y, содержащий сумму строк M. Теперь, используя RNN, я хочу предсказат...
В настоящее время я пытаюсь реализовать автоэнкодер LSTM, который будет использоваться для сжатия временных рядов транзакций (набор данных Berka) в меньший кодированный вектор. Данные, с которыми я работаю, выглядят так: это (это совокупный баланс одного счета в течение всего времени). Я решил использовать ...
Я пытаюсь построить простейшую из возможных LSTM-сетей. Просто хочу, чтобы он предсказал следующее значение в последовательности np_input_data. import tensorflow as tf from tensorflow.python.ops import rnn_cell import numpy as np num_steps = 3 num_units = 1 np_input_data = [np.array([[1.],[2.]]), np.array([...
Я хочу создать модель Keras, состоящую из слоя встраивания, за которым следуют два LSTM с dropout 0.5 и, наконец, плотный слой с активацией softmax. Первый LSTM должен распространять последовательный вывод на второй слой, в то время как во втором я заинтересован только в получении скрытого состояния LSTM пос...
учитывая пример кода. Я хотел бы знать, как применить градиентное обрезание в этой сети на RNN, где есть возможность взрыва градиентов. tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) Это пример, который может быть использован, но где я его представлю ? В def of RNN lstm_cell = rnn_ce...