deep-learning
Ниже код: import torch import torch.nn as nn import torchvision import torchvision.transforms as transforms import torch.utils.data as data_utils import numpy as np train_dataset = [] mu, sigma = 0, 0.1 # mean and standard deviation num_instances = 20 batch_size_value = 10 for i in range(num_instances) : ...
Я запускаю модель с очень большим вложением слов (>2M слов). Когда я использую tf.embedding_lookup, он ожидает матрицу, которая является большой. Когда я бегу, я впоследствии получаю из GPU ошибку памяти. Если я уменьшу размер встраивания, все будет работать нормально. Есть ли способ справиться с больш...
Я использую Keras для обучения модели на CIFAR-10 распознавать некоторые классы, однако, я хочу некоторые классы, а не все из них, поэтому я написал следующий код: selected_classes = [2, 3, 5, 6, 7] print('trainn', x_train.shape, y_train.shape) x = [ex for ex, ey in zip(x_train, y_train) if ey in selected...
Я реализовал модифицированную версию примера Caffe C++ , и хотя он работает очень хорошо, он невероятно медленный, потому что он принимает только изображения по одному. В идеале я хотел бы передать Caffe вектор из 200 изображений и вернуть лучший прогноз для каждого из них. Я получил некоторуюбольшую помощь ...
когда я тренировал свою нейронную сеть с помощью Theano или Tensorflow, они будут сообщать переменную под названием "потеря" за эпоху. Как я должен интерпретировать эту переменную? Более высокие потери лучше или хуже, или что это означает для конечной производительности (точности) моей нейронной сети?...
Я читал некоторые вещи о нейронных сетях, и я понимаю общий принцип однослойной нейронной сети. Я понимаю необходимость в дополнительных слоях, но почему используются нелинейные функции активации? за этим вопросом следует Следующий: что является производной функции активации, используемой для обратного распр...
Я нашел во многих доступных кодах нейронной сети, реализованных с использованием TensorFlow, что условия регуляризации часто реализуются путем ручного добавления дополнительного термина к значению потерь. мои вопросы: есть ли более элегантный или рекомендуемый способ регуляризации, чем делать это вручную? ...
для любого слоя Keras (Layer класс), может кто-нибудь объяснить, как понимать разницу между input_shape,units,dim и т. д.? например, док говорит units укажите выходную форму слоя. на изображении нейронной сети ниже hidden layer1 4 единицы. Это напрямую переводится на на ...
учитывая пример кода. Я хотел бы знать, как применить градиентное обрезание в этой сети на RNN, где есть возможность взрыва градиентов. tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) Это пример, который может быть использован, но где я его представлю ? В def of RNN lstm_cell = rnn_ce...
в то время как" googl'ING " и делать некоторые исследования я не смог найти любой серьезный / популярный фреймворк / sdk для научных GPGPU-вычислений и OpenCL on AMD оборудование. Есть ли литература и/или программное обеспечение, которое я пропустил? особенно меня интересует глубокое изучение. насколько я...