Обучение программированию онлайн

Ожидаемые параметры Conv2d

Ниже код: import torch import torch.nn as nn import torchvision import torchvision.transforms as transforms import torch.utils.data as data_utils import numpy as np train_dataset = [] mu, sigma = 0, 0.1 # mean and standard deviation num_instances = 20 batch_size_value = 10 for i in range(num_instances) : ...

1

3

как использовать очень большое (>2 м) слово, вложенное в tensorflow?

Я запускаю модель с очень большим вложением слов (>2M слов). Когда я использую tf.embedding_lookup, он ожидает матрицу, которая является большой. Когда я бегу, я впоследствии получаю из GPU ошибку памяти. Если я уменьшу размер встраивания, все будет работать нормально. Есть ли способ справиться с больш...

1

3

nlp deep-learning tensorflow embedding

Набор данных CIFAR-10 с использованием Keras

Я использую Keras для обучения модели на CIFAR-10 распознавать некоторые классы, однако, я хочу некоторые классы, а не все из них, поэтому я написал следующий код: selected_classes = [2, 3, 5, 6, 7] print('trainn', x_train.shape, y_train.shape) x = [ex for ex, ey in zip(x_train, y_train) if ey in selected...

1

2

machine-learning neural-network deep-learning keras conv-neural-network

Изменение кода прогнозирования Caffe C++ для нескольких входов

Я реализовал модифицированную версию примера Caffe C++ , и хотя он работает очень хорошо, он невероятно медленный, потому что он принимает только изображения по одному. В идеале я хотел бы передать Caffe вектор из 200 изображений и вернуть лучший прогноз для каждого из них. Я получил некоторуюбольшую помощь ...

2

12

c++ machine-learning neural-network deep-learning caffe

Как интерпретировать "потери" и "точность" для модели машинного обучения

когда я тренировал свою нейронную сеть с помощью Theano или Tensorflow, они будут сообщать переменную под названием "потеря" за эпоху. Как я должен интерпретировать эту переменную? Более высокие потери лучше или хуже, или что это означает для конечной производительности (точности) моей нейронной сети?...

3

102

machine-learning neural-network deep-learning mathematical-optimization objective-function

Почему нелинейная функция активации должна использоваться в нейронной сети обратного распространения?

Я читал некоторые вещи о нейронных сетях, и я понимаю общий принцип однослойной нейронной сети. Я понимаю необходимость в дополнительных слоях, но почему используются нелинейные функции активации? за этим вопросом следует Следующий: что является производной функции активации, используемой для обратного распр...

8

93

mathjax machine-learning neural-network deep-learning

Как добавить регуляризации в TensorFlow?

Я нашел во многих доступных кодах нейронной сети, реализованных с использованием TensorFlow, что условия регуляризации часто реализуются путем ручного добавления дополнительного термина к значению потерь. мои вопросы: есть ли более элегантный или рекомендуемый способ регуляризации, чем делать это вручную? ...

7

69

python neural-network deep-learning tensorflow

Керрас входные объяснение: форма ввода, единиц, размер пакета, Дим, и т. д

для любого слоя Keras (Layer класс), может кто-нибудь объяснить, как понимать разницу между input_shape,units,dim и т. д.? например, док говорит units укажите выходную форму слоя. на изображении нейронной сети ниже hidden layer1 4 единицы. Это напрямую переводится на на ...

2

61

neural-network deep-learning tensorflow keras keras-layer

Как применить градиентное отсечение в TensorFlow?

учитывая пример кода. Я хотел бы знать, как применить градиентное обрезание в этой сети на RNN, где есть возможность взрыва градиентов. tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) Это пример, который может быть использован, но где я его представлю ? В def of RNN lstm_cell = rnn_ce...

6

59

python machine-learning deep-learning tensorflow lstm

OpenCL / AMD: глубокое обучение

в то время как" googl'ING " и делать некоторые исследования я не смог найти любой серьезный / популярный фреймворк / sdk для научных GPGPU-вычислений и OpenCL on AMD оборудование. Есть ли литература и/или программное обеспечение, которое я пропустил? особенно меня интересует глубокое изучение. насколько я...

8

51

iphone-sdk-3.0 opencl neural-network gpgpu deep-learning