random-sample

Я хочу написать задание map / reduce для выбора ряда случайных выборок из большого набора данных на основе условия уровня строки. Я хочу свести к минимуму количество промежуточных ключей. Псевдокод: for each row if row matches condition put the row.id in the bucket if the bucket is not already larg...

Можно ли сохранить результат подготовленной таблицы в mysql ? мой вариант использования - : Я создаю две переменные, основанные на определенных условиях исходной таблицы, а затем извлекаю рандомизированные строки, основанные на этом критерии. Поскольку у меня есть 10 таких таблиц, я должен быть 1-м, присое...

Я довольно хорошо знаком с использованием выборки резервуара для выборки из набора неопределенной длины за один проход по данным. Одним из ограничений этого подхода, на мой взгляд, является то, что он все еще требует прохождения через весь набор данных, прежде чем можно будет получить какие-либо результаты. К...

В R я хочу сгенерировать случайную выборку дискретной случайной величины: X, где: P(X=a)=P(X=-a)=1/2. Я искал функцию в интернете, но, кажется, нет никакой прямой функции, делающей это. ...

У меня есть 2-d numpy массив, заполненный целыми числами [-1, 0, +1]. Мне нужно выбрать случайный элемент, который не равен нулю, и вычислить сумму соседних элементов. Есть ли способ получить индекс a numpy.random.choice? lattice=np.zeros(9,dtype=numpy.int) lattice[:2]=-1 lattice[2:4]=1 random.shuffle(latti...

Предположим, что у нас есть сетка n*n. Мы хотели бы выбрать k << n случайные ячейки этой сетки, которые не являются смежными. Если мы смоделируем эту сетку с помощью двумерного массива Numpy, содержащего 0 и 1, каков наиболее эффективный способ сделать это в Numpy/Python? Допустимый Пример: Недопу...

У меня есть инструмент, который генерирует сущности, необходимые для генерации значения samlpe для тестирования. проблема в том, что у нас есть много логических типов (некоторые из того же типа, но все же разные), и для кодирования я хотел бы знать, есть ли у кого-то более простое решение... Вот перечисление...

Как я могу взять эффективную простую случайную выборку в SQL? База данных, о которой идет речь, работает под управлением MySQL; моя таблица составляет не менее 200 000 строк, и мне нужна простая случайная выборка около 10 000. "очевидный" ответ: SELECT * FROM table ORDER BY RAND() LIMIT 10000 для больших ...