data-mining

Настройка интеллектуального проекта хранилища данных на облачном сервере Linux. Основной язык-Python . Хотел бы использовать этот шаблон для запроса данных и хранения данных: база данных SQL - база данных SQL используется для запроса данных. Однако база данных SQL хранит только поля, по которым требуетс...

Я использую scikit-learn в Python для разработки алгоритма классификации для прогнозирования пола определенных клиентов. Среди прочего, я хочу использовать наивный классификатор Байеса, но моя проблема заключается в том, что у меня есть смесь категориальных данных (например: "зарегистрирован онлайн", "принима...

В моем понимании, я думал, что PCA может выполняться только для непрерывных объектов. Но при попытке понять разницу между кодировкой onehot и кодировкой label пришел через сообщение по следующей ссылке: Когда использовать одно горячее кодирование vs LabelEncoder vs DictVectorizor? Он утверждает, что одно ...

Я изучаю Программирование (Python и алгоритмы) и пытаюсь работать над проектом, который нахожу интересным. Я создал несколько базовых сценариев Python, но я не уверен, как подойти к решению игры, которую я пытаюсь построить. Вот как будет работать игра: Пользователям будут предоставлены элементы со значен...

Я не слишком увлекаюсь интеллектуальным анализом данных, но мне нужны некоторые идеи по кластеризации. Позвольте мне сначала описать мою проблему. У меня есть около 100 листов данных, которые содержат отзывы пользователей. Я пытаюсь найти для примеров слова, которые описывают качество. Один может сказать, чт...

В программном обеспечении Weka с открытым исходным кодом (написанном на Java), когда я запускаю некоторый алгоритм интеллектуального анализа данных, такой как линейная регрессия, Weka возвращает модель и некоторую модель, оценивающую метрики для тестовых данных. Это выглядит так: Correlation coefficient ...

Меня интересуют python mining наборы данных, слишком большие, чтобы сидеть в оперативной памяти, но сидящие в пределах одного HD. Я понимаю, что могу экспортировать данные в виде файлов hdf5, используя pytables. Кроме того, numexpr допускает некоторые базовые вычисления вне ядра. Что будет дальше? Мини-доз...

Следующий код был взят из ответа @adibender на "несколько кривых ROC в одном графике ROCR". Код частично от кого ?сюжет.спектакль. library(ROCR) data(ROCR.simple) preds <- cbind(p1 = ROCR.simple$predictions, p2 = abs(ROCR.simple$predictions + rnorm(length(ROCR.simple$predictions)...

статья о Косинусном сходстве в Википедии можете ли вы показать векторы здесь (в списке или что-то еще) а потом посчитаем, и посмотрим, как это работает? Я новичок....

когда мы должны предсказать значение a категорический (или дискретный) результат мы используем логистическая регрессия. Я считаю, что мы используем линейная регрессия также прогнозируют значение результата с учетом входных значений. тогда, в чем разница между двумя методологиями?...