Обучение программированию онлайн

weka-как печатать неправильно классифицированные экземпляры

Мой вывод weka показывает: Correctly Classified Instances 32083 94.0244 % Incorrectly Classified Instances 2039 5.9756 % Я хочу иметь возможность распечатать то, что было неверными экземплярами, чтобы я мог внести коррективы и понять, почему они были неправильно кла...

2

5

nlp classification

(человеческий) язык документа

Существует ли способ (программа, библиотека) приблизительно знать, на каком языке написан документ? У меня есть куча текстовых документов (~500K) на смешанных языках для импорта в CMS с поддержкой i18n (Drupal).. Мне не нужны идеальные совпадения, только некоторые догадки....

5

4

nlp classification language-detection

Классификатор максимальной энтропии для больших наборов данных

Я искал реализацию максимальной энтропийной классификации, которая может иметь дело с выходным размером 500 классов и 1000 объектов. Мои тренировочные данные содержат около 30 000 000 строк. Я пробовал использовать MegaM, 64-битный пакет R maxent, инструмент maxent из Эдинбургского университета, но, как и ожи...

1

3

nlp machine-learning classification

Смешивание категориальных и непрерывных данных в наивном байесовском классификаторе с помощью scikit-learn

Я использую scikit-learn в Python для разработки алгоритма классификации для прогнозирования пола определенных клиентов. Среди прочего, я хочу использовать наивный классификатор Байеса, но моя проблема заключается в том, что у меня есть смесь категориальных данных (например: "зарегистрирован онлайн", "принима...

2

34

python machine-learning scikit-learn classification data-mining

Керрас классификатор предсказать проба() не соответствует предсказать()

Я работаю с Keras NN с бэкэндом Aanos, я работаю над проблемой классификации с 14 выходными классами. Мне нужен предсказанный класс плюс связанные с ним вероятности. Проблема в том, что вероятности из predict_proba () не совпадают с предсказанным классом из predict (), вот код плюс результирующий вывод 1 обра...

1

2

python keras classification probability

Какой метод использует sklearn VotingClassifier fit?

Официальный документ, по-видимому, не содержит такой информации. Мне интересно, почему мы не можем предоставить VotingClassifier уже обученные модели, поэтому нам не нужно тренироваться снова, так как VotingClassifier требует, чтобы мы вызвали метод fit перед предсказанием. Делает ли это просто: for clf i...

1

2

python machine-learning scikit-learn classification

как кластеризировать пользователей на основе тегов

Я хотел бы кластеризировать пользователей на основе категорий или тегов шоу, которые они смотрят. Какой самый простой/лучший алгоритм для этого? Предполагая, что у меня есть около 20 000 тегов и несколько миллионов событий просмотра, которые я могу использовать в качестве сигналов, есть ли алгоритм, который...

2

machine-learning neo4j classification

помогите организовать мои данные для этой проблемы машинного обучения

Я хочу классифицировать твиты в рамках заданного набора категорий, таких как {"спорт", "развлечения", "любовь"} и т. д... Моя идея состоит в том, чтобы взять термин частоты наиболее часто используемых слов, чтобы помочь мне решить эту проблему. Например, слово " любовь "чаще всего встречается в категории Лю...

2

3

machine-learning classification

Сохранить классификатор на диск в scikit-learn

Как сохранить обученный наивный байесовский классификатор до диск и использовать его в предсказания данные? У меня есть следующий пример программы с сайта scikit-learn: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iri...

5

138

python machine-learning scikit-learn classification

Используйте scikit-научитесь классифицировать на несколько категорий

Я пытаюсь использовать один из методов контролируемого обучения scikit-learn для классификации фрагментов текста в одну или несколько категорий. Функция прогнозирования всех алгоритмов, которые я пробовал, просто возвращает одно совпадение. например у меня есть кусок текста: "Theaters in New York compared t...

5

63

python scikit-learn classification