Анализ основных компонентов (PCA) в Python

У меня есть массив (26424 x 144), и я хочу выполнить PCA над ним с помощью Python. Однако в интернете нет конкретного места, которое объясняет, как достичь этой задачи (есть некоторые сайты, которые просто делают PCA по своему усмотрению - нет обобще ...

ошибка sklearn ValueError: вход содержит NaN, бесконечность или значение слишком большое для dtype('float64')

Я использую sklearn и возникли проблемы с распространением аффинности. Я построил входную матрицу, и я продолжаю получать следующую ошибку. ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). Я np.isnan(mat.any()) ...

Как работает параметр веса класса в scikit-learn?

у меня много проблем с пониманием того, как class_weight параметр в логистической регрессии scikit-learn работает. Ситуация я хочу использовать логистическую регрессию для двоичной классификации на очень несбалансированном наборе данных. Классы обо ...

Используйте scikit-научитесь классифицировать на несколько категорий

Я пытаюсь использовать один из методов контролируемого обучения scikit-learn для классификации фрагментов текста в одну или несколько категорий. Функция прогнозирования всех алгоритмов, которые я пробовал, просто возвращает одно совпадение. например ...

Случайное состояние (псевдослучайное число)в Scikit learn

Я хочу реализовать алгоритм машинного обучения в scikit learn, но я не понимаю, что это за параметр random_state делает? Почему я должен его использовать? Я также не мог понять, что такое псевдослучайное число. ...

ImportError при импорте из sklearn: не удается импортировать сборку проверки имени

Я получаю следующую ошибку при попытке импорта из sklearn: >>> from sklearn import svm Traceback (most recent call last): File "<pyshell#17>", line 1, in <module> from sklearn import svm File "C:\Python27\lib\site-packag ...

Сохранить классификатор на диск в scikit-learn

Как сохранить обученный наивный байесовский классификатор до диск и использовать его в предсказания данные? У меня есть следующий пример программы с сайта scikit-learn: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bay ...