scikit-learn — все вопросы

2ответа
20 голосов
ImportError: нет модуля с именем sklearn
Я установил scikit-learn в соответствии с этими инструкциями Даже когда я пытаюсь запустить снова: sudo pip install -U scikit-learn Я получаю это сообщение, доказывая снова, что установка в
5ответов
69 голосов
Используйте Scikit-Learn для классификации на несколько категорий
Я пытаюсь использовать один из контролируемых методов обучения scikit-learn для классификации фрагментов текста в одну или несколько категорий. Функция предсказания всех алгоритмов, которые я попроб
8ответов
43 голоса
Вменяйте категорические пропущенные значения в scikit-learn
У меня есть данные панд с некоторыми столбцами текстового типа. Есть некоторые значения NaN вместе с этими текстовыми столбцами. То, что я пытаюсь сделать, это вменять эти NaN с помощью sklearn.prep
5ответов
41 голос
Стратифицированный Поезд /Тест-Сплит в Scikit-Learn
Мне нужно разделить мои данные на тренировочный набор (75%) и тестовый набор (25%). В настоящее время я делаю это с кодом ниже: X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_tes
4ответа
36 голосов
Построить интерактивное дерево решений в блокноте Jupyter
Есть ли способ построить дерево решений в блокноте Jupyter, чтобы я мог интерактивно исследовать его узлы? Я думаю о чем-то вроде этого . Это пример из KNIME. Я нашел https://planspace.org/2015
11ответов
30 голосов
Scikit-learn: как получить истинно положительный, истинно отрицательный, ложноположительный и ложноотрицательный
Я новичок в машинном обучении и scikit-Learn. Моя проблема: (пожалуйста, исправьте любое неправильное представление) У меня есть набор данных, который является БОЛЬШИМ JSON, я извлекаю ег
1ответ
30 голосов
Какова обратная сила регуляризации в логистической регрессии? Как это должно повлиять на мой код?
Я использую sklearn.linear_model.LogisticRegression в scikit learn для запуска логистической регрессии. C : float, optional (default=1.0) Inverse of regularization strength; must be a positi
2ответа
28 голосов
Как использовать sklearn fit_transform с пандами и возвращать фрейм данных вместо массива numpy?
Я хочу применить масштабирование (используя StandardScaler () из sklearn.preprocessing) к фрейму данных pandas. Следующий код возвращает пустой массив, поэтому я теряю все имена столбцов и индексы.
1ответ
27 голосов
перекрестная проверка scikit-learn, отрицательные значения со среднеквадратичной ошибкой
Когда я использую следующий код с матрицей данных X размера (952,144) и выходного вектора y размера (952), показатель mean_squared_error возвращает отрицательные значения, что является неожиданным ,
3ответа
26 голосов
scikit-learn: одна горячая кодировка строковых категориальных функций
Я пытаюсь выполнить горячее кодирование тривиального набора данных. data = [['a', 'dog', 'red'] ['b', 'cat', 'green']] Как лучше всего предварительно обработать эти данные с помощью Sci
1ответ
25 голосов
Логистическая регрессия sklearn «Ошибка значения: найден массив с dim 3. Ожидается оценщик <= 2.»
Я пытаюсь решить эту проблему 6 в этой записной книжке. Вопрос состоит в том, чтобы обучить простую модель на этих данных, используя 50, 100, 1000 и 5000 обучающих выборок, используя модель Logistic
5ответов
23 голоса
Как выполнить горячее кодирование из столбца панд, содержащего список?
Я хотел бы разбить столбец панды, состоящий из списка элементов, на столько столбцов, сколько есть уникальных элементов, т.е. one-hot-encode они (со значением 1, представляющим данный элемент, сущес
2ответа
23 голоса
TFIDF для большого набора данных
У меня есть корпус, который содержит около 8 миллионов новостных статей, мне нужно получить представление TFIDF в виде разреженной матрицы. Я смог сделать это, используя scikit-learn для сравнительн
1ответ
22 голоса
Получить собственные значения и векторы из склеарна PCA
Как я могу получить собственные значения и собственные векторы приложения PCA? from sklearn.decomposition import PCA clf=PCA(0.98,whiten=True) #converse 98% variance X_train=clf.fit_transform
0ответов
21 голос
Проблема с OneHotEncoder для категориальных функций
Я хочу закодировать 3 категориальных элемента из 10 элементов в моих наборах данных. Я использую preprocessing из sklearn.preprocessing сделать так: from sklearn import preprocessing cat_feature
2ответа
21 голос
Что `sample_weight` делает с тем, как DecisionTreeClassifier работает в sklearn?
Я прочитал из этой документации следующее: «Балансировка классов может быть выполнена путем выборки равного количества выборок из каждого класса или, предпочтительно, путем нормализации суммы в
4ответа
19 голосов
Как сохранить модель Scikit-Learn-Keras в файле постоянства (pickle /hd5 /json /yaml)
У меня есть следующий код с использованием Keras Scikit-Learn Wrapper : from keras.models import Sequential from sklearn import datasets from keras.layers import Dense from sklearn.model_selectio
2ответа
18 голосов
sklearn GridSearchCV с конвейером
Я новичок в sklearn: +: = 1 =: + ---- Функции и Pipeline. Я пытаюсь построить конвейер, который сначала использует RandomizedPCA для моих тренировочных данных, а затем соответствует модели регрессии
3ответа
18 голосов
поиск по сетке scikit по нескольким классификаторам
Я хотел знать, есть ли лучший, более встроенный способ поиска в сетке и тестирования нескольких моделей в одном конвейере. Конечно, параметры моделей были бы разными, что затрудняло мне это понять.
1ответ
18 голосов
Как написать собственный оценщик в sklearn и использовать перекрестную проверку на нем?
Я хотел бы проверить ошибку прогноза при перекрестной проверке нового метода. Я хотел бы знать, смогу ли я передать свой метод в функцию перекрестной проверки sklearn и, если да, то как. Я бы хот
1 2 3 4 5

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132