scikit-learn — все вопросы

1ответ
4 голоса
Как приписать значения NaN к значению по умолчанию, если стратегия терпит неудачу?
Проблема Я использую sklearn.preprocessing.Imputer класс для вменения значений NaN с использованием стратегии mean по столбцам, то есть axis = 0. Моя проблема заключается в том, что некоторые
1ответ
4 голоса
K-означает использование только определенных столбцов dataframe с scikit-learn
Я использую алгоритм k-means из scikit-learn и значения, которые я хочу кластеризовать, находятся в фрейме данных pandas с 3 столбцами: ID, value_1 и value_2. Я хочу объединить информацию, исполь
1ответ
4 голоса
Группа /Кластер K-Fold CV со Sklearn
Мне нужно сделать K-кратное резюме на некоторых моделях, но мне нужно убедиться, что набор данных для проверки (тестирования) сгруппирован по группе и t количество лет. GroupKFold близко, но оно все
1ответ
4 голоса
Перекрестная проверка и настройка параметров с помощью XGBoost и hyperopt
Один из способов сделать вложенную перекрестную проверку с помощью модели XGB: from sklearn.model_selection import GridSearchCV, cross_val_score from xgboost import XGBClassifier # Let's assume t
1ответ
4 голоса
LightGBM - sklearnAPI против API обучения и структуры данных и lgb.cv против gridsearchcv /randomisedsearchcv
Каковы различия между sklearnAPI (LGBMModel, LGBMClassifier и т. д.) и API по умолчанию (lgb.Dataset, lgb.cv, lgb.train) из lightgbm? Какой из них мне лучше использовать? Лучше ли использовать
1ответ
4 голоса
Есть ли в Python хорошие иерархические пакеты кластеризации, которые принимают матрицу расстояний?
У меня есть матрица расстояний, составленная из парного расстояния Левенштейна. Я использовал scikits-learn. Но алгоритм иерархической кластеризации не принимает матрицу расстояний в качестве входны
1ответ
4 голоса
ICA онлайн обучение для большого набора данных в Scikit
У меня большой набор данных, и я пытаюсь получить фильтры gabor из изображений. Когда набор данных становится слишком большим, возникают ошибки памяти. Пока у меня есть этот код: import numpy from
1ответ
4 голоса
Нет класса StandardScaler в sklearn.preprocessing
Я хотел использовать класс StandardScaler в пакете предварительной обработки http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html# sklearn.preprocessing.Standa
1ответ
4 голоса
scikit-узнать, как построить кластеры документов Kmean?
Я хочу построить этот пример на точечной диаграмме: http://scikit-learn.org /dev/auto_examples/document_clustering.html#example-document-clustering-py Я склеарн и новичок здесь, я хочу получ
1ответ
4 голоса
Выбор функций с LinearSVC
Когда я пытаюсь запустить следующий код с моими данными (из этот пример ) X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y) Я получаю: "Invalid threshold: all features
4ответа
4 голоса
Scikit Learn Gaussian HMM: ValueError: startprob должен быть равен 1,0
В настоящее время я работаю с Scikit Learn и сталкиваюсь со следующей проблемой, пытаясь обучить гауссовскому HMM:    Файл "/Library/Python/2.7/site-packages/sklearn/hmm.py", строка 443, вписывае
4ответа
4 голоса
Scikit Learn Gaussian HMM: ValueError: startprob должен быть равен 1,0
В настоящее время я работаю с Scikit Learn и сталкиваюсь со следующей проблемой, пытаясь обучить гауссовскому HMM:    Файл "/Library/Python/2.7/site-packages/sklearn/hmm.py", строка 443, вписывае
4ответа
4 голоса
Scikit Learn Gaussian HMM: ValueError: startprob должен быть равен 1,0
В настоящее время я работаю с Scikit Learn и сталкиваюсь со следующей проблемой, пытаясь обучить гауссовскому HMM:    Файл "/Library/Python/2.7/site-packages/sklearn/hmm.py", строка 443, вписывае
1ответ
4 голоса
Склеарн установка в OSX
Я установил sklearn, используя следующие команды (я пробовал обе), но при их включении я получаю следующую ошибку: sudo port install py26-scikit-learn or: sudo port install py27-scikit-learn Пр
1ответ
4 голоса
Обучение RandomForest медленно на вычислительном кластере
У меня есть учетная запись в вычислительном кластере, которая работает в Linux. Я использую scikit-learn для обучения классификатора Random Forest с 1000 деревьями на очень большом наборе данных. Я
1ответ
4 голоса
Как использовать маринованный классификатор с countVectorizer.fit_transform () для маркировки данных
Я обучил классификатор на наборе коротких документов и выбрал его после получения разумных значений f1 и точности для задачи двоичной классификации. Во время обучения я сократил количество функци
1ответ
4 голоса
sckit-learn fit () приводит к ошибке после нормализации данных
Я пробовал это: Создать объекты X и y в зависимости от набора данных Разделить набор данных Нормализовать данные Тренируйся, используя SVR от Scikit-learn Вот код, использующий фрейм да
1ответ
4 голоса
Как использовать OneVsRestClassifier в Scikit-learn для анализа эффективности прогнозирования каждого отдельного класса с помощью классификации нескольких классов?
В документации OneVsRestClassifier на сайте scikit-learn говорится следующее: "Поскольку каждый класс представлен только одним и одним классификатором, можно получить знания о классе, изучив его
1ответ
4 голоса
проверка перекрестного склеарна соответствует JoblibValueError
Я использую sklearn.cross_validation.cross_val_score для оценки моей модели. Ниже приведена часть моего кода: - """ 5-fold Cross Validation """ print "*** 5-fold Cross Validation" shuffle = Shuffl
2ответа
4 голоса
Вывод PCA выглядит странно для графика рассеяния Kmeans
После выполнения PCA для моих данных и построения кластеров kmeans мой график выглядит действительно странно. Центры скоплений и точечный график точек для меня не имеют смысла. Вот мой код: #click
1 2 3 4 5

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132