data-science — все вопросы

1ответ
4 голоса
Numpy: конвертировать метки в индексы
Можно ли преобразовать строковый вектор в индексированный, используя numpy? Предположим, у меня есть массив строк типа ['ABC', 'DEF', 'GHI', 'DEF', 'ABC'] и т. д. Я хочу, чтобы он был заменен на
1ответ
4 голоса
Сравните названия столбцов Pandas Dataframe
Как сравнить имена столбцов 2 разных фреймов данных Pandas. Я хочу сравнить обучающие и тестовые фреймы данных, если в тестовых фреймах данных отсутствуют некоторые столбцы ??
1ответ
4 голоса
Python3 Создание трехмерного графика из словаря (значение: кортеж)
Я пытаюсь создать трехмерный сюжет из словаря и столкнулся с проблемой. Z-доступ будет ключом (MSE), а оси X и Y будут первым и вторым значениями кортежа, например, X будет 2, а Y будет 5 в первом п
1ответ
4 голоса
LightGBM - sklearnAPI против API обучения и структуры данных и lgb.cv против gridsearchcv /randomisedsearchcv
Каковы различия между sklearnAPI (LGBMModel, LGBMClassifier и т. д.) и API по умолчанию (lgb.Dataset, lgb.cv, lgb.train) из lightgbm? Какой из них мне лучше использовать? Лучше ли использовать
1ответ
4 голоса
как вычислить AUC (область под кривой) для оценки системы рекомендаций
Я запутался в вычислении AUC (область под кривой) для оценки результата системы рекомендаций. Если у нас есть данные перекрестной проверки, такие как (пользователь, продукт, рейтинг). Как выбрать
1ответ
4 голоса
Путаница Python .loc
Я делаю учебник Kaggle для Titanic с использованием платформы Datacamp. Я понимаю использование .loc в Pandas - для выбора значений по строке с помощью меток столбцов ... Мое замешательство св
4ответа
4 голоса
Ошибка импорта auto_arima из пирамиды
Попытка использовать функцию авто-аримы пирамиды и никуда не денется. Импорт всего класса: import pyramid stepwise_fit = auto_arima(df.Weighted_Price, start_p=0, start_q=0, max_p=10, max_q=1
2ответа
4 голоса
Разделить на равные части по значениям
Есть ли удобный способ разбить массив так, чтобы независимо от количества элементов в каждом разделе диапазон значений, который он содержит, был одинаковым?Скажем, у нас есть данные в диапазоне (0, 10
1ответ
4 голоса
Как оптимизировать MAPE-код в Python?
Мне нужно иметь функцию MAPE, однако я не смог найти ее в стандартных пакетах ... Ниже моя реализация этой функции.Мне это не нравится, это супер не оптимально с точки зрения скорости.Как переписать к
2ответа
4 голоса
Лучший способ поместить подкадр данных панд [закрыто]
Эй, я новичок в Пандах, и я только что наткнулся на ---- +: = 0 =: + ---- .Почему люди будут использовать ---- +: = 1 =: + ----, когда вы можете напрямую фильтровать ваши Dataframes, используя скобки?
1ответ
6 голосов
Реальные примеры машинного обучения? [закрыто]
Недавно я проходил курс машинного обучения в Coursera профессора Эндрю Нг. После прохождения этого курса я понял основы алгоритмов машинного обучения, но у меня есть следующие вопросы: Где я мо
2ответа
8 голосов
Удаление неанглоязычных слов из текста с помощью Python
Я делаю упражнение по очистке данных на python, и текст, который я очищаю, содержит итальянские слова, которые я хотел бы удалить. Я искал в Интернете, смогу ли я сделать это на Python, используя та
1ответ
11 голосов
Граница принятия решения для данных высокого измерения
Я строю модель для задачи двоичной классификации, в которой каждая из моих точек данных имеет 300 измерений (я использую 300 функций). Я использую PassiveAggressiveClassifier из sklearn . Модел
6ответов
104 голоса
Где я могу вызвать функцию BatchNormalization в Керасе?
Если я хочу использовать функцию BatchNormalization в Keras, нужно ли вызывать ее один раз только в начале? Я прочитал эту документацию для него: http://keras.io/layers/normalization/ Я не по

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132