dataframe — все вопросы

3ответа
10 голосов
Заменить определенные пробелы на вкладки - разделители
У меня есть один столбец data.frame, где некоторые пробелы должны быть разделителями, а некоторые - просто пробелом. #input data dat <- data.frame(x=c("A 2 2 textA1 textA2 Z1",
5ответов
10 голосов
Применение gsub к различным столбцам
Как наиболее эффективно применить gsub к различным столбцам? Следующее не работает x1=c("10%","20%","30%") x2=c("60%","50%","40%") x3 = c(1,2,3) x = data.frame(x1,x2,x3) per_col = c(1,2) x = gsub(
4ответа
10 голосов
рассчитать сумму строки и произведение в data.frame
Я хотел бы добавить к моему data.frame в R столбцы, содержащие суммы строк и продукты Рассмотрим следующий фрейм данных x y z 1 2 3 2 3 4 5 1 2 Я хочу получить следу
4ответа
10 голосов
R: подмножество data.table на основе целочисленного столбца
Просто интересно, есть ли более изящный способ подмножества data.table. В основном у меня есть большая таблица с миллионными строками и сотнями столбцов. Я хочу установить его на основе целого числа
1ответ
10 голосов
Прописать первую букву каждого слова в столбце Python
как вы пишете с заглавной буквы первую букву каждого слова в столбце? Кстати, я использую Python Pandas. Например, Column1 The apple the Pear Green tea Мое ж
3ответа
10 голосов
Python панды: как убрать значения nan и -inf
У меня есть следующий фрейм данных time X Y X_t0 X_tp0 X_t1 X_tp1 X_t2 X_tp2 0 0.002876 0 10 0 NaN NaN NaN NaN NaN 1
2ответа
10 голосов
Панды группируют по двум столбцам, а затем получают значения
У меня есть датафрейм для панд: banned_titles = TitleId RelatedTitleId 0 89989 32598 1 89989 3085083 2 95281 3085083 когда я применяю групповой режим следую
7ответов
10 голосов
Последнее наблюдение перенесено в кадр данных? [Дубликат]
     На этот вопрос уже есть ответ здесь:                   Замена NA с последним значением не-NA                                      13 ответов                                Я хочу
1ответ
11 голосов
Переназначить уникальные значения - pandas DataFrame
Я пытаюсь assign unique значения в pandas df для конкретных лиц , Для df ниже, [Area] и [Place] вместе составляют unique значения, которые являются различными заданиями . Эти значения будут назн
1ответ
11 голосов
Реализация LIME на H2O моделирования в R
Я хочу реализовать LIME на модели, созданной с использованием h2o (глубокое обучение) в R. Для использования Данные в модели, я создал h2oFrames и преобразовал его обратно в dataframe перед исполь
3ответа
11 голосов
Создайте data.frame в R с динамически назначаемыми именами столбцов
Мне нужно создать data.frame, который будет заполняться по одной строке за раз по циклу for. Он имеет 45 столбцов: имена пяти из них являются статическими, но остальные считываются (как вектор) из в
3ответа
11 голосов
Уровни объединения двух столбцов
У меня есть 2 столбца данных с данными одного типа (строки). Я хочу присоединиться к уровням столбцов. то есть. у нас есть: col1 col2 Bob John Tom Bob Frank Jane Jim Bob Tom Bob
2ответа
11 голосов
Почему медленнее задавать тип в data.frame?
Я предварительно выделил большой data.frame для заполнения позже, что я обычно делаю с NA вот так: n <- 1e6 a <- data.frame(c1 = 1:n, c2 = NA, c3 = NA) и я подумал, будет ли это быстрее,
5ответов
11 голосов
Реверсивная кодировка «одна горячая» в Pandas
Постановка проблемы Я хочу перейти от этого фрейма данных, который в основном один горячий кодированный. In [2]: pd.DataFrame({"monkey":[0,1,0],"rabbit":[1,0,0],"fox":[0,0,1]}) Out[2]:
4ответа
11 голосов
Заполнение dict значениями NA, чтобы разрешить преобразование в фрейм данных панд
У меня есть диктат, который содержит вычисленные значения в разные промежутки времени, что означает, что они начинаются в разные даты. Например, данные, которые у меня есть, могут выглядеть следующи
2ответа
11 голосов
Панды: групповые и совокупные без потери столбца, который был сгруппирован
У меня есть датафрейм для панд, как показано ниже. Для каждого идентификатора у меня может быть несколько Имен и Подидентификаторов. Id NAME SUB_ID 276956 A 5933 276956 B 5934 2
2ответа
11 голосов
Разница между === нулевым и isNull в Spark DataDrame
Меня немного смущает разница, когда мы используем df.filter(col("c1") === null) and df.filter(col("c1").isNull) Тот же самый фрейм данных === ноль, но ноль считается в isNull. Пожалуйста, пом
1ответ
11 голосов
Как рассчитать количество каждого отдельного значения в фрейме данных pyspark?
У меня есть столбец, заполненный набором инициалов состояний в виде строк. Моя цель состоит в том, чтобы подсчитать каждое состояние в таком списке. Например: (("TX":3),("NJ":2)) должно быть выво
3ответа
11 голосов
Выберите строки из data.frame, заканчивающиеся определенной символьной строкой в ​​R
Я использую R и у меня есть data.frame с почти 2000 записями, который выглядит следующим образом: > head(PVs,15) LogFreq Word PhonCV FreqDev 1593 140 was CVC 5.480774 482
3ответа
11 голосов
Объединить 2 столбца в один в dataframe [закрыто]
Это должно быть просто, но я борюсь с этим. Я хочу объединить два столбца в одном кадре данных в один. У меня есть отдельные столбцы для идентификатора клиента (20227) и года (2009). Я хочу созда
1 2 3 4 5

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132