pandas — все вопросы

1ответ
4 голоса
применить функцию к панде Dataframe, чье возвращаемое значение основано на других строках
У меня есть датафрейм, который выглядит примерно так: >>> import pandas >>> df = pandas.DataFrame({'region' : ['east', 'west', 'south', 'west', ... 'east', 'west', 'east', 'west
2ответа
4 голоса
Как эффективно объединить похожие кадры данных в Pandas в один гигантский кадр данных
У меня есть 7000 фреймов данных со столбцами Date, X_1 Date, X_2 ... Каждый кадр данных имеет около 2500 строк. Даты иногда пересекаются, но это не гарантируется. Я хотел бы объединить их
3ответа
4 голоса
NLTK ConditionalFreqDist к пандам
Я пытаюсь работать с таблицей, сгенерированной с помощью nltk.ConditionalFreqDist, но не могу найти никакой документации ни по записи таблицы в файл csv, ни по экспорту в другие форматы. Я бы хотел
2ответа
4 голоса
не позволяй matplotlib перебазировать мои оси в ноль
У меня есть временной ряд панд: timeSeries 2010-01-16 02:00:00 512450 2010-01-16 02:00:01 512450 2010-01-16 02:00:02 512450 2010-01-16 02:00:03 512450 ... Я хочу построить это так,
1ответ
4 голоса
Переименование одного предмета уровня в пандах MultiIndex
У меня есть пандас DataFrame со структурой, подобной этой: Name Location Position Data1 Data2 Foo loc1 12345 present absent Foo2 loc2 67890 absent pres
1ответ
4 голоса
df.columns и df2.columns это один и тот же объект?
У меня есть фрейм данных df2, который является копией другого фрейма данных: In [5]: df = DataFrame({"A":[1,2,3],"B":[4,5,6],"C":[7,8,9]}) In [6]: df Out[6]: A B C 0 1 4 7 1 2 5 8 2 3
1ответ
4 голоса
разделить элементы данных pandas по строке max
Интересно, как разделить элементы в DataFrame по его строке макс. Смотрите следующий код: index = pd.date_range('1/1/2000', periods=8) df = DataFrame(np.random.randn(8, 3), index=index, columns=['
2ответа
4 голоса
Переиндексация и заполнение значений NaN в Пандах
Рассмотрим этот набор данных: data_dict = {'ind' : [1, 2, 3, 4], 'location' : [301, 301, 302, 303], 'ind_var' : [4, 8, 10, 15], 'loc_var' : [1, 1, 7, 3]} df = pd.DataFrame(data_dict) df_indexed =
1ответ
4 голоса
кадр данных панд заполнить пропущенные строки столбцом даты
uuid site ts visit 0 +CW99 1124 2013-06-24 2 1 +CW99 1124 2013-06-26 1 2 +CW99 1124 2013-06-27 1 3 +CW99 1124 2013-06-20 1 4 +CW99 1124 2013-06-21 1
2ответа
4 голоса
Оптимизация SciPy с группированными границами
Я пытаюсь выполнить оптимизацию портфеля, которая возвращает веса, которые максимизируют мою функцию полезности. Я прекрасно справляюсь с этой частью, включая ограничение, что весовые коэффициенты р
2ответа
4 голоса
Регистронезависимый pandas.concat
Как мне выполнить pandas.concat без учета регистра? df1 = pd.DataFrame({"a":[1,2,3]},index=["a","b","c"]) df2 = pd.DataFrame({"b":[1,2,3]},index=["a","b","c"]) df1a = pd.DataFrame({"A":[1,2,3]},in
1ответ
4 голоса
Создавайте перекрывающиеся группы с помощью группы панд
Я использую Pandas Timegrouper для группировки точек данных в кадре данных pandas в python: grouped = data.groupby(pd.TimeGrouper('30S')) Я хотел бы знать, есть ли способ добиться перекрытия ок
1ответ
4 голоса
Как объединить данные из множества фреймов данных в один фрейм данных с массивом в качестве значений данных
Если у меня много фреймов данных panda с одинаковой структурой индекса, я хочу создать фрейм данных с такой же структурой индекса, но значения данных - это np.arrays (на самом деле я хочу np.matrix.
1ответ
4 голоса
Pandas: Как получить новый фрейм данных, заполненный объединениями из 2, 3 или X других фреймов?
У меня длинный фрейм данных с ежедневными датами, начиная с 1999 года. Я применяю фильтр к original_dataframe для создания new_dataframe_1 и другой фильтр для создания new_dataframe_2. Как мне со
2ответа
4 голоса
Как использовать значение определенного столбца в предложении Pandas DataFrame где?
Я пытаюсь выбрать все ячейки в фрейме данных pandas, которые соответствуют определенным критериям, когда определенный столбец также соответствует отдельным критериям. Учитывая следующий DataFrame
2ответа
4 голоса
Использование тернарного оператора в функции применения в панде, без группировки столбцов
Как я могу использовать троичный оператор в лямбда-функции внутри функции apply pandas датафрейм? Прежде всего, этот код взят из R /plyr, и это именно то, что я хочу получить: ddply(mtcars, .(c
1ответ
4 голоса
Pandas DataFrame Matplotlib BoxPlot Boxes
Как создать блок-график, в котором каждая строка в моем объекте данных представляет собой блок на графике? У меня есть некоторые данные о запасах, которые я хочу нанести на график. Мои данные взя
2ответа
4 голоса
IndexError при попытке чтения таблицы с пандами
Обновление: это дубликат " протоколов с parse_dates and names ", но сначала был дан ответ на этот вопрос. Я не могу заставить этот код работать на всю жизнь. Как только я уберу параметр names
1ответ
4 голоса
Несовместимый индексатор с серией
Почему я получаю ошибку: import pandas as pd a = pd.Series(index=[4,5,6], data=0) print a.loc[4:5] a.loc[4:5] += 1 Вывод: 4 0 5 0 Traceback (most recent call last): File "temp1.py", l
2ответа
4 голоса
Голова команды Панд не дает ожидаемых результатов
Я не могу заставить работать функции панд. Вот простой пример. Я прочитал в наборе данных kaggle на фрейм данных с помощью следующих команд: import pandas as pd train_data=pd.read_csv('kaggle_trai
1 2 3 4 5 6 7 8

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132