Панда скользящая медиана для повторяющихся данных временного ряда

Я вижу, что Pandas пока не позволяет дублировать индексы временных рядов ( https://github.com/pydata/pandas/issues/643 ), но будет добавлено в ближайшее время. Мне интересно, есть ли хороший способ применения скользящих оконных средств к набору данных с дублирующимся временем с помощью многоиндексного тега /столбца

По сути, у меня есть CSV неупорядоченных событий, которые состоят из времени эпохи, иерархических тегов (tag1, tag2) и времени. Небольшой образец:

 epochTimeMS,event,tag,timeTakenMS
 1331782842801,event1,tag1,16
 1331782841535,event1,tag2,1278
 1331782842801,event1,tag1,17
 1331782842381,event2,tag1,436

То, что я хочу сделать, - это построить и прокрутить график с различными мс окнами, по событию и по событию + тег. Кажется, что это должно быть выполнено в Pandas, но я не уверен, что мне нужно будет ждать, пока сначала появятся дублирующие индексы временных рядов. Есть какие-нибудь мысли о взломе этого на месте сейчас?

4 голоса | спросил Aaron 19 MaramMon, 19 Mar 2012 00:51:48 +04002012-03-19T00:51:48+04:0012 2012, 00:51:48

1 ответ


0

Ничто не может остановить тебя прямо сейчас:

In [17]: idf = df.set_index(['tag', 'epochTimeMS'], verify_integrity=False).sort_index()

In [18]: idf
Out[18]: 
                     event  timeTakenMS
tag  epochTimeMS                       
tag1 1331782842381  event2          436
     1331782842801  event1           16
     1331782842801  event1           17
tag2 1331782841535  event1         1278

In [20]: idf.ix['tag1']
Out[20]: 
                event  timeTakenMS
epochTimeMS                       
1331782842381  event2          436
1331782842801  event1           16
1331782842801  event1           17

Доступ к определенным значениям по метке времени вызовет исключение (это будет улучшено, как вы упомянули), но вы, безусловно, можете работать с данными. Теперь, если вам нужно окно фиксированной длины (во временном пространстве), оно еще не очень хорошо поддерживается, но я создал здесь проблему:

https://github.com/pydata/pandas/issues/936

Если бы вы могли рассказать в своем списке рассылки о ваших требованиях к API в вашем приложении, это было бы полезно для меня и ребят, поскольку мы сейчас активно работаем над возможностями временных рядов.

ответил Wes McKinney 19 MaramMon, 19 Mar 2012 01:43:52 +04002012-03-19T01:43:52+04:0001 2012, 01:43:52

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132