data.table — все вопросы

3ответа
10 голосов
Расширение суффиксов при слиянии на все не по столбцам
suffixes в merge работает только на общих именах столбцов. Можно ли как-нибудь распространить это на остальные столбцы, не обновляя столбцы вручную перед слиянием? То есть - df1 <- data.tabl
1ответ
10 голосов
Оцените, в каком размере data.table быстрее, чем data.frame
Может кто-нибудь помочь мне оценить, какой размер фрейма данных с использованием data.table быстрее для поиска? В моем случае использование фреймов данных будет 24 000 строк и 560 000 строк. Блоки и
4ответа
10 голосов
R: подмножество data.table на основе целочисленного столбца
Просто интересно, есть ли более изящный способ подмножества data.table. В основном у меня есть большая таблица с миллионными строками и сотнями столбцов. Я хочу установить его на основе целого числа
2ответа
10 голосов
Как преобразовать символ в число в data.table для определенных столбцов?
Набор данных ниже имеет характеристики моего большого набора данных. Я управляю этим в data.table, некоторые столбцы загружаются как chr, несмотря на то, что они являются числами, и я хочу преобразо
1ответ
11 голосов
Медленная утечка памяти в data.table при возврате именованных списков в j (при попытке изменить форму data.table)
Изменить 3: Я создал гораздо более короткий пример утечки памяти. Надеюсь, так будет легче рассуждать о том, что происходит. По мере продолжения итераций вы увидите, что использование памяти VCel
1ответ
11 голосов
R data.table ошибка не может переименовать имена столбцов, которые являются NA
У меня есть data.table, где имена некоторых столбцов: NA. попытка изменить их на имя персонажа не удалась, и они остаются NA. Мне удается заменить их, переключившись на data.frame, но есть ли спо
2ответа
11 голосов
Вычислите с data.table: сколько значений 2x2 non NA есть среди переменных?
Допустим, у меня есть этот data.table (фактические данные - 25061 x 5862): require(data.table) df # gene P1 P2 P3 P4 P5 # 1: gene1 0.111 0.319 0.151 NA -0.397 # 2: g
1ответ
11 голосов
Как извлечь выгоду из `.BY` в data.table?
Это объяснение в руководстве .BY    .BY - список, содержащий вектор длины 1 для каждого элемента в by. Это может быть полезно, когда by заранее неизвестно. Переменные by также доступны для j непо
3ответа
11 голосов
Сортировка таблицы данных с определенным порядком значений
Вот краткая таблица данных: DT <- data.table(Tag1 = c(22,253,6219,6219,252862,252864,312786,312812), Tag2 = c(22,255,6220,252857,252863,252865,251191,252863),
3ответа
11 голосов
Таблица данных Loop through для расчета условных средних
Я хочу "перебрать" строки таблицы данных и вычислить среднее значение для каждой строки. Среднее должно быть рассчитано на основе следующего механизма: Найдите идентификатор идентификатора в стр
2ответа
11 голосов
Как «удалить список» из столбца в data.table
в моей таблице некоторые ячейки являются векторами вместо одного значения, то есть столбец является списком вместо вектора: dt1 <- data.table( colA= c('A1','A2','A3'), colB=list('B1',c('
3ответа
11 голосов
Суммирование строк на основе определенных комбинаций факторов
Это, наверное, глупый вопрос, но я прочитал главу Кроули о фреймах данных и покопался в Интернете, но пока не смог заставить что-либо работать. Вот пример набора данных, похожего на мой: > d
1ответ
11 голосов
Медиана, возвращающая ошибку при использовании data.table в R
У меня есть следующий набор данных > head(DT) V1 V2 V3 V4 V5 V6 V7 1: 2 1 2 0.91 0.02 880.00 1 2: 3 2 1 0.02 0.00 2.24 2 3: 1 1 1 0.15 0.01 3.41 3 4: 1 2 1 3.92 0
1ответ
12 голосов
Подсчет, сколько раз условие выполняется в каждой группе
Я использую имитированный набор данных со многими группами (+ 2 мили), где я хочу подсчитать общее количество наблюдений и количество наблюдений выше порога (здесь оно равно 2) для каждой из моих гр
2ответа
12 голосов
преобразование данных прогноза эффективно с использованием data.table в R
Я ищу более эффективный способ преобразования данных в data.table в R. В данный момент я перебираю, чтобы выполнить преобразование нескольких предсказаний временных рядов. Я получаю правильный
1ответ
12 голосов
объединение data.table несколькими столбцами
Я довольно новичок в программировании, а также в data.table в R - так что, возможно, этот вопрос действительно прост, но я искал и не мог найти никаких решений. Я пытаюсь сопоставить 4 переменные п
1ответ
12 голосов
Установить переменную с помощью colnames (), обновить data.table с помощью оператора: =, переменная молча обновляется? [Дубликат]
     На этот вопрос уже есть ответ здесь:                   Почему данные. имена обновлений таблицы (DT) по ссылке, даже если я назначу другую переменную?                                    
2ответа
12 голосов
R: первое наблюдение по группе с использованием data.table & автообъединение
Я пытаюсь получить верхнюю строку с помощью группы из трех переменных, используя data.table. У меня есть рабочее решение: col1 <- c(1,1,1,1,2,2,2,2,3,3,3,3) col2 <- c(2000,2000,2001,2001,
5ответов
12 голосов
Быстрее версия комбн
Есть ли способ ускорить выполнение команды combn, чтобы получить все уникальные комбинации из 2 элементов, взятых из вектора? Обычно это настраивается так: # Get latest version of data.table li
1ответ
13 голосов
Вместо модификации матриц в R
Есть ли способ избежать копирования при модификации для модификаций матриц на месте в R? Я пытаюсь скопировать меньшую матрицу в фрагмент большей матрицы следующим образом. library(data.table)
1 2 3

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132