data.table

Я борюсь с тем, что кажется простым продолжением предыдущего вопроса, который я задал здесь. Я пытаюсь агрегировать (а) диапазон дат и (Б) факторную переменную. Примерные данные могут быть: Brand Day Rev RVP A 1 2535.00 195.00 B 1 1785.45 43.55 C ...

У меня есть данные.таблица я пытаюсь построить фасеты с помощью ggplot и получаю ошибку, указанную ниже. Заранее спасибо за любую помощь. require(data.table, ggplot2) dt <- as.data.table(read.table(h=T, text="ROW mode resbin V1 0 RD 50.0 0 1 RD 50.0 0 2 RD 50.0 0 0 RD 33.3 0 1 RD...

Я хотел бы написать функцию, которая выбирает строки из таблицы данных, которые попадают в определенный диапазон для динамически именованного столбца. Пытаясь написать это, я обнаружил, что не могу сделать выбор строк, применяя критерии к динамически определяемому столбцу. Вот мои примеры: Это прекрасно раб...

обзор я относительно знаком с data.table, не так много с dplyr. Я прочитал некоторые dplyr виньеток и примеры, которые выскочили на SO, и до сих пор мои выводы таковы: data.table и dplyr сопоставимы по скорости, за исключением тех случаев, когда есть много (т. е. >10-100K) групп, а также в некоторых д...

у меня возникли небольшие проблемы с пониманием свойств pass-by-reference data.table. Некоторые операции, похоже, "ломают" ссылку, и я хотел бы точно понять, что происходит. о создании data.table С другой data.table (через <-, затем обновление новой таблицы с помощью :=, оригинальная таблица также изменяе...

чтобы избавиться от столбца с именем "foo" в data.frame, Я могу сделать: df <- df[-grep('foo', colnames(df))] однако, один раз df превращается в data.table объект, нет никакого способа просто удалить столбец. пример: df <- data.frame(id = 1:100, foo = rnorm(100)) df2 <- df[-grep('foo', colnames(...

У меня большой данные.таблица, со многими отсутствующими значениями, разбросанными по его ~ 200k строкам и 200 столбцам. Я хотел бы повторно кодировать эти значения NA в нули как можно эффективнее. Я вижу два варианта: 1: преобразование в данные.кадр, и использовать что-то такой 2: какие-то классные данные....

Я просматриваю документацию data.table а также заметил из некоторых разговоров здесь на так что rbindlist должен быть лучше, чем rbind. Я хотел бы знать, почему rbindlist лучше, чем rbind и в каких сценариях rbindlist действительно превосходит rbind? есть ли какие-либо преимущества с точки зрения использов...

каков наилучший способ назначить несколько столбцов с помощью data.table? Например: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Я хотел бы сделать что-то вроде этого (конечно, этот синтаксис неверен): x[ , (col1, col2) := f(), by = "id"] и чтобы расширить это, у меня может быть ...

я использую данные.таблица и есть много функций, которые требуют от меня установить ключ (например,X[Y]). Таким образом, я хочу понять, что делает ключ, чтобы правильно установить ключи в моих таблицах данных. один источник, который я читал, был ?setkey. setkey() сортировка data.table и помечает его как...