dataframe

Как составить список фреймов данных и как получить доступ к каждому из этих фреймов данных из списка? например, как я могу поместить эти фреймы данных в список ? d1 <- data.frame(y1 = c(1, 2, 3), y2 = c(4, 5, 6)) d2 <- data.frame(y1 = c(3, 2, 1), y2 = c(6, 5, 4)) ...

есть ли способ проверить, существует ли столбец в фрейме данных Pandas? предположим, что у меня есть следующие таблицы данных: >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randi...

возникли проблемы с фильтрацией моего результата dataframe с or состояние. Я хочу, чтобы мой результат df для извлечения всех столбцов _var_ ценности, которые выше 0,25 и ниже -0.25. Эта логика ниже дает мне неоднозначное значение истины, однако оно работает, когда я разделяю эту фильтрацию на две отдельные о...

У меня большой данные.таблица, со многими отсутствующими значениями, разбросанными по его ~ 200k строкам и 200 столбцам. Я хотел бы повторно кодировать эти значения NA в нули как можно эффективнее. Я вижу два варианта: 1: преобразование в данные.кадр, и использовать что-то такой 2: какие-то классные данные....

Я сделал данные.рамка в R, которая не очень большая, но для ее построения требуется довольно много времени. Я бы сохранил его как файл, который я могу снова открыть в R?...

у меня есть data.frame это выглядит так. x a 1 x b 2 x c 3 y a 3 y b 3 y c 2 Я хочу это в матричной форме, так что я могу кормить его на карту, чтобы сделать сюжет. Результат должен выглядеть примерно так: a b c x 1 2 3 y 3 3 2 Я пробовал cast из пакета reshape, и я попы...

Предположим, у меня есть переменная ответа и данные, содержащие три ковариаты (как пример игрушки): y = c(1,4,6) d = data.frame(x1 = c(4,-1,3), x2 = c(3,9,8), x3 = c(4,-4,-2)) Я хочу подогнать линейную регрессию к данным: fit = lm(y ~ d$x1 + d$x2 + d$y2) есть ли способ, чтобы написать формулу, так что я...

как получить доступ к соответствующему фрейму данных groupby в объекте groupby с помощью ключа? Со следующей группой: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Я ...

Я начал использовать Spark SQL и DataFrames в Spark 1.4.0. Я хочу определить пользовательский разделитель на фреймах данных, в Scala, но не вижу, как это сделать. одна из таблиц данных, с которыми я работаю, содержит список транзакций, по счету, silimar в следующем примере. Account Date Type ...

каков наилучший способ назначить несколько столбцов с помощью data.table? Например: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Я хотел бы сделать что-то вроде этого (конечно, этот синтаксис неверен): x[ , (col1, col2) := f(), by = "id"] и чтобы расширить это, у меня может быть ...