Объединение двух фреймов данных pandas (объединение в общий столбец)

у меня есть 2 фрейма данных: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values lati ...

'Таблицы данных' объект не имеет атрибут 'сортировать'

я столкнулся с некоторой проблемой здесь, в моем пакете python у меня есть установка numpy, но у меня все еще есть эта ошибка объект' DataFrame 'не имеет атрибута 'sort' любой может дать мне некоторое представление.. Это мой код : final.loc[-1] = ...

получение индекса строки в функции pandas apply

Я пытаюсь получить доступ к индексу строки в функции, применяемые во всем DataFrame в панд. У меня есть что-то вроде этого: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 и я опреде ...

Использование панд в pd.чтение excel() для нескольких листов одной книги

У меня есть большой файл электронных таблиц (.xlsx), что я обрабатываю с помощью python pandas. Бывает, что мне нужны данные из двух вкладок в этом большом файле. Одна из вкладок содержит массу данных, а другая-всего несколько квадратных ячеек. когд ...

Объедините неравные фреймы данных и замените отсутствующие строки на 0

у меня есть два данных.фреймы, один с только символами, а другой с символами и значениями. df1 = data.frame(x=c('a', 'b', 'c', 'd', 'e')) df2 = data.frame(x=c('a', 'b', 'c'),y = c(0,1,0)) merge(df1, df2) x y 1 a 0 2 b 1 3 c 0 Я хочу объединить ...

Pandas dataframe fillna () только некоторые столбцы на месте

Я пытаюсь заполнить значения none в фрейме данных Pandas с 0 только для некоторого подмножества столбцов. когда я делаю: import pandas as pd df = pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]}) print df df.fillna(value=0, ...

Преобразование именованного символьного вектора в данные.рамка

у меня есть именованный вектор символов, возвращаемый из xmlAttrs следующим образом: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Я хотел бы преобразовать его в фре ...

Как найти, какие столбцы содержат любое значение NaN в Pandas dataframe (python)

учитывая фрейм данных pandas, содержащий (возможно) значения NaN, разбросанные здесь и там: вопрос: как определить, какие столбцы содержат значения NaN? В частности, могу ли я получить список имен столбцов, содержащих NaNs? спасибо ...

Разбить большой фрейм данных на список фреймов данных на основе общего значения в столбце

у меня есть фрейм данных с 10 столбцами, собирающий действия "пользователей", где один из столбцов содержит идентификатор (не уникальный, идентифицирующий пользователя)(столбец 10). длина фрейма данных составляет около 750000 строк. Я пытаюсь извлечь ...

Как построить два столбца фрейма данных pandas с использованием точек?

у меня есть фрейм данных pandas и я хотел бы построить значения из одного столбца по сравнению со значениями из другого столбца. К счастью, есть plot метод, связанный с фреймами данных, которые, кажется, делают то, что мне нужно: df.plot(x='col_name ...

Выберите только первые строки для каждого уникального значения столбца в R

из фрейма данных, как это test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ] rownames(test) <- 1:10 > test id string 1 1 A 2 1 F 3 2 B 4 2 G 5 3 C 6 ...

R: потеря имен столбцов при добавлении строк в пустой фрейм данных

Я только начинаю с R и столкнулся со странным поведением: при вставке первой строки в пустой фрейм данных, оригинальные имена столбцов теряются. пример: a<-data.frame(one = numeric(0), two = numeric(0)) a #[1] one two #<0 rows> (or 0-lengt ...

Найти индексы дублированных строк [дубликат]

этот вопрос уже есть ответ здесь: Поиск всех повторяющихся строк, включая " элементы с меньшими индексами" 3 ответы функция, дублированная в R, выполняет пои ...

Повторите строки данных.рамка

Я хочу повторить строки данных.кадр, каждый N раза. Результат должен быть новый data.frame (С nrow(new.df) == nrow(old.df) * N) сохранение типов данных столбцов. пример для N = 2: A B C A B C 1 j i 100 1 j ...

Изменить значение переменной с помощью dplyr [дубликат]

этот вопрос уже есть ответ здесь: Установите определенные значения в NA с помощью dplyr 3 ответы мне регулярно нужно менять значения переменной на основе зна ...

Переименование названий столбцов в таблице данных СПАРК Скала

Я пытаюсь преобразовать все заголовки / имена столбцов a DataFrame в Spark-Scala. на данный момент я придумал следующий код, который заменяет только одно имя столбца. for( i <- 0 to origCols.length - 1) { df.withColumnRenamed( df.columns(i ...

Как сформировать столбец кортежа из двух столбцов в панд

у меня есть фрейм данных Pandas, и я хочу объединить столбцы " lat " и "long", чтобы сформировать кортеж. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Repor ...

Как распечатать Pandas DataFrame без индекса

Я хочу напечатать весь фрейм данных, но я не хочу печатать индекс кроме того, один столбец-это тип datetime, я просто хочу напечатать время, а не дату. фрейм данных выглядит так: User ID Enter Time Activity Number 0 123 2014-0 ...

Условная замена значений в данных.рамка

я пытаюсь понять, как условно заменить значения в фрейме данных без использования цикла. Мой фрейм данных структурирован следующим образом: > df a b est 1 11.77000 2 0 2 10.90000 3 0 3 10.32000 2 0 4 10.96000 0 0 5 9.90600 ...

Преобразование фрейма данных в данные.таблица без копии

у меня есть большой фрейм данных (в порядке нескольких ГБ), который я хотел бы преобразовать в data.table. Используя as.data.table создает копию фрейма данных, что означает, что мне нужна доступная память, чтобы быть по крайней мере в два раза больше ...