dataframe

у меня есть фрейм данных pandas и я хотел бы построить значения из одного столбца по сравнению со значениями из другого столбца. К счастью, есть plot метод, связанный с фреймами данных, которые, кажется, делают то, что мне нужно: df.plot(x='col_name_1', y='col_name_2') к сожалению, это выглядит как среди с...

у меня есть фрейм данных с 10 столбцами, собирающий действия "пользователей", где один из столбцов содержит идентификатор (не уникальный, идентифицирующий пользователя)(столбец 10). длина фрейма данных составляет около 750000 строк. Я пытаюсь извлечь отдельные фреймы данных (таким образом, получая список или ...

учитывая фрейм данных pandas, содержащий (возможно) значения NaN, разбросанные здесь и там: вопрос: как определить, какие столбцы содержат значения NaN? В частности, могу ли я получить список имен столбцов, содержащих NaNs? спасибо...

у меня есть именованный вектор символов, возвращаемый из xmlAttrs следующим образом: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Я хотел бы преобразовать его в фрейм данных, который выглядит следующим образом: testDF <-...

Я пытаюсь заполнить значения none в фрейме данных Pandas с 0 только для некоторого подмножества столбцов. когда я делаю: import pandas as pd df = pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]}) print df df.fillna(value=0, inplace=True) print df вывод: a b c 0 1.0 4...

у меня есть два данных.фреймы, один с только символами, а другой с символами и значениями. df1 = data.frame(x=c('a', 'b', 'c', 'd', 'e')) df2 = data.frame(x=c('a', 'b', 'c'),y = c(0,1,0)) merge(df1, df2) x y 1 a 0 2 b 1 3 c 0 Я хочу объединить df1 и df2. Символы a, b и c слились хорошо, а также имеют 0,...

У меня есть большой файл электронных таблиц (.xlsx), что я обрабатываю с помощью python pandas. Бывает, что мне нужны данные из двух вкладок в этом большом файле. Одна из вкладок содержит массу данных, а другая-всего несколько квадратных ячеек. когда я использую pd.read_excel () on любой рабочий лист, мне ка...

Я пытаюсь получить доступ к индексу строки в функции, применяемые во всем DataFrame в панд. У меня есть что-то вроде этого: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 и я определю функцию, которая обращается к элементам с заданной строко...

я столкнулся с некоторой проблемой здесь, в моем пакете python у меня есть установка numpy, но у меня все еще есть эта ошибка объект' DataFrame 'не имеет атрибута 'sort' любой может дать мне некоторое представление.. Это мой код : final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting...

у меня есть 2 фрейма данных: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 no...