Объединение двух фреймов данных pandas (объединение в общий столбец)

у меня есть 2 фрейма данных: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values lati ...

'Таблицы данных' объект не имеет атрибут 'сортировать'

я столкнулся с некоторой проблемой здесь, в моем пакете python у меня есть установка numpy, но у меня все еще есть эта ошибка объект' DataFrame 'не имеет атрибута 'sort' любой может дать мне некоторое представление.. Это мой код : final.loc[-1] = ...

получение индекса строки в функции pandas apply

Я пытаюсь получить доступ к индексу строки в функции, применяемые во всем DataFrame в панд. У меня есть что-то вроде этого: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 и я опреде ...

Элементарно логический или в панд

Я хотел бы элементарно логический или оператор. Я знаю, что" или " само по себе не то, что я ищу. Для и я хочу использовать & как объяснено здесь. Ибо не хочу использовать np.инвертировать () как объяснено здесь. Так что же такое эквивалент для ...

панды: несколько условий при индексировании фрейма данных-неожиданное поведение

я фильтрую строки в фрейме данных по значениям в двух столбцах. по какой-то причине оператор OR ведет себя так, как я ожидал бы, и оператор будет вести себя и наоборот. мой тестовый код: import pandas as pd df = pd.DataFrame({'a': range(5), 'b': ...

Использование панд в pd.чтение excel() для нескольких листов одной книги

У меня есть большой файл электронных таблиц (.xlsx), что я обрабатываю с помощью python pandas. Бывает, что мне нужны данные из двух вкладок в этом большом файле. Одна из вкладок содержит массу данных, а другая-всего несколько квадратных ячеек. когд ...

панды читают csv и фильтруют столбцы с помощью usecols

у меня есть csv-файл, который не приходит правильно с pandas.read_csv когда я фильтрую столбцы с usecols и использовать несколько индексов. import pandas as pd csv = r"""dummy,date,loc,x bar,20090101,a,1 bar,20090102,a,3 bar,20090103,a,5 ...

Изменение одного значения на основе другого значения в панд

Я пытаюсь перепрограммировать свой код Stata в Python для улучшения скорости, и мне указали в направлении панд. Тем не менее, мне трудно обернуть голову вокруг того, как обрабатывать данные. допустим, я хочу перебрать все значения в заголовке столб ...

Как дать панды/библиотек matplotlib столбчатой диаграммы пользовательские цвета

Я только начал использовать pandas / matplotlib в качестве замены Excel для создания сложенных гистограмм. Я столкнулся с проблемой (1) в цветовой карте по умолчанию есть только 5 цветов, поэтому, если у меня есть более 5 категорий, то цвета повто ...

Pandas dataframe fillna () только некоторые столбцы на месте

Я пытаюсь заполнить значения none в фрейме данных Pandas с 0 только для некоторого подмножества столбцов. когда я делаю: import pandas as pd df = pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]}) print df df.fillna(value=0, ...

каков наиболее эффективный способ подсчета встречаемости у панд?

у меня есть большой (около 12 м строк) dataframe df С сказать: df.columns = ['word','documents','frequency'] так что следующие побежали своевременно: word_grouping = df[['word','frequency']].groupby('word') MaxFrequency_perWord = word_grouping[[' ...

Объедините список фреймов данных панд в один фрейм данных панд

у меня есть список панд dataframes, которые я хотел бы объединить в один панд dataframe. Я использую Python 2.7.10 и панды 0.16.2 Я создал список фреймов данных из: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.rea ...

Как найти, какие столбцы содержат любое значение NaN в Pandas dataframe (python)

учитывая фрейм данных pandas, содержащий (возможно) значения NaN, разбросанные здесь и там: вопрос: как определить, какие столбцы содержат значения NaN? В частности, могу ли я получить список имен столбцов, содержащих NaNs? спасибо ...

Загрузка данных из txt с пандами

я загружаю txt-файл, содержащий смесь данных float и string. Я хочу хранить их в массиве, где я могу получить доступ к каждому элементу. Теперь я просто делаю import pandas as pd data = pd.read_csv('output_list.txt', header = None) print data Эт ...

декартово произведение в панд

у меня есть две панды dataframes: from pandas import DataFrame df1 = DataFrame({'col1':[1,2],'col2':[3,4]}) df2 = DataFrame({'col3':[5,6]}) какова лучшая практика, чтобы получить их декартово произведение (конечно, не записывая его явно, как ...

Ошибка Matplotlib/Pandas с использованием гистограммы

у меня проблема с созданием гистограмм из объектов серии pandas, и я не могу понять, почему это не работает. Код работал нормально раньше, но теперь это не так. вот немного моего кода (в частности, объект серии pandas, который я пытаюсь сделать гист ...

Как построить два столбца фрейма данных pandas с использованием точек?

у меня есть фрейм данных pandas и я хотел бы построить значения из одного столбца по сравнению со значениями из другого столбца. К счастью, есть plot метод, связанный с фреймами данных, которые, кажется, делают то, что мне нужно: df.plot(x='col_name ...

HDF5-параллелизм, сжатие и производительность ввода-вывода [закрыто]

У меня есть следующие вопросы о производительности HDF5 и параллелизме: поддерживает ли HDF5 параллельный доступ на запись? соображения параллелизма в сторону, как производительность HDF5 с точки зрения производительность ввода/вывода (не степень ...

панды: сложный фильтр по строкам фрейма данных

Я хотел бы фильтровать строки по функции каждой строки, например def f(row): return sin(row['velocity'])/np.prod(['masses']) > 5 df = pandas.DataFrame(...) filtered = df[apply_to_all_rows(df, f)] или для другого более сложного, надуманного п ...

Добавление мета-данных/метаданных для панды фрейма данных

можно ли добавить некоторую метаинформацию / метаданные в фрейм данных pandas? например, название инструмента, используемого для измерения данных приборов несет ответственность и т. д. одним из обходных путей было бы создать столбец с этой информац ...