pandas

У меня есть панда Dataframe, как показано ниже: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Я хочу удалить значения NaN с пустой строкой, чтобы это выглядело так: 1 2 3 0 a "" read 1 b l unread 2 c "" read ...

У меня есть 3 CSV-файлов. Каждый из них имеет первый столбец (строка) имена людей, в то время как все остальные столбцы в каждой таблице данных являются атрибутами этого человека. Как я могу "объединить" все три документа CSV, чтобы создать один CSV с каждой строкой, имеющей все атрибуты для каждого уникаль...

предположим, что у меня есть два фрейма данных: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Я хочу объединить их, поэтому я пытаюсь что-то вроде этого: pd.merge(left, right, left_on='key1', right_on='key2') и я счастлива ...

Я пытаюсь выделить именно то, что изменилось между двумя таблиц данных. Предположим, у меня есть два фрейма данных Python Pandas: "StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick ...

Я изучаю переход на python и pandas как давний пользователь SAS. однако, при запуске некоторых тестов сегодня, я был удивлен, что python выбежал из памяти при попытке pandas.read_csv() файл 128 Мб в формате CSV. Он имел около 200 000 строк и 200 столбцов в основном числовые данные. С помощью SAS я могу и...

Как мне взять несколько списков и поместить их в качестве разных столбцов в фрейм данных python? Я попытался следовать спискам чтения в столбцы фрейма данных pandas, но у меня были некоторые проблемы. Попытка 1: есть три списка, и застегнуть их вместе и использовать этот res = zip (lst1,lst2,lst3) дает тол...

Я хочу найти все значения в фрейме данных Pandas, которые содержат пробелы (любое произвольное количество) и заменить эти значения NaNs. любые идеи, как это можно улучшить? в основном я хочу повернуть это: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-...

у меня есть следующие 2 фрейма данных: df_a = mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 df_b = mukey niccdcd 0 190236 4 1 190237 6 2 190238 7 3 190239 4 4 190240 7 когда я пытаюсь соедини...

Я работаю с панды библиотека и я хочу добавить два новых столбца в фрейм данных df С n столбцами (n > 0). Эти новые столбцы являются результатом применения функции к одному из столбцов в фрейме данных. функция для применения выглядит так: def calculate(x): ...operate... return z, y один из спос...