панды преобразование данных long-wide-long


Как получить данные из этой формы (длинное представление данных):

import pandas as pd
df = pd.DataFrame({
    'c0': ['A','A','B'],
    'c1': ['b','c','d'],
    'c2': [1, 3,4]})

print(df)

Выход:

   c0 c1  c2
0  A  b   1
2  A  c   3
3  B  d   4

К этой форме:

   c0 c1  c2
0  A  b   1
2  A  c   3
3  A  d   NaN
4  B  b   NaN
5  B  c   NaN
6  B  d   4

Является ли преобразование от длинного к широкому к длинному единственным подходом к этому?

1 2

1 ответ:

Способ 1
unstack и stack

df.set_index(['c0', 'c1']).unstack().stack(dropna=False).reset_index()

Введите описание изображения здесь

Способ 2
reindex с продуктом

df.set_index(['c0', 'c1']).reindex(
    pd.MultiIndex.from_product([df.c0.unique(), df.c1.unique()], names=['c0', 'c1'])
).reset_index()

Введите описание изображения здесь