Question

我想保存一个熊猫数据透视表供人类阅读，但是DataFrame.to_csv不包含DataFrame.columns.name。我该怎么办？

示例：

对于以下数据透视表：

>>> import pandas as pd
>>> df = pd.DataFrame([[1, 2, 3], [6, 7, 8]])
>>> df.columns = list("ABC")
>>> df.index = list("XY")
>>> df
   A  B  C
X  1  2  3
Y  6  7  8
>>> p = pd.pivot_table(data=df, index="A", columns="B", values="C")

在查看数据透视表时，我们同时拥有索引名称（“ A”）和列名称（“ B”）。

>>> p
B    2    7
A
1  3.0  NaN
6  NaN  8.0

但是当导出为csv时，我们会丢失列名称：

>>> p.to_csv("temp.csv")

===temp.csv===
A,2,7
1,3.0,
6,,8.0

如何获得某种人类可读的输出格式，其中包含整个数据透视表，包括.columns.name（“ B”）？

可以这样：

B,2,7
A,,
1,3.0,
6,,8.0

Answer 1

是的，可以通过附加助手DataFrame来实现，但是读取文件有点复杂：

p1 = pd.DataFrame(columns=p.columns, index=[p.index.name]).append(p)
p1.to_csv('temp.csv',index_label=p.columns.name)
B,2,7
A,,
1,3.0,
6,,8.0

#set first column to index
df = pd.read_csv('temp.csv', index_col=0)
#set columns and index names
df.columns.name = df.index.name
df.index.name = df.index[0]
#remove first row of data
df = df.iloc[1:]
print (df)
B    2    7
A          
1  3.0  NaN
6  NaN  8.0

保存熊猫pivot_table以包括索引和列名称

1 个答案: