我有一个像这样的pandas数据框:
x_specie y_species r_value irrelevant
0 name1 name2 0.46042854769889 1.08625581318480
1 name3 name4 0.08520026289205 0.31828185948920
2 name5 name6 0.59751876928376 0.03611201620948
3 name7 name8 0.21827455728522 1.28464913995526
4 name9 name10 0.03241820474363 0.69957843027741
可以通过以下方式生成类似的内容:
Index= ['aaa', 'bbb', 'ccc', 'ddd', 'eee']
Cols = ['A', 'B', 'C', 'D']
df = DataFrame(abs(np.random.randn(5, 4)), index=Index, columns=Cols)
基本上我想使用matplotlibs ax.pcolor()
制作r_value列的热图,但我需要先将这些数据转换成适当的格式,我相信这样的格式:
name2 name4 name6 name8 name10
name1 r_value1 ... ... ...
name3 ... ...
name5 ...
name7 ...
name9 ... ...
使用r_values在正确的位置填充表格(请注意,虽然上面的虚拟数据并不涵盖我的实际数据所做的所有潜在组合)。
最简单的方法是什么?提前致谢
答案 0 :(得分:3)
您可以使用pivot_table和fillna来获取x和y种类的所有组合(将NaNs填充为0)。
import matplotlib.pyplot as plt
import pandas as pd
pivoted_table = df.pivot(index='x_specie', columns='y_species', values='r_value')
pivoted_table.fillna(0, inplace=True)
plt.pcolor(pivoted_table.values, cmap=plt.cm.Reds)
plt.show()