如何将pandas数据帧转换为热图兼容数据帧?

时间:2016-04-12 15:23:33

标签: python pandas matplotlib heatmap

我有一个像这样的pandas数据框:

  x_specie   y_species         r_value        irrelevant 
0    name1    name2    0.46042854769889    1.08625581318480
1    name3    name4    0.08520026289205    0.31828185948920
2    name5    name6    0.59751876928376    0.03611201620948
3    name7    name8    0.21827455728522    1.28464913995526
4    name9    name10    0.03241820474363    0.69957843027741

可以通过以下方式生成类似的内容:

Index= ['aaa', 'bbb', 'ccc', 'ddd', 'eee']
Cols = ['A', 'B', 'C', 'D']
df = DataFrame(abs(np.random.randn(5, 4)), index=Index, columns=Cols)

基本上我想使用matplotlibs ax.pcolor()制作r_value列的热图,但我需要先将这些数据转换成适当的格式,我相信这样的格式:

     name2     name4     name6    name8    name10
name1 r_value1 ...       ...               ...
name3 ...      ...
name5                    ...
name7                             ...
name9 ...                                  ...

使用r_values在正确的位置填充表格(请注意,虽然上面的虚拟数据并不涵盖我的实际数据所做的所有潜在组合)。

最简单的方法是什么?提前致谢

1 个答案:

答案 0 :(得分:3)

您可以使用pivot_tablefillna来获取x和y种类的所有组合(将NaNs填充为0)。

import matplotlib.pyplot as plt
import pandas as pd

pivoted_table = df.pivot(index='x_specie', columns='y_species', values='r_value')
pivoted_table.fillna(0, inplace=True)
plt.pcolor(pivoted_table.values, cmap=plt.cm.Reds)
plt.show()