plt.figure(figsize=(10,10))
sns.heatmap(df.corr())
数据有14个变量,但只有前4个变量被绘制在热图上。与剩余变量中的缺失值有关吗?
答案 0 :(得分:0)
如果我没记错的话,除非您的字符串值是分类的(检查python to_categorical
意味着每个0和1的字符串都有新的列),否则您将无法使用.corr()
将它们关联起来,正如您在第二行代码sns.heatmap(df.corr())
中提到的那样。这意味着制作热图的功能(变量)将更少。
检查以下示例:
# first import libraries
import pandas as pd
import numpy as np
将返回空值,包含字符串:
values = np.transpose([[3,'dos',9], ['cuatro',9, 7], [4,5,6], [4,5,6]])
cols = ["first", 'second','third','fourth']
print(pd.DataFrame(values, columns=cols).corr())
将实现您所需要的:
# only numbers for the values
values = np.transpose([[1,3,9], [10,20, 7], [4,5,6], [4,5,6]])
cols = ["first", 'second','third','fourth']
print(pd.DataFrame(values, columns=cols).corr())