我有一个(1460, 76)
大小的数据集。它目前在pandas Dataframe中,它有各种数据类型:int, float, object
。我尝试在此数据框上运行VIF
函数以获取我的变量中的相关性,但是,它会抛出此错误:
TypeError: '>=' not supported between instances of 'str' and 'int'
VIF代码:
vif = [variance_inflation_factor(df.values, i) for i in range(df.shape[1])]
print(vif)
可能是什么原因,是因为我的数据中有字符串?