用于检测多重共线性的数据集

时间:2019-07-30 13:21:44

标签: dataset

我想尝试不同的共线性测试,并在存在多重共线性的情况下获得功能重要性。

但是,我似乎没有为此找到数据集。我特别希望将类别变量和数值变量混合起来作为我的预测变量,并将二进制变量作为我的响应。

任何带有变量说明的数据都将非常有帮助。

预先感谢

1 个答案:

答案 0 :(得分:0)

您可以尝试使用数据集CIC-IDS 2017,它具有连续变量和类别变量,并且这些变量具有很高的多重共线性。

您可以自由访问数据集的文件,向下滚动此页面:https://www.unb.ca/cic/datasets/ids-2017.html