我想尝试不同的共线性测试,并在存在多重共线性的情况下获得功能重要性。
但是,我似乎没有为此找到数据集。我特别希望将类别变量和数值变量混合起来作为我的预测变量,并将二进制变量作为我的响应。
任何带有变量说明的数据都将非常有帮助。
预先感谢
答案 0 :(得分:0)
您可以尝试使用数据集CIC-IDS 2017,它具有连续变量和类别变量,并且这些变量具有很高的多重共线性。
您可以自由访问数据集的文件,向下滚动此页面:https://www.unb.ca/cic/datasets/ids-2017.html