我刚刚开始使用 SAS Visual Analytics,我想将我在训练样本上构建的逻辑回归应用到我想要进行预测的测试样本中。让我更清楚:
该数据与一个虚构的电子商务网站有关。我的兴趣是根据一系列观察到的变量计算出客户完成购买的概率。
相关变量:取值为 0/1 表示客户是否购买(或不购买)
自变量:它们是一系列二元变量,指示客户可能执行的某些操作(例如,“添加到购物车”;“检查运输详细信息”;...)。数据集如下所示:
User_ID | 有序 | View_cart | View_shipping |
---|---|---|---|
1 | 0 | 1 | 0 |
2 | 1 | 0 | 1 |
3 | 1 | 1 | 0 |
4 | 0 | 0 | 1 |
5 | 1 | 1 | 0 |
测试样本包含与训练样本相同的信息,但包含我需要预测的因变量。该数据集如下所示:
User_ID | View_cart | View_shipping |
---|---|---|
8 | 0 | 1 |
9 | 0 | 1 |
10 | 1 | 0 |
11 | 1 | 0 |
12 | 1 | 0 |
到目前为止,我已经运行了回归,使用分区来训练测试使用训练样本的回归。下一步是将回归获得的结果应用于我需要对其进行预测以获得购买预测的样本。
希望一切都清楚