我的数据集不平衡,我想使用SMOTE。我正在使用Azure ML。我已经在Microsoft Doku页面上阅读了许多示例。我想知道为什么在70%数据集上将SMOTE设置在SPLIT DATA函数之前而不是SPLIT DATA之后进行设置。我看到的所有示例都在SPLIT DATA函数之前。这是SMOTE的正确用法吗?
以下是Microsoft的示例: https://imaginemedia.blob.core.windows.net/content/Lab%20PDF%20-%20Churn%20Prevention%20and%20Intervention-db9732e3e8c6.pdf