我想尝试在数据集中使用支持向量机(SVM)。我使用的数据集极度不平衡,并警告我SVM在极度不平衡的数据上表现不佳。
table(df4$Price)
0 1
100020 1249
因此,我使用不同的技术(例如过采样欠采样和ROSE)来平衡数据集。
data.rose <- ROSE(Price~., data=df4, seed=3, N = 200040)$data
table(data.rose$Price)
0 1
99960 100080
data.balanced.over <- ovun.sample(Price ~ ., data = df4, method = "over",N = 200040)$data
table(data.balanced.over$Price)
0 1
100020 100020
我想知道如何在平衡的数据集上应用svm?