我正在尝试使用分层采样对全部数据进行降采样。 我正在使用的列是Claim_Num。其分布如下:
claimCounts <- table(full_data$Claim_Num)
claimCounts
0 1 2 10
1322244 6834 36 1
我需要所有具有一个或多个声明的行;但想要从具有0个声明的行中进行采样。另外,对于每一个有索赔的行,我需要10个非索赔行。
我正在使用的代码如下:
sampleRows <- strata(full_data, "Claim_Num", round(claimCounts / c(10,1,1,1)), method="srswor")
但是,它引发了以下错误:
Error in strata(full_data, "Claim_Num", round(claimCounts/c(10, 1, 1, :
not enough obervations in the stratum 2
我不确定为什么吗?谁能帮忙。预先感谢。