R中的分层抽样误差-第2层中的观测不足

时间:2018-11-27 12:30:53

标签: r sampling downsampling

我正在尝试使用分层采样对全部数据进行降采样。 我正在使用的列是Claim_Num。其分布如下:

claimCounts <- table(full_data$Claim_Num)
claimCounts

  0          1        2       10 
1322244    6834      36       1 

我需要所有具有一个或多个声明的行;但想要从具有0个声明的行中进行采样。另外,对于每一个有索赔的行,我需要10个非索赔行。

我正在使用的代码如下:

sampleRows <- strata(full_data, "Claim_Num", round(claimCounts / c(10,1,1,1)), method="srswor")

但是,它引发了以下错误:

Error in strata(full_data, "Claim_Num", round(claimCounts/c(10, 1, 1,  : 
  not enough obervations in the stratum 2

我不确定为什么吗?谁能帮忙。预先感谢。

0 个答案:

没有答案