如何为列中的每个值提取行数?

时间:2015-01-19 09:16:05

标签: excel excel-formula

我有超过30,000条记录的巨大优秀。 其中一列名为" Collection"可能有1000个不同的值。 我想从" Collection"的每个值中取样5条记录。领域。 这将使我们最终获得3千万的记录。 怎么做到这一点?

1 个答案:

答案 0 :(得分:1)

插入带有序号的“A”列,以便能够以相同的顺序重新排序数据[可选]

在每行中插入带有= rand()的“B”列,并根据此列进行排序以随机化顺序[可选]

插入带有C2 = COUNTIF(D $ 2 $:D2,D2)< = 5的“C”列,然后将公式复制到此列中的所有行

假设“D”是包含“Collection”信息的列

请注意,只有COUNTIF中参考单元格中的第一个单元格被$表示为绝对单元格。另一个是相对的,当你复制公式时会改变。这将使公式仅计算其上方具有“Collection”列上相同值的单元格。如果在“D”列中有5个或更少的行具有相同的值但仅计算上面的单元格,则“< =”运算符将输出TRUE。最后使用“自动过滤器”隐藏“C”列具有FALSE值的所有行。其余行是“Collection”列中每个唯一值的5个样本。自行决定复制或使用。欢呼声。