标签: statistics data-analysis
我有一个非常大的数据集,其维度由(203,000 x 150)给出,其中一些列(属性)具有非常多的缺失值,用NA表示。我需要从中采样一个较小的数据集,以便我可以在我的计算机上运行测试。 关于如何做到这一点的任何建议? 我是这个领域的新手,因此没有太多的专业知识。
谢谢,