R根据值将数据拆分为代表性子集

时间:2015-05-22 17:29:32

标签: r sample

我的调查数据集中,受访者按某些人口统计数据值进行了分类。数据的布局基本上是这样的:

Parent.prototype

我用它来生成上面的例子。我当然愿意评论如何做得更好。

      Gender   Age    Income    Region
1     Male     1      2         West
2     Male     4      2         South
3     Male     4      3         West
4     Female   4      1         Northeast
5     Female   5      2         West
6     Female   3      2         West
7     Male     1      1         South
8     Male     3      3         Northeast
9     Female   2      3         West
10    Female   4      3         Midwest

我需要将该数据集分解为每个代表原始集合的子集。这将包括每个子集具有相同百分比的性别,年龄组,收入组和地区。我理解,对于那么多因素和少量行,确切的表示可能很难。

我的问题还有第二部分。 R有许多内置函数,可以明确地描述这样的问题。我们在讨论一般数据时可以互换使用的分割,数据,因素,值,子集和单词,但在输入Google或Stack Overflow时却没有完全正确的答案。我想知道我是否应该用更精确的技术来描述我的问题。

0 个答案:

没有答案