Question

我的调查数据集中，受访者按某些人口统计数据值进行了分类。数据的布局基本上是这样的：

Parent.prototype

我用它来生成上面的例子。我当然愿意评论如何做得更好。

      Gender   Age    Income    Region
1     Male     1      2         West
2     Male     4      2         South
3     Male     4      3         West
4     Female   4      1         Northeast
5     Female   5      2         West
6     Female   3      2         West
7     Male     1      1         South
8     Male     3      3         Northeast
9     Female   2      3         West
10    Female   4      3         Midwest

我需要将该数据集分解为每个代表原始集合的子集。这将包括每个子集具有相同百分比的性别，年龄组，收入组和地区。我理解，对于那么多因素和少量行，确切的表示可能很难。

我的问题还有第二部分。 R有许多内置函数，可以明确地描述这样的问题。我们在讨论一般数据时可以互换使用的分割，数据，因素，值，子集和单词，但在输入Google或Stack Overflow时却没有完全正确的答案。我想知道我是否应该用更精确的技术来描述我的问题。

R根据值将数据拆分为代表性子集

0 个答案: