我的调查数据集中,受访者按某些人口统计数据值进行了分类。数据的布局基本上是这样的:
Parent.prototype
我用它来生成上面的例子。我当然愿意评论如何做得更好。
Gender Age Income Region
1 Male 1 2 West
2 Male 4 2 South
3 Male 4 3 West
4 Female 4 1 Northeast
5 Female 5 2 West
6 Female 3 2 West
7 Male 1 1 South
8 Male 3 3 Northeast
9 Female 2 3 West
10 Female 4 3 Midwest
我需要将该数据集分解为每个代表原始集合的子集。这将包括每个子集具有相同百分比的性别,年龄组,收入组和地区。我理解,对于那么多因素和少量行,确切的表示可能很难。
我的问题还有第二部分。 R有许多内置函数,可以明确地描述这样的问题。我们在讨论一般数据时可以互换使用的分割,数据,因素,值,子集和单词,但在输入Google或Stack Overflow时却没有完全正确的答案。我想知道我是否应该用更精确的技术来描述我的问题。