基于定性和定量信息创建相似的人群/群体

时间:2019-05-20 15:14:21

标签: grouping cluster-analysis knn

我有一个包含以下字段(JSON)的人。假设我有1000个人。我想创建两个相似的(合计)但随机生成的组,每组200个。他们应该有相似的男性和女性。某些年龄段的人数量相似,苹果总数和橙子总数相似。

{
    "id": 1,
    "gender": "M",
    "age": "25 - 34",
    "apples": 20,
    "oranges": 14
}

我考虑过改组人员,然后从组中随机抽取一个人,并将其添加到第一组中。假设我从数组中选择的随机人是上面的人,那么我将尝试寻找一个随机的25-34岁男性,并选择苹果与橘子的均方差最低的人。如果没有人匹配此条件,我将放松条件并选择相同年龄组的女性...并放松条件,直到如果我找不到匹配项,我只是从原始数组中随机抽取一个人

有更好的方法吗?

0 个答案:

没有答案