如果一个观察符合标准,则对观察的每个实例进行分类

时间:2015-05-21 16:03:32

标签: r categorization

我有一个公司创始人及其政治捐款的数据库。许多人多次提供,但每次都以不同方式识别他们的工作。幸运的是,每个人的名字都用固定的数字代码标识。

我希望能够将每个人归类为拥有某项工作,如果数据库中的任何地方他们已经表明他们有某种类型的工作。这是一个可复制的数据框

name <- c("tom", "tom", "tom", "mary", "mary")
id <- c("123", "123", "123", "456", "456")
role <- c("investor", "company", "company", "company", "company")

df1 = data.frame(name, id, role)

如果我想知道一个人是否在数据框中的任何地方都认定自己是投资者,我想象的最终数据框就会是这样:

name <- c("tom", "tom", "tom", "mary", "mary")
id <- c("123", "123", "123", "456", "456")
role <- c("investor", "company", "company", "company", "company")
isinvestor <- c("yes", "yes", "yes", "no", "no")

df1 = data.frame(name, id, role, isinvestor)

我在SO搜索了“条件分组”或“条件分类”等标签。也许这是计算机科学中的常用技术,我错过了这个术语。感谢您的帮助,如果我能让问题更容易回答,请告诉我

0 个答案:

没有答案