使用包含所需行的数据框从较大的数据框中提取特定行

时间:2016-06-09 00:20:41

标签: r loops dataframe

这似乎是一个简单的问题,但我一直在努力处理它,但却找不到任何答案。我有一个CSV文件,包含1000个不同足球队的数据。我还有一个CSV文件,其中包含100个足球队的名字,我需要从第一个文件中提取数据。但是,我似乎找不到从较大的数据集中提取100个足球队的行并将其放入新数据框的方法。我尝试使用for循环并查看第一个文件中团队的名称= =第二个团队的名称,但我一直得到“级别不匹配”错误。

第一个数据文件遵循以下格式:

球队名称:___________进球得分_________Goals承认......................

第二个数据文件遵循以下格式:

团队名称:

...

1 个答案:

答案 0 :(得分:0)

你应该可以做这样的事情。在您提供数据样本之前(请阅读how to ask a good question上的指南,我只是假设列的名称是这样的:

dataset1 <- data.frame( teams = c( "team1", "team2", "team3" ) )
dataset2 <- data.frame( teams = c( "team2", "team1", "team3" ), goals = c( 4, 1, 2 ) )

然后你可以在数据集1中创建一个新列时执行匹配功能,如下所示:

dataset1$goals <- dataset2$goals[ match( dataset1$teams, dataset2$teams ) ]