Question

这似乎是一个简单的问题，但我一直在努力处理它，但却找不到任何答案。我有一个CSV文件，包含1000个不同足球队的数据。我还有一个CSV文件，其中包含100个足球队的名字，我需要从第一个文件中提取数据。但是，我似乎找不到从较大的数据集中提取100个足球队的行并将其放入新数据框的方法。我尝试使用for循环并查看第一个文件中团队的名称= =第二个团队的名称，但我一直得到“级别不匹配”错误。

第一个数据文件遵循以下格式：

球队名称：___________进球得分_________Goals承认......................

第二个数据文件遵循以下格式：

团队名称：

...

Answer 1

你应该可以做这样的事情。在您提供数据样本之前（请阅读how to ask a good question上的指南，我只是假设列的名称是这样的：

dataset1 <- data.frame( teams = c( "team1", "team2", "team3" ) )
dataset2 <- data.frame( teams = c( "team2", "team1", "team3" ), goals = c( 4, 1, 2 ) )

然后你可以在数据集1中创建一个新列时执行匹配功能，如下所示：

dataset1$goals <- dataset2$goals[ match( dataset1$teams, dataset2$teams ) ]

使用包含所需行的数据框从较大的数据框中提取特定行

1 个答案: