这似乎是一个简单的问题,但我一直在努力处理它,但却找不到任何答案。我有一个CSV文件,包含1000个不同足球队的数据。我还有一个CSV文件,其中包含100个足球队的名字,我需要从第一个文件中提取数据。但是,我似乎找不到从较大的数据集中提取100个足球队的行并将其放入新数据框的方法。我尝试使用for循环并查看第一个文件中团队的名称= =第二个团队的名称,但我一直得到“级别不匹配”错误。
第一个数据文件遵循以下格式:
球队名称:___________进球得分_________Goals承认......................
第二个数据文件遵循以下格式:
团队名称:
...
答案 0 :(得分:0)
你应该可以做这样的事情。在您提供数据样本之前(请阅读how to ask a good question上的指南,我只是假设列的名称是这样的:
dataset1 <- data.frame( teams = c( "team1", "team2", "team3" ) )
dataset2 <- data.frame( teams = c( "team2", "team1", "team3" ), goals = c( 4, 1, 2 ) )
然后你可以在数据集1中创建一个新列时执行匹配功能,如下所示:
dataset1$goals <- dataset2$goals[ match( dataset1$teams, dataset2$teams ) ]