我在R中有两个数据帧-可以将它们称为dataframeA和dataframeB。两者都有一个URL列,其中包含URL。对于URLa和URLb的每一行,我希望能够比较URLa和比较URLb。如果URLa和URLb匹配,则用数据帧B中的其他列填充第三列。我已经在下面的代码中转换了数据,但是我坚持如何匹配URL,然后编写一个for循环以遍历数据之间的每个URL并打印列。我从grep函数开始吗?任何帮助将不胜感激。
require(dplyr)
require(xlsx)
# READ IN EXCEL FILES AND CONVERT TO stringsasfactors
levelsURL <- read.xlsx("xxxx", sheetName="metrics", col.names=TRUE,
stringasfactors = TRUE)
connectsURL <- read.xlsx("xxxx", sheetName="Sheet1", col.names=TRUE,
stringasfactors = TRUE)
# SUBSET 'INSIDE STORY' FROM DATA ($LEVELSURL)
levelsURLbase <- data.frame(levelsURL$URL,levelsURL$Level.2, levelsURL$Level.3)
insidestory <- subset(levelsURLbase, levelsURL.Level.3 == "Inside Story")
for (url in 1:length(insidestory$levelsURL.URL)) {
grep(,levelsURLbase$levelsURL.URL)
}
我希望在我的最终数据框中获得以下各列。如果是URLa和URLb,它将填充“命中”列。该列在“ URLb”列中。
URLa URLb Hits