将一栏中的网址与另一数据框栏中的网址进行匹配

时间:2019-02-18 01:14:41

标签: r

我在R中有两个数据帧-可以将它们称为dataframeA和dataframeB。两者都有一个URL列,其中包含URL。对于URLa和URLb的每一行,我希望能够比较URLa和比较URLb。如果URLa和URLb匹配,则用数据帧B中的其他列填充第三列。我已经在下面的代码中转换了数据,但是我坚持如何匹配URL,然后编写一个for循环以遍历数据之间的每个URL并打印列。我从grep函数开始吗?任何帮助将不胜感激。

require(dplyr)
require(xlsx)

# READ IN EXCEL FILES AND CONVERT TO stringsasfactors
levelsURL <- read.xlsx("xxxx", sheetName="metrics", col.names=TRUE, 
                       stringasfactors = TRUE)
connectsURL <- read.xlsx("xxxx", sheetName="Sheet1", col.names=TRUE, 
                         stringasfactors = TRUE)

# SUBSET 'INSIDE STORY' FROM DATA ($LEVELSURL)

levelsURLbase <- data.frame(levelsURL$URL,levelsURL$Level.2, levelsURL$Level.3)
insidestory <- subset(levelsURLbase, levelsURL.Level.3 == "Inside Story")

for (url in 1:length(insidestory$levelsURL.URL)) {
  grep(,levelsURLbase$levelsURL.URL)
}

我希望在我的最终数据框中获得以下各列。如果是URLa和URLb,它将填充“命中”列。该列在“ URLb”列中。

URLa   URLb   Hits

0 个答案:

没有答案