我有两个数据框,我希望将一个内容与其他内容匹配,为此我使用以下函数:
t <- read.csv("F:/M.Tech/Semester4/Thesis/Code/Book1.csv")
s <- read.csv("F:/M.Tech/Semester4/Thesis/Code/a4.csv")
x <- nrow(s)
y <- nrow(t)
for(i in 1:x)
for(j in 1:y)
ifelse (match(s[i,2], t[j,1]), s[i,9] <- t[j,2] , s[i,9] <- 0)
对于此代码,当内容匹配时,它工作正常。但是其他部分返回NA。如何将0分配给没有匹配的所有地方。 我得到的结果为:
# word count word tf score word robability log values TFxIDF score Keyword Probability
# yemen 380 yemen 1 0.053938964 2.919902172 2.919902172 NA
# strikes 116 strikes 0.305263158 0.016465578 4.106483233 1.25355804 0.5
# deadly 105 deadly 0.276315789 0.014904187 4.206113074 1.162215455 0.7
# new 88 new 0.231578947 0.012491128 4.38273661 1.014949531 NA
而不是NA
。我想在那里存储0。
答案 0 :(得分:4)
问题1: ifelse
会返回两个值中的一个,具体取决于测试条件。它不是基于条件执行代码片段或代码片段2的流控制功能。
这是对的:
my_var <- ifelse(thing_to_test, value_if_true, value_if_false)
这是错误的,在R
中没有意义ifelse(thing_to_test, my_var <- value_if_true, my_var <- value_if_false)
问题2:确保thing_to_test
是一个逻辑表达式。
把这些东西放在一起,你可以看到你应该按照Richard Scriven留下的指示作为上面的评论