我的问题建立在将字符串与多个模式匹配的主题上。讨论here的一个解决方案是使用sapply(keywords, grepl, strings, ignore.case=TRUE)
,它产生一个二维矩阵。
然而,当我将此方法应用于5K +关键字和60K +字符串时,我遇到了很大的速度问题..(我在12小时后取消了这个过程)。
一个想法是在R中使用哈希表或环境。但是,我不知道如何在保持数字索引的同时将我的字符串“转换/转换”到环境中?
我有strings[1]
...直到strings[60000]
e <- new.env(hash=TRUE)
for (i in 1:length(strings)) {
assign(x=i, value=strings, envir=e)
}
由于x
中的assign
必须是一个角色,我不能像这样使用它,但我希望你能得到我的想法......我希望能够用同样的方式索引环境我的string[...]
向量
感谢您的帮助!