R中字符列表中模式的位置

时间:2018-01-28 15:50:52

标签: r regex pattern-matching

我想要做的是在字符列表中搜索特定模式并返回位置,以便我可以在以后将其排除。

我的数据是一个文字,其中每个单词都附有一个词性标记,格式为:

test
$text
[1] "This/DT is/VBZ a/DT short/JJ sentence/NN ,/, to/TO test/VB if/IN everything/NN is/VBZ working/VBG ./."
$POStags
 [1] "DT"  "VBZ" "DT"  "JJ"  "NN"  "$,"   "TO"  "VB"  "IN"  "NN"  "VBZ"
[12] "VBG" "$."  

我想过滤所有“$”的出现。和“$”。我尝试了以下内容:

grep("$.", test$POStags, value = TRUE)

返回character(0)

我是R的新手并且觉得应该有一个简单的解决方案,但不知何故我无法让它工作......提前感谢您的帮助!

2 个答案:

答案 0 :(得分:1)

这个怎么样

which(grepl("$.",test$POStags,fixed = T) | grepl("$,",test$POStags,fixed = T))

答案 1 :(得分:1)

grep("\\$(\\.|,)", test$POStags)
[1]  6 13