R中文本内的单词索引

时间:2014-02-06 12:40:23

标签: r text vector indexing

我在字符向量中有文字,但我无法在字符向量中找到单词的索引,如何在不经过每个单词的情况下有效地提取它,并使用 nchar 添加每个单词的长度的匹配

which("ashish"=="i am ashish and ashish is good")
integer(0)
grep("apple","i am ashish and ashish is good")
integer(0)
grep("apple","It is a apple and apple is tasty")
[1] 1

我希望文本中的“apple”索引为9,19。对于更好的方法有任何建议,谢谢。

1 个答案:

答案 0 :(得分:5)

gregexp是您正在寻找的功能:

gregexpr("apple","It is a apple and apple is tasty")