R - 获得n-gram的频率表

时间:2015-05-23 17:07:01

标签: r frequency n-gram

我想在R中计算ngrams的频率表。

输入是一个包含10个元素的序列,如

ABC A HDA ASD ABC A UZF FJ UZF FJ

使用R包ngrams我已经得到了不同的ngrams(例如n = 2)。但现在我想计算每个ngram的出现次数,在这里我很难挣扎。我开始用grep来搜索原始序列中的每个ngram,但是由于元素数量很多,所以它很慢。

有人知道在R中生成ngrams频率表的更好方法吗?

谢谢!

0 个答案:

没有答案