标签: r frequency n-gram
我想在R中计算ngrams的频率表。
输入是一个包含10个元素的序列,如
ABC A HDA ASD ABC A UZF FJ UZF FJ
使用R包ngrams我已经得到了不同的ngrams(例如n = 2)。但现在我想计算每个ngram的出现次数,在这里我很难挣扎。我开始用grep来搜索原始序列中的每个ngram,但是由于元素数量很多,所以它很慢。
有人知道在R中生成ngrams频率表的更好方法吗?
谢谢!