使用R比较两个CSV文件中元素的频率

时间:2018-08-08 10:43:50

标签: r csv data-analysis frequency-analysis

我有两个CSV文件A和B,它们各自的元素由一个单词和一个相关的频率组成。这两个CSV文件的格式均为:

__word__|_freq|__
blah    | 423 | 
bleh    |554  |
...       ...

我必须计算两个CSV文件中一个单词可能出现的频率,并这样写单词,A中的频率和B中的频率:

__word__|_freq_A|_freqB_
blah    | 423   | 552
bleh    |554    | 773
more    |       | 123
...       ...     ...

到目前为止,我的幼稚解决方案是修复文件A中的元素并遍历文件B,检查文件A中是否存在该单词,并将相应的频率值写入输出CSV文件C。这效率极低,并且想要知道如何提高效率

0 个答案:

没有答案