我有两个CSV文件A和B,它们各自的元素由一个单词和一个相关的频率组成。这两个CSV文件的格式均为:
__word__|_freq|__
blah | 423 |
bleh |554 |
... ...
我必须计算两个CSV文件中一个单词可能出现的频率,并这样写单词,A中的频率和B中的频率:
__word__|_freq_A|_freqB_
blah | 423 | 552
bleh |554 | 773
more | | 123
... ... ...
到目前为止,我的幼稚解决方案是修复文件A中的元素并遍历文件B,检查文件A中是否存在该单词,并将相应的频率值写入输出CSV文件C。这效率极低,并且想要知道如何提高效率