字符串趋势分析(数据结构建议)

时间:2016-01-03 02:08:55

标签: python r database string data-structures

我希望随着时间的推移跟踪文本文件中的字符串(读取它们)。什么是以编程方式跟踪的最佳方法?这是3个条目后的最终结果。

String|frequency|date-Col1|date-Col2|..date-Col N|
==================================================
hello | 2       | 1/1/16  | 3/5/16  |
motto | 1       | 2/3/16

我正在努力的一些想法:使用python词典,java arrayLists,R?

有任何建议,谢谢?

1 个答案:

答案 0 :(得分:0)

from collections import defaultdict

words_seen = defaultdict(list)

for word,filedate in get_words():
    words_seen[word].append(filedate)

然后频率为len(words_seen[word])