Question

我希望随着时间的推移跟踪文本文件中的字符串（读取它们）。什么是以编程方式跟踪的最佳方法？这是3个条目后的最终结果。

String|frequency|date-Col1|date-Col2|..date-Col N|
==================================================
hello | 2       | 1/1/16  | 3/5/16  |
motto | 1       | 2/3/16

我正在努力的一些想法：使用python词典，java arrayLists，R？

有任何建议，谢谢？

Answer 1

from collections import defaultdict

words_seen = defaultdict(list)

for word,filedate in get_words():
    words_seen[word].append(filedate)

然后频率为len(words_seen[word])。

字符串趋势分析（数据结构建议）

1 个答案: