应用错误收集

因此，我正在写论文，并且在使用NLTK进行意大利文本挖掘时遇到了一些问题。从2008年开始，我收到了400篇关于意大利银行业危机的报纸文章，在整理完这些文章之后，我想建立一个临时的双重输入表，（希望）显示报纸如何改变了危机的呈现方式（频率表最常用的有意义的单词）

我的主要问题是：

如何记录时间？我有一个很大的txt文件，其中包含所有内容，但是像这样，我不知道如何将一组文章“分配”到给定的期间，然后使用这些值。

有没有人用过意大利语单词？