标签: python nltk text-mining
因此,我正在写论文,并且在使用NLTK进行意大利文本挖掘时遇到了一些问题。 从2008年开始,我收到了400篇关于意大利银行业危机的报纸文章,在整理完这些文章之后,我想建立一个临时的双重输入表,(希望)显示报纸如何改变了危机的呈现方式(频率表最常用的有意义的单词)
我的主要问题是:
如何记录时间?我有一个很大的txt文件,其中包含所有内容,但是像这样,我不知道如何将一组文章“分配”到给定的期间,然后使用这些值。
有没有人用过意大利语单词?