使用Python进行文本最小化:NLTK意大利语

时间:2019-02-23 11:04:25

标签: python nltk text-mining

因此,我正在写论文,并且在使用NLTK进行意大利文本挖掘时遇到了一些问题。 从2008年开始,我收到了400篇关于意大利银行业危机的报纸文章,在整理完这些文章之后,我想建立一个临时的双重输入表,(希望)显示报纸如何改变了危机的呈现方式(频率表最常用的有意义的单词)

我的主要问题是:

如何记录时间?我有一个很大的txt文件,其中包含所有内容,但是像这样,我不知道如何将一组文章“分配”到给定的期间,然后使用这些值。

有没有人用过意大利语单词?

0 个答案:

没有答案