如何处理大文本数据以创建WordCloud?

时间:2019-04-26 13:33:34

标签: python python-3.x bigdata word-cloud

我拥有创建其文字云所需的大量文本数据。我正在使用一个名为Python的{​​{1}}库来创建可配置的词云。问题是我的文本数据确实很大,因此高端计算机即使长时间也无法完成任务。

首先将数据存储在word_cloud中。由于在将数据读取到MongoDB时遇到Cursor问题,我将整个数据导出到纯文本文件-简单的Python list文件,即txt

所以我要寻找答案的问题是如何处理大量文本数据? 304 MB库需要一个word_cloud参数,该参数包含用String分隔的整个数据,以便创建' '

p.s。 Word Cloud版本:Python

p.s。 3.7.1word_cloud的开源Word Cloud生成器,可在GitHub:https://github.com/amueller/word_cloud

上使用

1 个答案:

答案 0 :(得分:0)

您不需要将所有文件加载到内存中。

zmlocalconfig -e ldap_starttls_supported=0
zmcontrol restart