Python中PytagCloud的混乱,无法解释的输出

时间:2014-04-02 20:20:50

标签: python python-2.7 tag-cloud word-cloud

我正在尝试使用pytagcloud在python中创建标记云,我使用以下代码生成它:

from pytagcloud import create_tag_image, make_tags
from pytagcloud.lang.counter import get_tag_counts

with open("fileName.txt") as file:
  Data1 = file.read().lower()
  Data = Data1.split()

Data = "%s " * len(Data) % tuple(Data)
tags = make_tags(get_tag_counts(Data), maxsize=150)

create_tag_image(tags, 'cloud_large.png', size=(1200, 800))

代码运行没有错误(虽然需要一段时间),但它生成的输出文件非常混乱,不易读取。这是输出文件:

Tag Cloud

为什么我在中心得到这种奇怪的不可读的矩阵式杂波?我怎么能摆脱它? 标签云似乎不在文件的中心,如何做到这一点?

非常感谢任何帮助。

P.S。 - 我正在使用Python 2.7

1 个答案:

答案 0 :(得分:3)

如果仍然相关, 我解决这个问题的方法是为minsize参数添加值并过滤掉所有最小的单词(可能在文本中出现一次)。我想这是因为单词数量的爆炸。

我的代码如下:

tags = make_tags(get_tag_counts(MY_TEXT), maxsize=120, minsize=5)
tags = [a for a in tags if a['size'] > 7]
create_tag_image(tags, 'images/cloud_large.png', size=(900, 600), fontname='Reenie Beanie', background=(0,0,0))

结果: enter image description here

我根据经验选择了这些值。