我正在尝试使用pytagcloud
在python中创建标记云,我使用以下代码生成它:
from pytagcloud import create_tag_image, make_tags
from pytagcloud.lang.counter import get_tag_counts
with open("fileName.txt") as file:
Data1 = file.read().lower()
Data = Data1.split()
Data = "%s " * len(Data) % tuple(Data)
tags = make_tags(get_tag_counts(Data), maxsize=150)
create_tag_image(tags, 'cloud_large.png', size=(1200, 800))
代码运行没有错误(虽然需要一段时间),但它生成的输出文件非常混乱,不易读取。这是输出文件:
为什么我在中心得到这种奇怪的不可读的矩阵式杂波?我怎么能摆脱它? 标签云似乎不在文件的中心,如何做到这一点?
非常感谢任何帮助。
P.S。 - 我正在使用Python 2.7
答案 0 :(得分:3)
如果仍然相关, 我解决这个问题的方法是为minsize参数添加值并过滤掉所有最小的单词(可能在文本中出现一次)。我想这是因为单词数量的爆炸。
我的代码如下:
tags = make_tags(get_tag_counts(MY_TEXT), maxsize=120, minsize=5)
tags = [a for a in tags if a['size'] > 7]
create_tag_image(tags, 'images/cloud_large.png', size=(900, 600), fontname='Reenie Beanie', background=(0,0,0))
结果:
我根据经验选择了这些值。