使用python nltk将格式化和有序的字频写入txt文件

时间:2016-02-23 19:37:55

标签: python for-loop nltk

我正在创建文档的单词频率(使用nltk)并且我想将其编写为格式良好的txt文件供以后使用。

写它可以按照我想要的方式工作(即它将两个制表符分隔列写入一个文本文件,其中的行代表一对令牌和频率:

key是一个字符串,freq_table_raw[key]是相应的整数频率。

savedir = open('freq_table_python.txt', 'wb')
for key in freq_keys:
  savedir.write('%s\t%d' % (key, freq_table_raw[key]) + '\n')
savedir.close()

我必须处理与之斗争的事情:

(1)我想在我的脚本中将同一个表存储为变量?我尝试创建变量freq_out = {}并调整循环:

for key, i in freq_keys:
  freq_out[i] = (key, freq_table_raw[key])
  savedir.write('%s\t%d' % (key, freq_table_raw[key]) + '\n')

这给了我ValueError: too many values to unpack

(2)这就是我想做的原因(1):我想按排序顺序编写这个(最高频率在顶部)。

我该怎么做?

1 个答案:

答案 0 :(得分:1)

尝试使用itemgetter()和freq_table_raw.items()

echo '"'hola'"'