我有以下程序,其中我试图将文本文件转换为字符unigram(特征向量)并将输出写入文本文件。
我正在控制台上打印输出,并同时将其写入文本文件,但是,打印到控制台将打印所有记录,而打印到文件仅打印文章中文件名的最后一次迭代。
我应该为rawcu使用数组吗?
我的代码:
for fileName in allarticles:
rawcu = [0.0]*95
out=open("CASIS-25fvs_rawcu.txt","w")
fileOpen = open(fileName)
charFrequency = {}
for line in fileOpen:
for letter in line:
if((ord(letter) > 31) and ord(letter) < 127):
rawcu[ord(letter)-32] += 1.0
print rawcu
print >> out, rawcu
答案 0 :(得分:0)
您打开文件是为了覆盖,而不是添加文件。必须是:
open("CASIS-25fvs_rawcu.txt", "a")