计算Python文本文件中的段落和最频繁的单词

时间:2016-12-08 23:02:19

标签: python file python-3.x for-loop count

我正在尝试计算文本文件中的段落数和最常用的单词(任何文本文件),但是当我运行代码时似乎没有输出,也没有错误。关于我哪里出错的任何提示?

filename = input("enter file name: ")
inf = open(filename, 'r')
#frequent words 
wordcount={}
for word in inf.read().split():
 if word not in wordcount:
    wordcount[word] = 1
else:
    wordcount[word] += 1
for key in wordcount.keys():
    print ("%s %s " %(key , wordcount[key]))

#Count Paragraph(s)
linecount = 0
for i in inf:
   paragraphcount = 0
   if '\n' in i:
      linecount += 1
   if len(i) < 2: paragraphcount *= 0
   elif len(i) > 2: paragraphcount = paragraphcount + 1
   print('%-4d %4d %s' % (paragraphcount, linecount, i))  
inf.close()

2 个答案:

答案 0 :(得分:2)

filename = raw_input("enter file name: ")

wordcount={}
paragraphcount = 0
linecount = 0
with open(filename, 'r') as ftext:

    for line in ftext.readlines():
        if line in ('\n', '\r\n'):
            if linecount == 0:
                paragraphcount = paragraphcount + 1
            linecount = linecount + 1
        else:
            linecount = 0
            #frequent words
            for word in line.split():
                wordcount[word] = wordcount.get(word,0) + 1




print wordcount
print paragraphcount

答案 1 :(得分:1)

当您正在读取文件时,有一个光标指示您当前正在读取的字节。在你的代码中,你试图读取文件两次并遇到一个奇怪的行为,这一直暗示你做错了什么。对于解决方案,

正确的方法是什么?

您应该读取文件一次,存储每一行​​,然后使用同一商店查找字数和段数。而不是试图阅读两次。

当前的代码是什么?

当您第一次读取文件时,您的字节光标设置为文件的末尾,当您尝试读取行时,如果返回空列表,则会尝试读取文件的末尾。您可以通过重置文件指针(光标)来纠正此问题。

在尝试读取行之前调用inf.seek(0)。但不是这样,你应该专注于实现我在第一部分中提到的方法。