为什么用内置int()读取.txt文件中的行的一部分抛出ValueError?

时间:2018-09-26 10:57:06

标签: python python-3.x file type-conversion file-handling

这是从studentNamesfile.txt读取的子例程

def calculate_average():
'''Calculates and displays average mark.'''
test_results_file = open('studentNamesfile.txt', 'r')

total = 0
num_recs = 0
line = ' '
while line != '':
    line = test_results_file.readline()
    # Convert everything after the delimiting pipe character to an integer, and add it to total.
    total += int(line[line.find('|') + 1:])
    num_recs += 1
test_results_file.close()

[{num_recs保存从文件中读取的记录数。]

studentNamesfile.txt的格式如下:

Student 01|10
Student 02|20
Student 03|30

,依此类推。该子例程旨在读取文件中所有学生记录的分数,但是运行时会出现此错误:

Traceback (most recent call last):
  File "python", line 65, in <module>
  File "python", line 42, in calculate_average
ValueError: invalid literal for int() with base 10: ''

这个错误是很明显的,但是我不知道为什么会抛出它。我尝试跟踪line[line.find('|') + 1:]的值,但是Python坚持要求在上一行使用print(line[line.find('|') + 1:]时它具有正确的值(例如10)。怎么了?

更新:我正在考虑line[line.find('|') + 1:]包含换行符的可能性,该换行符破坏了int()。但是使用line[line.find('|') + 1:line.find('\\')]不能解决问题-会抛出相同的错误。

3 个答案:

答案 0 :(得分:1)

因为它不是数字值。因此,如果python无法将其转换为整数,则会抛出ValueError。您可以在下面的代码中进行检查。

def calculate_average():
  test_results_file = open('studentNamesfile.txt', 'r')
  total = 0
  num_recs = 0
  for line in test_results_file.readlines():
    try:
        total += int(line[line.find('|') + 1:])
        num_recs += 1
    except ValueError:
        print("Invalid Data: ", line[line.find('|') + 1:])
  test_results_file.close()
  print("total:", total)
  print("num_recs:", num_recs)
  print("Average:", float(total)/num_recs)

readlines vs readline

from io import StringIO
s = 'hello\n hi\n how are you\n'
f = StringIO(unicode(s))
l = f.readlines()
print(l)
# OUTPUT: [u'hello\n', u' hi\n', u' how are you\n']

f = StringIO(unicode(s)) 
l1 = f.readline()
# u'hello\n'
l2 = f.readline()
# u' hi\n'
l3 = f.readline()
# u' how are you\n'
l4 = f.readline()
# u''
l5 = f.readline()
# u''

阅读行

如果我们使用readlines,它将返回一个基于\n字符的列表。

readline

从上面的代码中我们可以看到stringIO中只有3行,但是当我们访问readline时,它将始终为我们提供一个空字符串。因此,在您的代码中,您将其转换为整数,因为您遇到了ValueError异常。

答案 1 :(得分:1)

这里:

while line != '':
    line = test_results_file.readline()

当您点击文件末尾时,.readline()返回一个空字符串,但是由于在while line != ''测试之后 之后发生,您仍然尝试处理此行。

逐行遍历文件的规范(且更加简单)的方法(即遍历文件)可以避免此问题:

for line in test_result_file:
    do_something_with(line)

如果您想摆脱结尾的换行符(您的代码就是这种情况),则只需要在.rstrip()上调用line即可。

此外,无论发生什么情况,您都要确保文件已正确关闭。规范的方法是使用open()作为上下文管理器:

with open("path/to/file.txt") as f:
    for line in test_result_file:
        do_something_with(line)

这会在退出f.close()块时调用with,但已退出(无论for循环刚刚结束还是发生了异常)。

此外,您无需拆分复杂的计算即可找到位于管道后的零件,而只需拆分字符串即可:

for line in test_results_file:
    total = int(line.strip().split("|")[1])
     num_recs += 1

最后,您可以使用stdlib的csv模块来解析文件,而无需手动执行...

答案 2 :(得分:0)

更简单的方法。

演示:

total = 0
num_recs = 0

with open(filename) as infile:                            #Read File
    for line in infile:                                   #Iterate Each line
        if "|" in line:                                   #Check if | in line
            total += int(line.strip().split("|")[-1])     #Extract value and sum
            num_recs += 1
print(total, num_recs)