尝试使自己成为一个用于解析多行文本文件的脚本。对于我的生活,我无法弄清楚为什么它一直给我IndexOutofRange
,但如果我打印我的列表的内容它正确显示,当我删除或注释打印,或尝试进一步在将项目附加到列表后进行处理,我得到了同样的错误。
源文本文件有一堆行,每行数据用逗号分隔,如下所示:abc,123456,abcd,efgh
我正在尝试从字符串中删除除编号部分之外的所有内容,然后将“substring”添加到然后将列表写入输出文件。我确定我写作的方式可能不是很有效,所以请你认为合适。
import sys
fname = sys.argv[1]
list = []
output = "output.txt"
with open(fname) as f:
content = f.readlines()
for line in content:
line = line.split(',')
list.append(line[1])
with open(output, w) as w:
w.write(list)
指数超出list.append(line[1])
部分的范围点击次数。
答案 0 :(得分:2)
您的文件很可能在开头或结尾包含一个空行,不包含逗号或任何其他类型的文本。
尝试检测空行并跳过它们。
import sys
fname = sys.argv[1]
list = []
output = "output.txt"
with open(fname) as f:
content = f.readlines()
for line in content:
if line:
line = line.split(',')
list.append(line[1])
with open(output, w) as w:
w.write(list)
答案 1 :(得分:1)
您可以使用上面的代码找到有问题的行,它会为您打印有问题的行。
import sys
fname = sys.argv[1]
list = []
output = "output.txt"
with open(fname) as f:
content = f.readlines()
for line in content:
if line:
line = line.split(',')
try:
list.append(line[1])
except Exception, ex:
print "problem with line", line
with open(output, w) as w:
w.write(list)