我遇到了问题,我需要每个人的帮助。 我读了rar文件(100mb)并处理文本文件(包含在rarfile中)。
import glob
import os
import UnRAR2
from os import path, access, R_OK
os.chdir("E:\\sms")
for file in glob.glob("*.rar"):
# extract test.txt to memory
entries = UnRAR2.RarFile(file).read_files('*.txt')
test_content = entries[0][1]
#print test_content
for line in test_content.split("\n"):
A=line.split(' ')
print A[1]
结果:
19009057
7030
9119
9119
....
....
bla...bla...
......
9119
9119
9119
7050
9119
Traceback (most recent call last):
File "E:\LAPTRINH\Android\adt-bundle-windows\eclipse\plugins\org.python.pydev_2.7.1.2012100913\pysrc\pydevd.py", line 1397, in <module>
debugger.run(setup['file'], None, None)
File "E:\LAPTRINH\Android\adt-bundle-windows\eclipse\plugins\org.python.pydev_2.7.1.2012100913\pysrc\pydevd.py", line 1090, in run
pydev_imports.execfile(file, globals, locals) #execute the script
File "C:\Users\The\Documents\workspace\unrar\test_unrar.py", line 13, in <module>
print A[1]
IndexError: list index out of range
请帮帮我! 谢谢!!!
答案 0 :(得分:0)
你的一条线(可能是你的最后一条线)不是你期望的格式。在你的内部for循环中执行此操作:
A=line.split(' ')
if len(A) > 1:
print A[1]
答案 1 :(得分:0)
A[1]
,则 \n
会被怀疑。你想重新考虑一下你回信息的方式。
答案 2 :(得分:0)
错误告诉您line
拆分的内容A
没有第二项,这意味着它没有任何剩余要解析的内容,而且你'在文件的末尾。