当我尝试解压缩Wikipedia转储以使用其.xml文件时,出现此错误。我该怎么解决?
filepath='/Data/nlp/ESA/Wiki-ESA-master'
file_name='enwiki-latest-pages-articles.xml.bz2'
zipfile = bz2.BZ2File(file_name) # open the file
DEFAULT_FILENAME = zipfile.read() # get the decompressed data
错误:
EOFError: compressed file ended before the logical end-of-stream was detected
答案 0 :(得分:0)
如错误所示,下载过程很可能过早结束,并且文件已被截断。尝试再次下载。
另一个原因可能是磁盘上的数据已损坏。再次下载可能对此也有帮助。