使用Python下载的PDF文件无法在acrobat中打开

时间:2012-06-20 15:09:17

标签: python pdf urllib2

我有一个小python脚本,我用来下载一大堆PDF文件进行存档。我遇到的问题是,当我下载文件时,它们在正确的标题下正确显示,但是它们的大小错误,并且无法通过Acrobat打开它们,它失败并显示错误消息Out of memory或{ {1}}或其他一些任意Acrobat错误。在文本编辑器中查看页面的内容看起来有点像PDF文档,我的意思是它通常是不可理解的,但有一些文本和标记片段,包括PDF标识符。

下载文件的代码是:

Insufficient data for an image

如果通过浏览器下载相同的文件,它看起来很好,但在磁盘上也更大。我猜这个问题可能与保存文件时的编码有关吗?

1 个答案:

答案 0 :(得分:4)

您需要将其写为二进制文件,以便:

file_local = open( folder_path + file_id + '.pdf', 'wb' )