Python urlfetch返回错误的数据

时间:2014-04-18 09:02:42

标签: python pdf urlfetch

注意:此问题已经过编辑以反映新信息,包括曾经是“如何使用Python Boto库在Amazon S3中存储PDF”的标题。

我正在尝试使用urlfetch保存PDF文件(如果将网址放入浏览器,则会提示“另存为”对话框),但存在某种编码问题。

urlfetch结果中显示了许多未知字符,如:

urlfetch.fetch(url).text

结果如下:s�*��E����
而实际文件中的相同内容如下所示:sÀ*ÿ<81>E®<80>Ùæ

所以这可能是某种编码问题,但我不确定如何修复它。我正在使用的urlfetch版本是1.0

对于它的价值,我一直在测试的PDF是:http://www.revenue.ie/en/tax/it/forms/med1.pdf

1 个答案:

答案 0 :(得分:0)

我切换到urllib而不是urlfetch,例如

import urllib
result = urllib.urlopen(url)

......一切似乎都很好。