注意:此问题已经过编辑以反映新信息,包括曾经是“如何使用Python Boto库在Amazon S3中存储PDF”的标题。
我正在尝试使用urlfetch
保存PDF文件(如果将网址放入浏览器,则会提示“另存为”对话框),但存在某种编码问题。
urlfetch结果中显示了许多未知字符,如:
urlfetch.fetch(url).text
结果如下:s�*��E����
而实际文件中的相同内容如下所示:sÀ*ÿ<81>E®<80>Ùæ
所以这可能是某种编码问题,但我不确定如何修复它。我正在使用的urlfetch版本是1.0
对于它的价值,我一直在测试的PDF是:http://www.revenue.ie/en/tax/it/forms/med1.pdf
答案 0 :(得分:0)
我切换到urllib而不是urlfetch,例如
import urllib
result = urllib.urlopen(url)
......一切似乎都很好。