我正在创建一个应该以url形式输入的应用程序(这里是一个PDF文件)并将其识别为PDF,然后将其上传到我在服务器上的tmp文件夹。
我完全不知道如何继续这样做。我已经创建了一个包含FileField的表单,该表单可以很好地工作,但是当涉及到url时,我没有任何线索。
感谢您的所有答案,并对缺乏英语技能感到抱歉。
答案 0 :(得分:0)
pdf文件的前4个字节为%PDF
,因此您只需从该网址下载前4个字节并将其与%PDF
进行比较。如果匹配,则下载整个文件。
示例:
import urllib2
url = 'your_url'
req = urllib2.urlopen(url)
first_four_bytes = req.read(4)
if first_four_bytes == '%PDF':
pdf_content = urllib2.urlopen(url).read()
# save to temp folder
else:
# file is not PDF