Python3:将PDF下载到内存并将第一页转换为图像

时间:2018-06-08 15:41:19

标签: python-3.x image pdf download

我尝试执行以下操作:

  • 将PDF文件下载到内存
  • 将第一页转换为图像
  • 使用带有tweepy的图像

我尝试了以下代码,但遇到了错误。

from PIL import Image
from pdf2image import convert_from_path
from urllib.request import urlopen
from io import StringIO, BytesIO

url = 'http://somedomain.com/assets/applets/internet.pdf'
scrape = urlopen(url) # for external files
pdfFile = BytesIO(scrape.read())
pdfFile.seek(0)
pages = convert_from_path(pdfFile,last_page=1, dpi=100)

for page in pages:
    page.save('/home/out.jpg', 'JPEG')

这是错误:

TypeError: Can't convert '_io.BytesIO' object to str implicitly

生成的图像稍后应该用于通过tweepy将其上传到twitter。我不需要将它存储到磁盘上,这就是我尝试在内存中完成所有操作的原因。 有人可以帮我吗?

0 个答案:

没有答案