我使用例如
从网上抓取了一个pdfimport requests
pdf = requests.get("http://www.scala-lang.org/docu/files/ScalaByExample.pdf")
我想修改此代码以显示它
from gi.repository import Poppler, Gtk
def draw(widget, surface):
page.render(surface)
document = Poppler.Document.new_from_file("file:///home/me/some.pdf", None)
page = document.get_page(0)
window = Gtk.Window(title="Hello World")
window.connect("delete-event", Gtk.main_quit)
window.connect("draw", draw)
window.set_app_paintable(True)
window.show_all()
Gtk.main()
如何修改document =
行以使用包含pdf的变量pdf?
(我不介意使用popplerqt4或其他任何东西,如果这样可以更容易。)
答案 0 :(得分:3)
这一切都取决于您使用的操作系统。这些通常可能有所帮助:
import os
os.system('my_pdf.pdf')
或
os.startfile('path_to_pdf.pdf')
或
import webbrowser
webbrowser.open(r'file:///my_pdf.pdf')
答案 1 :(得分:1)
如何使用临时文件?
import tempfile
import urllib
import urlparse
import requests
from gi.repository import Poppler, Gtk
pdf = requests.get("http://www.scala-lang.org/docu/files/ScalaByExample.pdf")
with tempfile.NamedTemporaryFile() as pdf_contents:
pdf_contents.file.write(pdf)
file_url = urlparse.urljoin(
'file:', urllib.pathname2url(pdf_contents.name))
document = Poppler.Document.new_from_file(file_url, None)
答案 2 :(得分:1)
试试这个并告诉我它是否有效:
document = Poppler.Document.new_from_data(str(pdf.content),len(repr(pdf.content)),None)
答案 3 :(得分:1)
如果您想使用acrobat reader打开pdf,那么以下代码应该可以使用
import subprocess
process = subprocess.Popen(['<here path to acrobat.exe>', '/A', 'page=1', '<here path to pdf>'], shell=False, stdout=subprocess.PIPE)
process.wait()
答案 4 :(得分:1)
由于有一个名为pyPdf的库,您应该能够使用它加载PDF文件。 如果您有任何其他问题,请发给我messege。
答案 5 :(得分:1)
2015年8月:在Windows 7中进行全新安装时,问题仍然存在:
Poppler.Document.new_from_data(data, len(data), None)
返回:类型错误:必须是字符串而不是字节。
Poppler.Document.new_from_data(str(data), len(data), None)
返回:PDF文档已损坏(4)。
我无法使用此功能。
我尝试使用NamedTemporayFile而不是磁盘上的文件,但由于未知原因,它会返回未知错误。
所以我使用的是临时文件。不是最漂亮的方式,但它有效。
如果有人有想法,这是Python 3.4的测试代码:
from gi.repository import Poppler
import tempfile, urllib
from urllib.parse import urlparse
from urllib.request import urljoin
testfile = "d:/Mes Documents/en cours/PdfBooklet3/tempfiles/preview.pdf"
document = Poppler.Document.new_from_file("file:///" + testfile, None) # Works fine
page = document.get_page(0)
print(page) # OK
f1 = open(testfile, "rb")
data1 = f1.read()
f1.close()
data2 = "".join(map(chr, data1)) # converts bytes to string
print(len(data1))
document = Poppler.Document.new_from_data(data2, len(data2), None)
page = document.get_page(0) # returns None
print(page)
pdftempfile = tempfile.NamedTemporaryFile()
pdftempfile.write(data1)
file_url = urllib.parse.urljoin('file:', urllib.request.pathname2url(pdftempfile.name))
print( file_url)
pdftempfile.seek(0)
document = Poppler.Document.new_from_file(file_url, None) # unknown error