我刚在我的机器上安装了pdfquery,我正试图从他们的网站上运行这个例子
import pdfquery
pdf = pdfquery.PDFQuery("examples/sample.pdf")
pdf.load()
label = pdf.pq(':contains("Your first name and initial")')
left_corner = float(label.attr('x0'))
bottom_corner = float(label.attr('y0'))
name = pdf.pq(':in_bbox("%s, %s, %s, %s")' % (left_corner, bottom_corner-30, left_corner+150, bottom_corner)).text()
print name
问题是我收到此错误
Traceback (most recent call last):
File "testePdfQuery.py", line 1, in <module>
import pdfquery
File "/home/ubuntu/Downloads/pdfquery-0.1.3/pdfquery/__init__.py", line 1, in <module>
from .pdfquery import PDFQuery
File "/home/ubuntu/Downloads/pdfquery-0.1.3/pdfquery/pdfquery.py", line 23, in <module>
cssselect.Function._xpath_in_bbox = _xpath_in_bbox
AttributeError: 'module' object has no attribute 'Function'
任何想法如何解决这个问题并运行示例?提前致谢。
答案 0 :(得分:2)
这是因为不支持lxml版本。
执行以下操作:
1. pip uninstall pdfquery
2. pip install -e git+https://github.com/jcushman/pdfquery.git#egg=pdfquery
这应该可以解决问题。 有关此问题的更多详细信息,请参阅:https://github.com/jcushman/pdfquery/issues/6