尝试运行pdfquery示例时出错

时间:2013-06-07 15:47:25

标签: python

我刚在我的机器上安装了pdfquery,我正试图从他们的网站上运行这个例子

import pdfquery
pdf = pdfquery.PDFQuery("examples/sample.pdf")
pdf.load()
label = pdf.pq(':contains("Your first name and initial")')
left_corner = float(label.attr('x0'))
bottom_corner = float(label.attr('y0'))
name = pdf.pq(':in_bbox("%s, %s, %s, %s")' % (left_corner, bottom_corner-30, left_corner+150, bottom_corner)).text()
print name

问题是我收到此错误

 Traceback (most recent call last):
  File "testePdfQuery.py", line 1, in <module>
    import pdfquery
  File "/home/ubuntu/Downloads/pdfquery-0.1.3/pdfquery/__init__.py", line 1, in <module>
    from .pdfquery import PDFQuery
  File "/home/ubuntu/Downloads/pdfquery-0.1.3/pdfquery/pdfquery.py", line 23, in <module>
    cssselect.Function._xpath_in_bbox = _xpath_in_bbox
AttributeError: 'module' object has no attribute 'Function'

任何想法如何解决这个问题并运行示例?提前致谢。

1 个答案:

答案 0 :(得分:2)

这是因为不支持lxml版本。

执行以下操作:

1. pip uninstall pdfquery
2. pip install -e git+https://github.com/jcushman/pdfquery.git#egg=pdfquery

这应该可以解决问题。 有关此问题的更多详细信息,请参阅:https://github.com/jcushman/pdfquery/issues/6