我在哪里可以找到PDFMiner API定义?

时间:2017-08-10 08:27:51

标签: python pdfminer

API的{​​{1}}定义是否合适?

例如,我可以从源代码中看到LTText包含Python PDFMiner package和一些文本,并且有一个x0, y0, x1, y1方法返回文本 - 但是打算直接访问x0 ... ?

在哪种情况下,为什么要使用_text和get_text()

包装文本

1 个答案:

答案 0 :(得分:0)

该项目没有大量记录,因此您必须自己解决这个问题。但是,some documentation的形式是对主要类别和结构的基本解释。

对于您的具体问题,LTText的功能类似于抽象基类。从LTText继承的某些对象会覆盖get_text方法并执行更复杂的操作,例如LTTextContainer

class LTTextContainer(LTExpandableContainer, LTText):
    def __init__(self):
        LTText.__init__(self)
        LTExpandableContainer.__init__(self)
        return

    def get_text(self):
        return ''.join(obj.get_text() for obj in self if isinstance(obj, LTText))

通常,getter和setter方法包含的功能可能有助于在子类中重写或更新依赖于输入的状态。例如,除了self.bbox之外,LTComponent.set_bbox还会更新其他六个属性。