标签: python-3.x parsing pdf text
我有一个pdf页面,并且我需要解析此页面中的文本。我可以解析此页面上的所有数据(例如使用PyPDF2),但是我不需要所有文本。我只需要有限区域内的文字。使用PyPDF2,我找到了剪切所需区域的方法,但是当我尝试对其进行解析时,文本是相同的(未剪切)。
enter image description here