如何阅读PDF中的文本

时间:2017-01-17 17:09:36

标签: python selenium pdf

我正在尝试学习如何使用Selenium的IE驱动程序读取PDF中的文本。我收到了selenium.common.exceptions.NoSuchElementException:消息:无法找到带有css选择器的元素== body

from selenium import webdriver
import time

TO_url = "Y:\Work\Work\PFCToolbox\exampleTO\HT072663_001.pdf"
vpc_url = "http://dspgot03.vcc.ford.com/apps/vpc/vpc.nsf/"
driver = webdriver.Ie()
driver.get(TO_url)
element = driver.find_element_by_css_selector("body")
time.sleep(10)

我也尝试过使用其他driver.find_element_by函数,但找不到有效的函数

1 个答案:

答案 0 :(得分:0)

不要找到body元素,而是尝试发送密钥以获取文本:

driver.send_keys(Keys.CONTROL, 'a')
driver.send_keys(Keys.CONTROL, 'c')

然后从剪贴板粘贴它。