使用Selenium Python从网站中仅提取所需的详细信息

时间:2017-07-05 18:20:30

标签: python selenium-webdriver

我正在尝试在搜索栏中自动搜索产品“打印机”,并仅检索名为EPSON的公司产品的MFR编号。但是我得到的输出超出了我的想要!这是该课程的完整内容。

这是我的代码

from selenium import webdriver
driver = webdriver.Chrome( "C:\All\chromedriver_win32\chromedriver.exe" )
driver.get('https://shop.techdata.com/searchall?b=1&kw=printer')
items = driver.find_elements_by_class_name( 'productResult' )

for i, item in enumerate(items):
    if 'EPSON' in item.text:
       print(i, item.text)

预期输出

3 

C11CF75201

我得到的此代码的(不需要的)输出示例如下所示:

3 EPSON WORKFORCE PRO WF-4740 - MULTIFUNCTION PRINTER (COLOR)
Multifunction printer - color - ink-jet - Legal (8.5 in x 14 in) (original)  
 A4/Legal (media) - up to 22 ppm (copying) - up to 24 ppm (printing) - 500 
 sheets 
- 33.6 Kbps - USB 2.0, LAN, Wi-Fi(n), USB host, NFC

TD#: 12710297

MFR#: C11CF75201

Status: Active

MSRP:
$299.99

1 个答案:

答案 0 :(得分:1)

尝试替换

print(i, item.text)

print(i, item.find_element_by_xpath('.//div[@class="productCodes"]/div[2]/span').text)

获取所需的输出