使用Selenium和Python从li元素的嵌套属性中提取文本

时间:2018-02-19 11:32:18

标签: python selenium web-scraping

我应该如何使用Python Selenium访问嵌套在11'li'标签下的'strong'和'span'标签中的文字?

我希望以dict格式存储输出: {“姓名”:姓名, 地址:第250/1号,第16和第17交叉..., 州:卡纳塔克邦, 城市:班加罗尔}

这是HTML:

enter image description here

这是我的代码:

for elem in wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR,"[id^='arrowex']"))):
    NGO_element = driver.find_element_by_class_name("faq-sub-content exempted-result")
    NGO_name = (driver.find_element_by_class_name("fc-blue fquph")).text.replace(NGO_name_pancard.text, '')
    NGO_name_pancard = driver.find_element_by_class_name("pan-id")
    ul = driver.find_element_by_class_name("exempted-detail")
    for item in (ul.find_elements_by_tag_name("li")):

1 个答案:

答案 0 :(得分:0)

尝试以下代码,将每个strong的{​​{1}}和span个节点的值作为键值对:

li

数据输出应该看起来像data = {} for item in (ul.find_elements_by_tag_name("li")): data[item.find_element_by_tag_name('strong').text] = item.find_element_by_tag_name('span').text