如何使用Python + Selenium从主页获取所有h4元素

时间:2019-04-23 20:17:42

标签: python selenium output

我编写了一个代码,以从首页中抓取所有h4个元素。

// Wikipedia is only an example.
browser.get("https://en.wikipedia.org/wiki/Main_Page")
time.sleep(5)
datei = open("bayern.csv", "a")
elems = browser.find_elements_by_css_selector("h4.name")
for elem in elems:
    print(elem)

在命令行中,我得到以下输出:

<selenium.webdriver.remote.webelement.WebElement (session="f1ef1ee5904aa8b3279e6bf9adb62d34", element="0.09001580038742651-1") >

但是我想要所有h4元素的内容。你能告诉我为什么我得到这个奇怪的输出吗?

2 个答案:

答案 0 :(得分:5)

您正在尝试打印Web元素本身,而不是其中包含的文本。

尝试:

elems = browser.find_elements_by_css_selector("h4.name")
for elem in elems:
    print(elem.text)

答案 1 :(得分:0)

为方便起见,webdriver有一个find_elements_by_tag_name方法:

elems = browser.find_elements_by_tag_name('h4')
for elem in elems:
    print(elem.text)