Question

我编写了一个代码，以从首页中抓取所有h4个元素。

// Wikipedia is only an example.
browser.get("https://en.wikipedia.org/wiki/Main_Page")
time.sleep(5)
datei = open("bayern.csv", "a")
elems = browser.find_elements_by_css_selector("h4.name")
for elem in elems:
    print(elem)

在命令行中，我得到以下输出：

<selenium.webdriver.remote.webelement.WebElement (session="f1ef1ee5904aa8b3279e6bf9adb62d34", element="0.09001580038742651-1") >

但是我想要所有h4元素的内容。你能告诉我为什么我得到这个奇怪的输出吗？

Answer 1

您正在尝试打印Web元素本身，而不是其中包含的文本。

尝试：

elems = browser.find_elements_by_css_selector("h4.name")
for elem in elems:
    print(elem.text)

Answer 2

为方便起见，webdriver有一个find_elements_by_tag_name方法：

elems = browser.find_elements_by_tag_name('h4')
for elem in elems:
    print(elem.text)

如何使用Python + Selenium从主页获取所有h4元素

2 个答案: