Question

我有一个html代码，我必须从中提取文本。如果它在href标签中我可以使用get_attribute（“text”），但是在这个奇怪的代码中，没有标签。

<h2 class="slideable title">
<span content-slot="title" transcluded="49763">Black Diamond Cheese Bars 400-450 g</span>
</h2>

我想要400-450克黑钻奶酪条

我试图获取名称为content-slot的元素，但我无法做到。

Answer 1

使用父类选择器然后使用。（点）运算符使用 BeautifulSoup

访问子节点

html.find('div',{'class':'slideable title'}).span.get_text()

Answer 2

使用getText()方法获取此值，getAttribute()返回属性值

试试这个

WebElement ele= driver.findElement(By.xpath("//span[@transcluded='49763']"));
String s=ele.getText();
System.out.println(s);

输出：

黑钻芝士酱400-450克