如何从没有特定标签的标签中提取文本?

时间:2017-10-09 08:52:59

标签: html python-3.x selenium-webdriver beautifulsoup selenium-chromedriver

我有一个html代码,我必须从中提取文本。如果它在href标签中我可以使用get_attribute(“text”),但是在这个奇怪的代码中,没有标签。

<h2 class="slideable title">
<span content-slot="title" transcluded="49763">Black Diamond Cheese Bars 400-450 g</span>
</h2>

我想要400-450克黑钻奶酪条

我试图获取名称为content-slot的元素,但我无法做到。

2 个答案:

答案 0 :(得分:0)

使用父类选择器然后使用。(点)运算符使用 BeautifulSoup

访问子节点
html.find('div',{'class':'slideable title'}).span.get_text()

答案 1 :(得分:0)

使用getText()方法获取此值,getAttribute()返回属性值

试试这个

WebElement ele= driver.findElement(By.xpath("//span[@transcluded='49763']"));
String s=ele.getText();
System.out.println(s);    

输出:

黑钻芝士酱400-450克