获取带有beautifulsoup的div中的儿童文本

时间:2014-01-02 18:55:04

标签: python html beautifulsoup urllib2

您好,我想要在Google Play商店中对应用程序进行描述。 (https://play.google.com/store/apps/details?id=com.wetter.androidclient&hl=de

import urllib2
from bs4 import BeautifulSoup

soup = BeautifulSoup(urllib2.urlopen("https://play.google.com/store/apps/details?id=com.wetter.androidclient&hl=de"))
result = soup.find_all("div", {"class":"show-more-content text-body"})

使用此代码,我将获得此课程的全部内容。但我不能只获得其中的文字。我用next_silbing或.text尝试了很多东西,但它总是抛出错误(ResultSet没有属性xxx)。

我只想得到这样的文字:" Die Android App von wetter.com! Sie erhalten:..:"

任何人都可以帮助我?

1 个答案:

答案 0 :(得分:18)

在元素上使用.text属性;你有列表的结果,所以循环:

for res in result:
    print res.text

或者,如果只有一个这样<div>,请使用.find()代替.find_all()

result = soup.find("div", {"class":"show-more-content text-body"})
print result.text