我试图使用python使用BeautifulSoup收集文本

时间:2015-08-07 12:32:32

标签: python selenium-webdriver beautifulsoup

我想知道如何用漂亮的汤来收集欲望数据这里是代码并试图收集文本数据,这是" RoSharon1977"

我正在尝试使用

<div id="twitter" class="editable-item">
  <div id="twitter-view">
     <ul><li>
        <a href="/redir/redirect?url=http%3A%2F%2Ftwitter%2Ecom%2FRoSharon1977&amp;urlhash=QRJD">RoSharon1977</a>
     </li></ul>
</div></div>

1 个答案:

答案 0 :(得分:0)

您必须找到builder.RegisterType<RepositoryFactory>().As<IRepositoryFactory>(); div,然后获取下一个id元素等,然后继续向下钻取,直至到达ul元素,然后得到它的文字:

a

或者根据整个网页的外观,你可以做到:

from bs4 import BeautifulSoup

html = '''<div id="twitter" class="editable-item">
  <div id="twitter-view">
     <ul><li>
        <a href="/redir/redirect?url=http%3A%2F%2Ftwitter%2Ecom%2FRoSharon1977&amp;urlhash=QRJD">RoSharon1977</a>
     </li></ul>
</div></div>'''

soup = BeautifulSoup(html)

print soup.find('div', attrs={'id': 'twitter-view'}).findNext('ul').findNext('li').findNext('a').text

如果有多个soup = BeautifulSoup(html) print soup.find('a').text 元素:

a