我想知道如何用漂亮的汤来收集欲望数据这里是代码并试图收集文本数据,这是" RoSharon1977"
我正在尝试使用
<div id="twitter" class="editable-item">
<div id="twitter-view">
<ul><li>
<a href="/redir/redirect?url=http%3A%2F%2Ftwitter%2Ecom%2FRoSharon1977&urlhash=QRJD">RoSharon1977</a>
</li></ul>
</div></div>
答案 0 :(得分:0)
您必须找到builder.RegisterType<RepositoryFactory>().As<IRepositoryFactory>();
div
,然后获取下一个id
元素等,然后继续向下钻取,直至到达ul
元素,然后得到它的文字:
a
或者根据整个网页的外观,你可以做到:
from bs4 import BeautifulSoup
html = '''<div id="twitter" class="editable-item">
<div id="twitter-view">
<ul><li>
<a href="/redir/redirect?url=http%3A%2F%2Ftwitter%2Ecom%2FRoSharon1977&urlhash=QRJD">RoSharon1977</a>
</li></ul>
</div></div>'''
soup = BeautifulSoup(html)
print soup.find('div', attrs={'id': 'twitter-view'}).findNext('ul').findNext('li').findNext('a').text
如果有多个soup = BeautifulSoup(html)
print soup.find('a').text
元素:
a