我想获取此链接的位置信息:https://en.wikipedia.org/wiki/Alabama_Institute_for_the_Deaf_and_Blind 它位于页面右侧的信息框中。
我尝试了以下内容:
from bs4 import BeautifulSoup
soup = BeautifulSoup(requests.get(site).text)
soup.find(('tr','adr').children
和
soup.find(('tr','adr').children.contents()
和
soup.find(('tr','adr').children.text
无济于事。
答案 0 :(得分:1)
仅打印.text
:
>>> print soup.find('tr', 'adr').text
205 South St E
Talladega, Alabama, United States
您可能想要删除前导和尾随空格:
>>> soup.find('tr', 'adr').text.strip()
u'205 South St E\nTalladega, Alabama, United States'
>>> print soup.find('tr', 'adr').text.strip()
205 South St E
Talladega, Alabama, United States
答案 1 :(得分:0)
for i in soup.find_all('tr'):
print i.text
这是获得所有tr的更好方法。