这将使用class =“title”获取最后一个div的内容:
soup = BeautifulSoup(html)
title = soup.find_all('div', {'class' : 'title' })[-1].contents
当我print(title)
输出时:
[u'Harry Potter']
我怎样才能打印出来:
Harry Potter
我尝试了print(str(title))
,但这并未改变任何内容。
答案 0 :(得分:2)
如果您想转换unicode而不是像@alecxe那样获取字符串对象,那么您必须对其进行编码。
print(title.encode('utf-8'))
应该有效。如果您仍然使用方括号,请执行print(title[0].encode('utf-8'))
答案 1 :(得分:1)
使用get_text()
获取文字:
title = soup.find_all('div', {'class' : 'title' })[-1].get_text()