我对获取段落标记的内容感到有点困惑。
list = soup.find_all("div","SomeID")
我此时已达到
import urllib
from bs4 import BeautifulSoup
html = urllib.urlopen('http://www.dawn.com/news/1267272/democracys-woes').read()
soup = BeautifulSoup(html, 'html.parser')
list = soup.find_all("div","comment__body cf")
print list
但如何获得段落内容。(多么有声音!)
基本问题是从
获取所有段落标记的内容public final Class MoneyI implements Money {
public MoneyI(int a, Currency b) {
}
public MoneyI(int a, String b) {
this(a, Currency.getInstance(b.equals("A") ? "B" : b));
b = b.equals("A") ? "B" : b;
}
}
答案 0 :(得分:1)
您可以使用CSS selector实际执行此操作:
for p in soup.select("div.SomeID > p"):
print(p.get_text(strip=True))
或者,如果您需要一个p
元素:
soup.select_one("div.SomeID > p").get_text(strip=True)
请注意,此处>
表示直接的父子关系。