这是我在一周前发布的问题(getting text from html using beatifulsoup)的扩展。
我想要提取的大多数数据似乎都是data-bind
,而不是存储在'当我使用soup.findAll
时。例如,获取此链接:kaggle/user/results我试图获取用户参与的所有比赛的名称。我使用以下代码:
url = 'https://www.kaggle.com/titericz/results'
sourceCode = requests.get(url)
plainText = sourceCode.text
soup = BeautifulSoup(plainText)
for link in soup.findAll('tr'):
print(link)
所以我参加了第一场比赛,但在link
看来,竞争名称的价值,本次比赛中的位置,总竞争对手等等都在html中缺失。尝试按照上面链接的问题的答案执行相同的过程,但我无法管理它(使用re.compile
和
pattern.search
)。有没有办法通过使用BeatifulSoup
来实现它?我在网上找不到任何类似的问题。