使用beautifulSoup隔离动态表中的数据

时间:2015-05-14 14:23:00

标签: python beautifulsoup dynamic-tables bs4

我正在尝试从table(1)中提取数据,该数据有两个过滤器选项。我正在使用BeautifulSoup并使用请求访问此页面。代码摘录:

tt = Contact_page.content # webpage with table
soup = BeautifulSoup(tt)
R_tables = soup.find('div', {'class': 'responsive-table'})

使用find_all(“tr”)和find_all(“th”)会产生空集。使用R_tables.findChildren只会转到“formrow”,然后没有孩子。从formrow到我的tr / th标签,我无法通过BS4访问它。

R_tables导致表3.此文件的XPath是

"//*[@id="kronos_body"]/div[3]/div[2]/div[3]/script/text()  

如何获取数据的每一行信息? soup.find(“r”)和soup.find(“f”)也会导致空集。

如果这篇文章很草率,请提前原谅我,这是我的第一篇。我会在评论中链接我最相似的帖子,我不能链接超过2次。

编辑1:显然BS除了变量之外不识别任何javascript(纠正我,如果我错了,我还是比较新的)。还有其他模块可以帮助我吗?我被提议使用Ghost和Selenium,但我不会使用Selenium。

0 个答案:

没有答案