解析表用美丽的汤

时间:2013-05-06 00:58:01

标签: python parsing selenium beautifulsoup

我正在写一个程序进入我的学校成绩网站,并取得我的成绩,并使他们成为我的桌面背景,但一旦我达到我的成绩,我不能得到如何从大桌子解析他们

这是我的代码:

from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

driver = webdriver.Chrome()
driver.get("https://ps.rsd.edu/public/")

elem = driver.find_element_by_name("account")
elem.send_keys("Username")
elem2 = driver.find_element_by_name("pw")
elem2.send_keys("Password")
elem.send_keys(Keys.RETURN)
html = driver.page_source
soup = BeautifulSoup(html)
print soup
driver.quit()

print "done"

这会打印页面的源代码,但我希望得到一个名为S2的行 抱歉有点难,因为我无法告诉你实际的网站

这里是表格中所有行的名称:

<table class="grid">
<tr><th class="center" colspan="25">Attendance By Class</th></tr>
<tr class="center th2">
<th rowspan="2">Exp</th>
<th colspan="5">Last Week</th><th colspan="5">This Week</th><th rowspan="2">Course</th>
<th rowspan="2">Q1</th>
<th rowspan="2">Q2</th>
<th rowspan="2">S1</th>
<th rowspan="2">Q3</th>
<th rowspan="2">Q4</th>
<th rowspan="2">S2</th>
<th rowspan="2">Absences</th>
<th rowspan="2">Tardies</th>
</tr>

这是一个示例行:

<a href="scores.html?  frn=004711281&begdate=01/23/2013&enddate=06/07/2013&fg=S2">B<br>84</a></td>
<td><a

1 个答案:

答案 0 :(得分:1)

此资源可能会对您有所帮助:locating elements in selenium

您可以尝试使用

find_element_by_link_text

以及您获得包含该课程成绩的元素的课程名称