我有一个看起来像这样的网页:
<table class="data" width="100%" cellpadding="0" cellspacing="0">
<tbody><tr>
<th>1</th>
<th>2</th>
<th>3 by</th>
</tr>
<tr> <td width="10%"><a href="foo1">5120432</a></td>
<td width="70%">INTERESTED_SITE1/</td>
<td width="20%"><a href="foo2">foo2</a></td>
</tr>
<tr class="alt"> <td width="10%"><a href="foo1">5120431</a></td>
<td width="70%">INTERESTED_SITE2</td>
<td width="20%"><a href="foo2">foo2</a></td>
</tr>
我想放置那两个网站(interested_site1和interested_site2)。我尝试过这样的事情:
chrome = webdriver.Chrome(chrome_path)
chrome.get("fooSite")
time.sleep(.5)
alert = chrome.find_element_by_xpath("/div/table/tbody/tr[2]/td[2]").text
print (alert)
但我找不到第一个网站。如果我不能在for循环中执行此操作,我不介意单独获取每个链接。我怎样才能找到那个链接?
答案 0 :(得分:1)
使用css查询
会更容易driver.find_element_by_css_selector("td:nth-child(2)")
答案 1 :(得分:1)
你可以使用xpath来处理每行循环的byb。
xpath expression : html/body/table/tbody/tr[i]/td[2]
获取行数,
totals_rows =chrome.find_elements_by_xpath("html/body/table/tbody/tr")
total_rows_length = len(totals_rows)
for (row in totals_rows):
count = 1
site = "html/body/table/tbody/tr["+counter+]+"/td[2]"
print("site name is :"+ chrome.find_element_by_xpath(site).text)
site+=1
基本上遍历每一行并获取第二列中的值(td [2])