使用selenium获取python中的所有表元素

时间:2017-07-27 10:00:40

标签: python selenium html-table elements

我有一个看起来像这样的网页:

<table class="data" width="100%" cellpadding="0" cellspacing="0">
        <tbody><tr>
            <th>1</th>
            <th>2</th>
            <th>3 by</th>
        </tr>
                        <tr>                    <td width="10%"><a href="foo1">5120432</a></td>
                <td width="70%">INTERESTED_SITE1/</td>
                <td width="20%"><a href="foo2">foo2</a></td>
            </tr>
                        <tr class="alt">                    <td width="10%"><a href="foo1">5120431</a></td>
                <td width="70%">INTERESTED_SITE2</td>
                <td width="20%"><a href="foo2">foo2</a></td>
            </tr>

我想放置那两个网站(interested_site1和interested_site2)。我尝试过这样的事情:

chrome = webdriver.Chrome(chrome_path)
chrome.get("fooSite")
time.sleep(.5)

alert = chrome.find_element_by_xpath("/div/table/tbody/tr[2]/td[2]").text
print (alert)

但我找不到第一个网站。如果我不能在for循环中执行此操作,我不介意单独获取每个链接。我怎样才能找到那个链接?

2 个答案:

答案 0 :(得分:1)

使用css查询

会更容易
driver.find_element_by_css_selector("td:nth-child(2)")

答案 1 :(得分:1)

你可以使用xpath来处理每行循环的byb。

xpath expression : html/body/table/tbody/tr[i]/td[2]

获取行数,

totals_rows =chrome.find_elements_by_xpath("html/body/table/tbody/tr")
total_rows_length = len(totals_rows)

for (row in totals_rows):
    count = 1
    site =  "html/body/table/tbody/tr["+counter+]+"/td[2]"
    print("site name is :"+ chrome.find_element_by_xpath(site).text)
    site+=1

基本上遍历每一行并获取第二列中的值(td [2])