如何从HTML表格的每个单元格中获取文本?

时间:2011-06-01 09:24:04

标签: selenium selenium-webdriver

在Selenium 2.0中,我不知道如何遍历网页中的HTML表格。在selenium2.0 javadoc中,我找到了两个类“TableFinder”和“TableCellFinder”,但我找不到任何示例。

我想做这样的事情:

RowCount=Get how many rows are there in the html table

for each row of the table
{
   column_count=Get column count
   for each column
   {
      cell_value=get_text_from(row,col);
      Do something with cell_value
   }
}

如何从每个表格单元格中获取文本?

6 个答案:

答案 0 :(得分:46)

感谢先前的回复。

我找到了使用selenium 2.0类的解决方案。

import java.util.List;

import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.ie.InternetExplorerDriver;

public class WebTableExample 
{
    public static void main(String[] args) 
    {
        WebDriver driver = new InternetExplorerDriver();
        driver.get("http://localhost/test/test.html");      

        WebElement table_element = driver.findElement(By.id("testTable"));
        List<WebElement> tr_collection=table_element.findElements(By.xpath("id('testTable')/tbody/tr"));

        System.out.println("NUMBER OF ROWS IN THIS TABLE = "+tr_collection.size());
        int row_num,col_num;
        row_num=1;
        for(WebElement trElement : tr_collection)
        {
            List<WebElement> td_collection=trElement.findElements(By.xpath("td"));
            System.out.println("NUMBER OF COLUMNS="+td_collection.size());
            col_num=1;
            for(WebElement tdElement : td_collection)
            {
                System.out.println("row # "+row_num+", col # "+col_num+ "text="+tdElement.getText());
                col_num++;
            }
            row_num++;
        } 
    }
}

答案 1 :(得分:8)

这是我刚刚编写的C#示例,松散地基于使用CSS选择器的答案,希望能够使用其他人来查看如何设置ReadOnlyCollection表行并至少在MS域中迭代它。我正在查看表行的集合,以查找包含OriginatorsRef(只是一个字符串)和TD的行,其中包含一个包含Overdue by标题属性的图像:

    public ReadOnlyCollection<IWebElement> GetTableRows()
    {
        this.iwebElement = GetElement();
        return this.iwebElement.FindElements(By.CssSelector("tbody tr"));
    }

在我的主要代码中:

        ...
        ReadOnlyCollection<IWebElement> TableRows;
        TableRows = f.Grid_Fault.GetTableRows();

        foreach (IWebElement row in TableRows)
        {
            if (row.Text.Contains(CustomTestContext.Current.OriginatorsRef) &&
              row.FindElements(By.CssSelector("td img[title*='Overdue by']")).Count > 0)
                return true;
        }

答案 2 :(得分:0)

我没有使用Selenium 2. Selenium 1.x有selenium.getTable("tablename".columnNumber.rowNumber)来到达所需的细胞。也许你可以使用webdriverbackedselenium并执行此操作。

您可以使用

获取总行数和列数

int numOfRows = selenium.getXpathCount("//table[@id='tableid']//tr")

int numOfCols=selenium.getXpathCount("//table[@id='tableid']//tr//td")

答案 3 :(得分:0)

$content = '';
    for($rowth=0; $rowth<=100; $rowth++){
        $content .= $selenium->getTable("tblReports.{$rowth}.0") . "\n";
        //$content .= $selenium->getTable("tblReports.{$rowth}.1") . "\n";
        $content .= $selenium->getTable("tblReports.{$rowth}.2") . " ";
        $content .= $selenium->getTable("tblReports.{$rowth}.3") . " ";
        $content .= $selenium->getTable("tblReports.{$rowth}.4") . " ";
        $content .= $selenium->getTable("tblReports.{$rowth}.5") . " ";
        $content .= $selenium->getTable("tblReports.{$rowth}.6") . "\n";

    }

答案 4 :(得分:0)

另一个C#示例。我刚刚为它做了一个扩展方法。

public static string GetCellFromTable(this IWebElement table, int rowIndex, int columnIndex)
    {
        return table.FindElements(By.XPath("./tbody/tr"))[rowIndex].FindElements(By.XPath("./td"))[columnIndex].Text;
    }

答案 5 :(得分:-2)

它的

selenium.getTable("tablename".rowNumber.colNumber)

不是

selenium.getTable("tablename".colNumber.rowNumber)