使用java

时间:2017-02-06 07:03:14

标签: java web-crawler

我有一个要求。我正在从动态网页上读取文件,我需要从网页上找到的值在



<td>
&#13;
&#13;
&#13;

,当我检查这个元素时,这是可见的。所以我的问题是,是否有可能使用java?

打印inspect元素中包含的数据

2 个答案:

答案 0 :(得分:1)

使用JSOUP。这是cookbook

ArrayList<String> downServers = new ArrayList<>();
Element table = doc.select("table").get(0);
Elements rows = table.select("tr");

for (int i = 1; i < rows.size(); i++) { 
    Element row = rows.get(i);
    Elements cols = row.select("td");

    // Use cols.get(index) to get the data from td element
}

答案 1 :(得分:1)

我找到了这个问题的解决方案,留下这个答案以防将来有人坚持这个。

要打印您在里面看到的任何内容,可以使用 selenium 跟踪检查元素。

这是我使用`

的代码
WebDriver driver= new ChromeDriver();
driver.manage().timeouts().implicitlyWait(15, TimeUnit.SECONDS);
driver.manage().window().maximize();
driver.get("http://www.whatever.com");
Thread.sleep(1000);
List<WebElement> frameList = driver.findElements(By.tagName("frame"));
System.out.println(frameList.size());
driver.switchTo().frame(0);               
String temp=driver.findElement(By.xpath("/html/body/table/thead/tr/td/div[2]/table/thead/tr[2]/td[2]")).getText();

请阅读here了解更多信息。