如何使用selenium从任何网站获取页面内容?

时间:2014-05-08 08:19:15

标签: selenium

这是我的代码,它返回null值但在浏览器控制台中运行良好

   import java.util.List; 
   import org.openqa.selenium.By;
   import org.openqa.selenium.JavascriptExecutor;
   import org.openqa.selenium.WebDriver;
   import org.openqa.selenium.WebElement;
   import org.openqa.selenium.firefox.FirefoxDriver;

   public class google {
   public static void main(String[] args) throws Exception {

    WebDriver driver = new FirefoxDriver();


    driver.get("https://in.yahoo.com/");


       JavascriptExecutor js;
       js = (JavascriptExecutor)driver;
       String scriptReturningString = ""; 
       String scriptResult = (String)js.executeScript("return document.getElementsByTagName('body')[0].innerText"); 
       System.out.println("Text Inside:"+scriptResult);        

    driver.quit();
  }
}

1 个答案:

答案 0 :(得分:2)

WebDriver webDriver = new FirefoxDriver();
webDriver.get("https://in.yahoo.com/");
String content = webDriver.findElement(By.tagName("body")).getText();
System.out.println(content);

此代码获取页面内容(不是源代码),将其存储在变量内容中,然后将其打印在控制台中。

如果您想获取网页的源代码,则应使用webDriver.getPageSource()方法。