HTmlUnit不会抓取整个页面

时间:2014-08-28 13:45:50

标签: java javascript load htmlunit

HtmlUnit 2.14版 我试图抓住这个页面:http://m.hanjin.com/mhanjin/CUP_MOB_0802.do?menuFlag=C&searchType=C&blCntrNo=CAXU3336862 ... 这是我的代码:

public class Main {

  static final WebClient browser;

  static {

    browser = new WebClient(BrowserVersion.FIREFOX_24);
    browser.getOptions().setJavaScriptEnabled(true);

    CookieManager cookieMan = new CookieManager();
    cookieMan = browser.getCookieManager();
    cookieMan.setCookiesEnabled(true);

    browser.getOptions().setRedirectEnabled(true);
    browser.getOptions().setThrowExceptionOnFailingStatusCode(false);

    browser.getOptions().setPrintContentOnFailingStatusCode(true);
    browser.getOptions().setThrowExceptionOnScriptError(false);


  }

  public static void main(String[] arguments) {


    doTestHANJINMobile();

  }

  private static void doTestHANJINMobile() {

    try {


      HtmlPage page = (HtmlPage) browser.getPage("http://m.hanjin.com/mhanjin/CUP_MOB_0802.do?menuFlag=C&searchType=C&blCntrNo=CAXU3336862");

      System.out.println("waitForBackgroundJavaScript...");
      browser.waitForBackgroundJavaScriptStartingBefore(5000);
      browser.waitForBackgroundJavaScript(5000);

      System.out.println("XML Source : \n" + page.asXml() + "\n");

    } catch (Exception e) {
      System.out.println("EXCEPTION --------------- " + e.toString());
    }

  }
}

但我只得到了#34;帆船信息"表而不是"容器详细信息"表。 我试过其他浏览器版本(IE,Chrome ..)但没有任何反应......

1 个答案:

答案 0 :(得分:1)

适用于HtmlUnit版本2.15!