我可以使用java HtmlUnit库从linkedIn中提取信息吗?

时间:2017-04-30 11:14:09

标签: java linkedin htmlunit

我努力寻找一种从我的LinkedIn帐户中提取数据的方法  使用REST API,但任何结果:/任何人都知道它是否可能以及如何?  当我在Eclipse中尝试此代码时,结果是a  当我从响应中选择一些字段时,NullPointerException或null  HTML页面。  请注意,选择器路径在浏览器的控制台中运行良好。  非常感谢你。

String url = "https://www.linkedin.com/uas/login?goback=&trk=hb_signin";
final WebClient webClient = new WebClient();
webClient.getOptions().setJavaScriptEnabled(false);
webClient.getOptions().setCssEnabled(false);
HtmlPage loginPage = webClient.getPage(url); 
final HtmlForm loginForm = loginPage.getFormByName("login");
final HtmlSubmitInput button = loginForm.getInputByName("signin");
final HtmlTextInput usernameTextField = 
loginForm.getInputByName("session_key");
final HtmlPasswordInput passwordTextField = 
loginForm.getInputByName("session_password");
usernameTextField.setValueAttribute("something@outlook.com");
passwordTextField.setValueAttribute("**************");
final HtmlPage response = button.click();
loginPage=webClient.getPage("https://www.linkedin.com/in/issa-hammoud-
0a2802114/");
System.out.println(loginPage.querySelector("#profile-wrapper > div.pv-
content.profile-view-grid.neptune-grid.two-column.ghost-animate-in > 
div.core-rail > section div > div > button > img");

1 个答案:

答案 0 :(得分:0)

由于您要建立安全连接(HTTPS),因此需要指定getOptions().setUseInsecureSSL(true);

另请确保启用Cookie getCookieManager().setCookiesEnabled(true);

说过你应该真的使用Linkedin的REST API。

希望有所帮助