使用Jsoup解析html元素

时间:2016-01-13 10:40:42

标签: java html jsoup google-chrome-devtools

我想检索" data-default-src"的值从下面的HTML。似乎正文在阴影根节点或隐藏在源代码中。这只能通过chrome的检查元素功能看到,而不是在ctrl + u完成时。

<body onload="handleOnLoad();" style="margin:0;padding:0;width:100%;height:100%;
position:relative;overflow:hidden" id="myPlayer" 
data-default-src="https://cdn.video.playwire.com/12272/videos/4483914/video-sd.mp4?hosting_id=12272">

这是我到目前为止所尝试的:

Elements media = doc.select("body");

            for (Element links: media) 
            {
            System.out.println((links.attr("abs:data-default-src")));
            }

这也是:

Element body = doc.body();
System.out.println(body.attr("data-default-src"));

1 个答案:

答案 0 :(得分:2)

您可以尝试HTMLUnit这是一个提供无头浏览器的库。通过这种方式,您可以加载页面,就像您真正访问它一样,导致评估所有javascript并将任何动态内容插入到DOM中。在那里,您可以选择使用HTMLUnit的DOM API或将其放入JSoup。