使用Java / Jsoup从HTML内容中提取JS库

时间:2019-02-17 18:16:26

标签: javascript java jsoup

页面https://en.wikipedia.org/wiki/Punjab,_India

HTML源供参考(使用Chrome)view-source:https://en.wikipedia.org/wiki/Punjab,_India

使用上述页面URL,我想提取HTML中使用的所有javascript库。

是否有使用 Jsoup / Java 或任何其他正在使用的Java库的简单方法。

2 个答案:

答案 0 :(得分:0)

您可以尝试以下简单的解决方案:

namespace YourApplication {
    //This should have the same name as you .aspx.cs
    public partial class _Default {
        protected global::System.Web.UI.WebControls.GridView GridView1;
    }
}

对您来说可能就足够了。如果没有,请说明您期望什么输出。

答案 1 :(得分:-2)

在我看来,您想从html页面提取一些数据。我建议您看一下该框架https://github.com/GoogleChrome/puppeteer/blob/v1.10.0/docs/api.md#,但是,您必须遍历DOM才能提取信息。可以提供帮助的另一个框架是https://jquery.com/