Jsoup,从网站上提取链接,图像。运行时异常

时间:2013-12-22 04:48:31

标签: java jsoup

我刚开始玩Jsoup,所以按照他们在网站上的教程进行操作。我认为这段代码应该可以正常工作,但是当我在netbeans上运行时,我遇到了错误。

这是我正在使用的代码:

`

/**
 *
 * @author Slabs One
 */
public class ParseWebpage {

/**
 * @param args the command line arguments
 */
public static void main(String[] args) throws IOException {
    Validate.isTrue(args.length == 1, "http://www.gumtree.com.au/");
    String url = args[0];
    print("Fetching %s...", url);

    Document doc = Jsoup.connect(url).get();
    Elements links = doc.select("a[href]");
    Elements media = doc.select("[src]");
    Elements imports = doc.select("link[href]");

    print("\nMedia: (%d)", media.size());
    for (Element src : media) {
        if (src.tagName().equals("img"))
            print(" * %s: <%s> %sx%s (%s)",
                    src.tagName(), src.attr("abs:src"), src.attr("width"), src.attr("height"),
                    trim(src.attr("alt"), 20));
        else
            print(" * %s: <%s>", src.tagName(), src.attr("abs:src"));
    }

    print("\nImports: (%d)", imports.size());
    for (Element link : imports) {
        print(" * %s <%s> (%s)", link.tagName(),link.attr("abs:href"), link.attr("rel"));
    }

    print("\nLinks: (%d)", links.size());
    for (Element link : links) {
        print(" * a: <%s>  (%s)", link.attr("abs:href"), trim(link.text(), 35));
    }


}

 private static void print(String msg, Object... args) {
    System.out.println(String.format(msg, args));
}

private static String trim(String s, int width) {
    if (s.length() > width)
        return s.substring(0, width-1) + ".";
    else
        return s;
}

}

`

此代码不应该有任何问题,但在运行时我会收到此错误:

    Exception in thread "main" java.lang.IllegalArgumentException: http://www.gumtree.com.au/
at org.jsoup.helper.Validate.isTrue(Validate.java:45)
at parsewebpage.ParseWebpage.main(ParseWebpage.java:25)

非常感谢任何有关为什么不起作用的见解

1 个答案:

答案 0 :(得分:0)

要在Netbeans中传递命令行参数,您必须执行以下操作。

  • 右键单击项目,然后单击属性
  • 在侧窗格中选择运行
  • 使用浏览对话框
  • 选择您的主类(ParseWebpage)
  • 输入参数(URL)
  • 点击确定

现在,如果您运行Main类(ParseWebpage),则运行时参数将在NetBeans IDE中传递