Question

这是我的代码：

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;

public class PageReaderBisnis {
public void start(){
    try {
        String url = "http://finansial.bisnis.com/";
        print("Fetching %s...", url);

        Document doc = Jsoup.connect(url).get();

        Elements select = doc.select("div.post-category-item");
        Elements tautan =  select.select("h2>a");
        print("\nLinks: (%d)", tautan.size());
        for (Element link: tautan){
            String t = link.attr("abs:href");
            print(" * a: <%s>", t);
        }
        print("\nNama: (%d)", tautan.size());
        for (Element link: tautan){
            String t = link.text();
            print(" * a: %s", t);
        }
    }
    catch (IOException ex) {
        System.out.println("No connection");
    }
}

private static void print(String msg, Object... args){
    System.out.println(String.format(msg, args));
}

private static String trim(String s, int width){
    if(s.length() > width){
        return s.substring(0, width-1) + ".";
    }
    else return s;
}
}

该网站是finansial.bisnis.com

我希望打印出来：

链接：（10）

a：http://finansial.bisnis.com/read/20140819/9/251157/rapbn-2015-pertumbuhan-ekonomi-56-berat-dicapai

...

a：http://finansial.bisnis.com/read/20140819/9/251110/defisit-anggaran-pemangkasan-kementerian-bakal-terulang

Nama：（10）

a：RAPBN 2015：Pertumbuhan Ekonomi 5,6％Berat Dicapai
a：BI Musnahkan Uang Tidak Layak Edar Rp22,6 Triliun Kuartal II / 2014
a：DAU 2015 Dirancang Naik Jadi Rp349,2 Triliun。 Ini Penyebabnya
a：Pemerintah Diminta Tunda DAU Pemda yang Dananya Nganggur
a：Kredit Manufaktur dan Perdagangan Kian Melambat
a：BCA Tidak Naikkan Bunga KPR Hingga Akhir Tahun
a：BI Prediksikan Suku Bunga Meningkat Semester II / 2014
a：维多利亚银行：Genjot Pendapatan Non Bunga，VIP Maxima Link Diluncurkan
a：第一学期，Belanja Daerah Terserap 31,3％
a：Defisit Anggaran：Pemangkasan Kementerian Bakal Terulang？

我正在编写代码并希望结果能够按照我的要求出现，但它似乎并没有给出正确的结果。我在这里做错了什么？

Answer 1

试试这个

Document doc = Jsoup.connect(url)
                    .userAgent("Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0")  
                    .referrer("http://www.google.com")
                    .get();

服务器要么不允许机器人，要么它会搞乱，并向您显示移动版本。

JSoup没有给出预期的结果

1 个答案: