用Java编写带有解析信息的Excel

时间:2017-01-05 12:24:16

标签: java excel jsoup

我有一个代码,我从网页上抓取一些信息(这只是一个例子),我想在excel中同时介绍抓取的信息,我的意思是,在“for”条件中,当我刮掉excel中的元素时。

每当我尝试实现创建Excel的代码时,我都会遇到错误。我导入POI“jar”文件,但它一直无法正常工作。我是否必须在另一堂课中完成?在这种情况下,我不太了解信息的保存方式和位置,以便我可以将所有已删除的信息“导入”到创建Excel工作表的类中。

报废代码如下:

public static final String url = "http://jarroba.com/page/%s/";
public static final int maxPages = 20;  

public static void main (String args[]) {

    for (int i=1; i<maxPages; i++){

        String urlPage = String.format(url, i);
        System.out.println("Comprobando entradas de: "+urlPage);

        // Compruebo si me da un 200 al hacer la petición
        if (getStatusConnectionCode(urlPage) == 200) {

            // Obtengo el HTML de la web en un objeto Document2
            Document document = getHtmlDocument(urlPage);

            // Busco todas las historias de meneame que estan dentro de: 
            Elements entradas = document.select("div.col-md-4.col-xs-12").not("div.col-md-offset-2.col-md-4.col-xs-12");

            // Paseo cada una de las entradas
            for (Element elem : entradas) {
                String titulo = elem.getElementsByClass("tituloPost").text();
                String autor = elem.getElementsByClass("autor").toString();
                String fecha = elem.getElementsByClass("fecha").text();

                System.out.println(titulo+"\n"+autor+"\n"+fecha+"\n");

            }

        }else{
            System.out.println("El Status Code no es OK es: "+getStatusConnectionCode(urlPage));
            break;
        }
    }

1 个答案:

答案 0 :(得分:0)

POI是一个Apache库,用于处理许多Microsoft Office文件类型。您不需要创建类,而是将它们导入到要使用的项目中。

Apache POI resources

Importing libraries into Netbeans