使用POI将HTML数据表导出到Excel

时间:2013-02-08 08:00:35

标签: java apache-poi

请告诉我,在这种情况下我们如何处理我们有一个表格形式的纯HTML数据,应该转换为适当的Excel表格。

这是我写的源代码,我得到一个例外 - > 错误:标头签名无效;读取0x6D78206C6D74683C,预期为0xE11AB1A1E011CFD0 |#]

    // Resulting byte stream from the DB
    resultBytes = dokumentSession.getXlsZuAuftrag(ts);
    if (resultBytes != null && resultBytes.length > 0) {
        try {
            InputStream fos = new ByteArrayInputStream(resultBytes);
            HSSFWorkbook workbook = new HSSFWorkbook(fos);
            workbook.createSheet("sheet1");
            FileOutputStream fileOut = new FileOutputStream("ipa_loader.xls");
            workbook.write(fileOut);
            fileOut.close();
        } catch (Exception e)
        {// Catch exception if any
            System.err.println("Error: " + e.getMessage());
        }
    }

请告诉我有关此方面的任何意见,欢迎任何帮助。

1 个答案:

答案 0 :(得分:4)

使用任何HTML解析器,您必须解析HTML内容,然后使用POI将内容写入Excel。

链接:

POI示例

http://viralpatel.net/blogs/java-read-write-excel-file-apache-poi/

HTML解析器示例

http://jsoup.org/cookbook/extracting-data/example-list-links

您也可以轻松将html代码转换为XLS。 在这里你可以找到这个例子 http://wiki.sdn.sap.com/wiki/display/WDJava/Export+to+Excel+%28Without+third+party+APIs%29