我想解析一个网页并将数据放入excel文件中

时间:2013-04-02 00:12:56

标签: java excel parsing web webpage

我想在java中创建一个程序,它接受一个URL并为不同的字符串解析它,然后将它存储到excel文件中。我从未对网页或excel文件做过任何事情,所以我很想知道;

我从哪里开始?

我试图掌握对过程的理解以及在实际启动项目之前需要学习使用的任何方法。我没有提出太多,但我相信我正在寻找错误的关键字,因为我正在寻找。

感谢任何帮助。

编辑: 我将通过使用止赎房屋的URL来实现这一点,并希望该程序在各自的列中记录床位数,浴室数,平方英尺,价格和位置。

2 个答案:

答案 0 :(得分:0)

您需要实施一个刮刀,或者找一个可以使用的刮刀。刮刀用于从标记文件或任何表示层文件中提取数据(假设感兴趣的一方无权访问底层数据层)。

您没有说明如何实施此操作。有些库会写出excel文件。 Poi似乎是最受欢迎的人。

答案 1 :(得分:0)

您希望开始发出HTTP请求,然后将响应正文作为字符串返回。然后,您将能够根据需要解析响应字符串。

这是一个可以帮助您入门的过去答案。

How can I get an http response body as a string in Java?