我想编写一个java应用程序,它将从http://www.reality.sk/vyhladavanie.4加载有关平面的数据并将它们存储到文件或数据库中。
这样做的最佳方法是什么?我应该使用什么来获取有关每个单位的数据以及如何从其他页面获取数据?
我想到了selenium并写了一些测试,它们会保存所有数据并点击所有页面,但有没有更好的解决方案?
答案 0 :(得分:0)
您需要查看web/html scraping with java
例如,结果表包含类search-result-ad-row
并且标题具有类title
,您应该能够以这种方式提取其余数据。
通过JDBC和ORM工具(如Hibernate)可以通过多种方式连接数据库。 Java File IO非常简单,但取决于您希望将数据存储在哪种格式。