我将开始我的文章提取工作。
我将要完成的任务是提取在不同网页上发布的酒店评论(例如1. http://www.tripadvisor.ca/Hotel_Review-g32643-d1097955-Reviews-San_Mateo_County_Memorial_Park_Campground-Loma_Mar_California.html,2。http://www.travelpod.com/hotel/Comfort_Suites_Sfo_Airport-San_Mateo.html)
我需要用Java完成任务,而我在过去几个月里只使用Java。
以下是我对这些问题的看法。
是否有可能以通用方式从不同的网页单独提取评论。
如果有任何支持Java任务的API,请告诉我。
另外,请告诉我您的想法/来源,这对我来说更有助于完成上述任务。
更新
如果网络中有任何相关的例子,请发布相同的例子,因为这可能很有用。