我在解决这个方面遇到了一些麻烦,所以如果你能提供帮助那就太好了。
我编写了一些代码,可以从站点地图中获取URL列表。然后我去每一页,刮掉所有链接,然后测试它们的状态(200,404等)。
我正在使用HttpClient。我有一切正常工作但是因为我是Java新手我认为我的代码是一个完整的黑客/迷宫,如果组织正确,我很可能会获得更好的性能。所以我拥有的是
主类 - 这构建了gui
解析sitemap类 - 解析站点地图并获取网址列表。
叫做PingURl的类 - 我确信我的上面很差,但这是我认为最糟糕的一点。此类打开所有URL,为链接抓取它们,然后测试链接的状态并返回它。我认为这堂课应该分解?最重要的是,我认为我应该在它自己的类中隔离链接的测试,所以稍后实现线程会很容易吗?
基本上我在寻找建议。如果有人可以帮助我更好地布置项目。其次我认为这是我最薄弱的部分,所以要提高我需要了解更多,我甚至不知道该怎么称呼(设计/布局问题?)。您还可以推荐资源以了解更多相关信息吗?
答案 0 :(得分:1)
Java是IMO的一种语言,体现了良好的OO设计。设计OO非常有效。
http://java.sun.com/developer/onlineTraining/Programming/BasicJava2/oo.html
就你的问题而言,我觉得它运作得很好。您有点遵循模型 - 视图 - 控制器模式:http://www.codinghorror.com/blog/2008/05/understanding-model-view-controller.html
我不能告诉你如何设计你的代码,但如果我遇到同样的问题,我会告诉你如何做到这一点:
我会得到一个代表超链接的类。在那个类中,将会有已经被抓取的超链接,以及一个getter和setter。以及布尔值和ping函数。这意味着如果我创建一个“超链接”对象,那么我可以在该对象上调用(“ping”),因为它是该类的一部分。这意味着ping函数只是设置表示连通性的布尔值。
这样,您的解析器基本上会获取一个页面,并且对于它找到的每个链接,它会根据您自己的“超链接”类创建一个新的“超链接”对象。并把它放在一个数组中。因此,一旦您的解析器执行,您将获得指向超链接的指针数组。
然后你要做的就是在每一个上调用ping函数,看它是否存在。
我认为这个设计是最好的,因为它可以很容易地从一个超链接测试扩展到1000个。
关于设计有很多东西,还有无数的校长。从来没有一种绝对的方法可以解决问题。但是你获得的经验越多,你对设计模式和模型的阅读越多,你就会越好:)