在实际文档中寻找TagSoup和JSoup之间的性能比较。到目前为止,我一直在使用TagSoup进行HTML处理,它运行良好。唯一的缺点是,由于SAX性质,应该使用堆栈以编程方式完成许多工作(例如,用于处理带有标签的文本)。 JSoup看起来更简洁 - 但我对性能感到担忧。
答案 0 :(得分:0)
还有许多其他用Java编写的HTML SAX解析器,特别是NekoHTML,JTidy(C库和工具HTML Tidy的端口)和HTML Parser。所有这些都有其优点和缺点:围绕Web的一般观点似乎是TagSoup是最慢的,但也是最强大和最可靠的。
我尝试创建一个应用程序,使用jsoup解析5个页面,使用TagSoup解析5个页面并发布计时。不幸的是,我无法弄清楚如何使用TagSoup 1.2.1将网页返回到DOM中,这使得苹果与苹果的比较变得困难。
答案 1 :(得分:0)
我使用jsoup已有很长时间了,您应该知道,唯一会限制您的是Internet速度。我认为这两个馆员不会对html文档的上传时间产生单独的影响。即使文档很大,分离过程也不会超过毫秒。