我目前正在编写一个Webcomic Reader应用程序,到目前为止,我已经能够从漫画网站中提取出“下一个”和“上一个”链接,前提是当我使用JSoup解析它们时,我可以得到一个[href]标记有效且包含“下一个”或“上一个”链接的值。
示例将是http://www.explosm.net/comics/,当我使用JSoup解析它们时,我可以找到标记“< Previous”,其中包含上一个链接的值。
但是,这仅适用于具有有效标记的网站,但在某些网站上,它们不会显示[href]内容的标记,例如http://awkwardzombie.com/
那么有没有一种方法/技术可以在不使用标签的情况下从这些类型的网站中找到我想要的链接?
答案 0 :(得分:1)
对于awkwardzombie.com,请查看超链接图像的alt
属性,该属性显示:
<img src="images/aznavb4o.png" alt="Next Comic" width="40" height="40" border="0">