我在使用craigslist的登录CAPTCHA时遇到了麻烦。我的程序试图从html源代码中显示CAPTCHA图像。任何人都知道如何从源代码中获取CAPTCHA图像链接?这是显示CAPTCHA的源代码中的脚本。我可以使用链接并加载另一个CAPTCHA并获取该图像,但需要的是当前显示的CAPTCHA图像。我找不到它。
我知道如何显示它以及我需要找到的所有内容。
//<![CDATA[
var RecaptchaOptions = {"tabindex":1,"theme":"clean"};
//]]>
</script>
<script src="https://www.google.com/recaptcha/api/challenge?
k=6Lf5YAcAAAAAAILdm73fp007vvmaaDpFb6A5HLJP" type="text/javascript"></script>
<noscript><iframe frameborder="0" height="300"
src="https://www.google.com/recaptcha/api/noscript?
k=6Lf5YAcAAAAAAILdm73fp007vvmaaDpFb6A5HLJP" width="500"></iframe><br><textarea
cols="40" name="recaptcha_challenge_field" rows="3"></textarea><input
name="recaptcha_response_field" type="hidden" value="manual_challenge" /></noscript>
</p>
答案 0 :(得分:1)
您可以使用Java HTML DOM Parser库。我推荐 jsoup: Java HTML Parser 。
然后您可以使用以下代码获取图片网站网址
Document doc = Jsoup.parse(htmlString);
Element CaptchaFrame = doc.select("noscript > iframe").first();
String CpatchaImageUrl=CaptchaFrame.attr("src");