我无法使用Jsoup获取文字:element.text()
它没有告诉我任何事情,有人帮助我。
org.jsoup.nodes.Document d = Jsoup.connect("https://translate.google.com/#en/ar/scraping").get();
org.jsoup.nodes.Element element = d.getElementById("result_box");
out.print(element.text());
答案 0 :(得分:0)
当您在此处查看静态页面来源时:https://translate.google.com/#en/ar/scraping您会看到它包含以下内容:
<span id="result_box" class="short_text"></span>
但是在浏览器中加载页面时,您会看到该元素已更改为:
<span id="result_box" class="short_text" lang="ar">
<span class="">...</span>
</span>
因此,动态填充result_box
范围的内容。
这意味着它不能被JSoup刮掉。
要阅读动态内容,您需要使用Selenium等网络驱动程序。