我正在尝试使用HtmlUnit阅读youtube聊天消息
@Test
void test() throws IOException {
try (final WebClient webClient = new WebClient()) {
webClient.getOptions().setThrowExceptionOnScriptError(false);
webClient.getOptions().setThrowExceptionOnFailingStatusCode(false);
final HtmlPage page = webClient.getPage("https://www.youtube.com/live_chat?v=" + id);
webClient.waitForBackgroundJavaScriptStartingBefore(2000);
DomNodeList<DomElement> elementsByTagName = page.getElementsByTagName("yt-live-chat-text-message-renderer");
System.out.println(elementsByTagName.size());
}
}
String id
是一个YouTube直播,包含(!)聊天消息
运行此命令将永远不会返回带有标签yt-live-chat-text-message-renderer
的任何元素。我尝试了各种wait()方法,但均未成功。我注意到,在浏览器中,该页面似乎加载了两次,直到最后才开始显示聊天。