使用xml2包读取R中包含@的HTML标记属性名称

时间:2019-03-31 19:07:07

标签: html r web-scraping rvest xml2

我正在尝试在R中读取包含一些vue.js脚本的HTML文档。本文档包含带有@符号的属性标签。

当我在R中使用read_html阅读文档时,包含@符号的属性无法正确解析。

read_html("<html><title @click='method'>Hi</title></html>")
{xml_document}
<html>
[1] <head>\n<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">\n<title>Hi</title>\n</head>

title标签中缺少整个@click属性。有人可以让我知道如何读取包含@​​字符的标记属性吗?

另一个行为不一致的示例:

read_html("<html><title @click='$vuetify.goTo(0, goToOptions)' id='scrollBtn' style='display:none;' v-scroll='scrollfun'>Hi</title></html>")
{xml_document}
<html>
[1] <head>\n<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">\n<title gotooptions id="scrollBtn" style="display:none;" v-scroll="scrollfun">Hi</title>\n</head>

0 个答案:

没有答案