我在R中使用read_html解析文件。但是我看不懂CDATA部分。
这是输入文件(test.html)
<FL val="Company Name"> <![CDATA["Dolce & Gabbana"]]> </FL>
这是输出(doc)
[1] <body>\n<fl val="Company Name"> </fl>\r\n</body>
为什么不读取CDATA?
url = "https://gettysburgconnection.org/docs/test.html"
doc = read_html(url, options = c("NOCDATA"))
doc