我正在尝试读取一个导出网站的XML文件。当我运行以下内容时:
result <- xmlParse(file = "~/Desktop/export.xml")
我明白了:
PCDATA invalid Char value 8
PCDATA invalid Char value 1
PCDATA invalid Char value 8
PCDATA invalid Char value 1
PCDATA invalid Char value 8
PCDATA invalid Char value 1
PCDATA invalid Char value 8
PCDATA invalid Char value 1
PCDATA invalid Char value 8
PCDATA invalid Char value 1
PCDATA invalid Char value 8
PCDATA invalid Char value 1
Error: 1: PCDATA invalid Char value 8
我有什么办法可以跳过这些无效字符然后再读它?或者我必须以某种方式删除它们?我只想解析XML以查找包含特定字符串的URL。