获得预期的开始标记' R中的错误

时间:2017-08-29 15:14:31

标签: r xml

我正在尝试使用RStudio解析XML文件。这是我文件的几行

<?xml version="1.0" encoding="UTF-8"?> <iaapi:Project name="IA Quickstart" xmlns:iaapi="http://www.ibm.com/investigate/api/iaapi"> <DataRuleDefinition name="DRD_dummy_rule"> <ExecutableRules>

我使用函数xmlParse()来解析文件,但是收到以下错误:期望开始标记。&#39;&lt;&#39;找不到&#39;

但正如我们所看到的那样,我们有了&#39;&lt;&#39;标记在xml字符串的开头。非常感谢帮助。

  

块引用

1 个答案:

答案 0 :(得分:1)

我有同样的错误。我的代码是:

xml = xmlTreeParse("data-raw/documentos.xml", useInternalNodes=TRUE, encoding="UTF-8)

我的解决方案是:

txt = readLines("data-raw/documentos.xml", encoding = "UTF-8")
xml = xmlTreeParse(txt, useInternalNodes=TRUE)

显然,当阅读documentos.xml第一行有一个陌生人角色<U+FEFF>时,我认为这是问题的根源。