R:替换XML的CDATA部分中的实体

时间:2016-04-30 08:41:14

标签: xml r

我有一个像这样的XML文件:

<TextBody>
  <![CDATA[First line.&amp;#10;Second line.]]>
</TextBody>

我需要使用CDATA包在R中提取信息,这意味着我想要

First line.\nSecond line.

所以我尝试了XML包:

xmlParse("<TextBody><![CDATA[First line.&amp;#10;Second line.]]></TextBody>",
         replaceEntities=TRUE)

然后我第一步陷入困境,因为replaceEntities选项似乎无法在这里工作,我仍然在解析后的文本中获得&amp;#10;

任何人都可以告诉我如何从这个XML中提取正确的文本吗?

1 个答案:

答案 0 :(得分:0)

我也无法让.table { border: 1px solid red; box-sizing: border-box; display: block; height: 15px; } .cell { height: 75px; border-width: 0; display: table-cell; } .cell span { display: inline-block; width: 31px; }工作,所以你可以使用gsub。

<div class="table">
  <span class="cell">
      <span>test1</span>
  </span>
  <span class="cell">
      <span>test2</span>
  </span>
</div>

此外,添加xmlParse选项= NOENT或replaceEntities = TRUE不会更改以下任何结果。我总是在CDATA中获得实体引用。

replaceEntities