如何在R中解析嵌入在xml中的html?

时间:2013-01-11 08:49:09

标签: html r parsing

我有一个输入文件,其中包含嵌入在xml中的html标记,例如

 <Root>
   <Section1>
   <p>some text</p>
   <br>
   <table>
       <th></th>
       <tr>
       <td></td> 
       </tr>    
   </table>
   </Section1>
  <Section2>
  <ol>
      <li>1</li>
      <li>2</li>
      <li>3</li>
  </ol>
  </Section2>
</Root>

有没有办法解析嵌入在R?

中的xml文档中的html

1 个答案:

答案 0 :(得分:3)

如果它的XHTML那么它应该是XML,那么你使用标准的XML解析器。你可以在其他地方找到很多。

请注意,<Section1>标记未正确关闭。如果这是你粘贴的文件,则表示存在问题。