我有几百个XML文件。它们可能是从Excel生成的。我想把它读到R或转换为CSV。所有文件的标题如下所示:
<?xml version="1.0" encoding="UTF-8"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:x="urn:schemas-microsoft-com:office:excel"
xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
xmlns:html="http://www.w3.org/TR/REC-html40">
<DocumentProperties xmlns="urn:schemas-microsoft-com:office:office">
我总是可以编写解析器,但是希望避免这样做。我没有Excel
答案 0 :(得分:2)
“R数据导入/导出”手册中有一章(与R一起安装的免费手册之一)从Excel电子表格中读取数据。如果上述XML文件是来自最新版Excel的保存电子表格,那么其中一些工具应该可以轻松阅读。我可能会从RODBC包或XLConnect包开始。
如果那些不起作用,那么XML包至少应该使编写解析器更容易。