R:xml2,提取数据源名称

时间:2016-03-10 15:33:11

标签: regex xml r

我刚刚安装了XML2包,我设法提取目标信息。下一步是“可视化”'提取的信息,例如与RShiny。唉,我做不到"字符串解析"正确......

例如:提取的数据源

xmlfile <- read_xml("~ /Sample.xml")
ds <- xml_find_all(xmlfile , ".//datasource")
listds <- unique(unlist(ds, use.names = FALSE))

数据源(在此示例中)是两个excel文件。因此,结果是一个列表,其中包含两个excelfiles的名称和各个excelfiels的表单

"Customers (Sample)"  "Orders (Sample - Sales (Excel))"

注意:我不能说为什么一个数据源包括&#34;(Excel)&#34;而另一个没有。 无论如何,期望的结果(=可视化)将是

Datasource: Sample          Sheet Name: Customer
Datasource: Sample - Sales  Sheet Name: Orders 

问题:如何告诉R到&#34;在()中找到姓名,即&#34; Sample&#34;或&#34;样品 - 销售&#34;然后粘贴这个....然后找到&#34;中的字符串。 &#34;但在()之外,即&#34;客户&#34;或&#34;订单&#34;?

万分感谢任何想法和建议!

1 个答案:

答案 0 :(得分:0)

列出ds对象。使用xml_attr获取内容。 同时发布实际文件。