我正在尝试做一些text mining to elsevier articles。我已经下载了XML格式的文章,并且成功地使用XML2库读取了所需的文本。
我的问题是要从属性字段中获取数据,就像这样:
<ce:date-received day="17" month="11" year="2016"/>
读取文件xx <- read_xml(filename)
,然后尝试调用xml_find_all(xx, ".//ce:date-received")
无效(无结果)。 xml_attr(xx,"day")
也不起作用。
正确的方法是什么?
谢谢。