从R中的word文档中提取原始属性(元数据)

时间:2017-10-10 11:54:28

标签: r ms-word metadata

我有数百个word文档(.docx)被发送给我进行分析,我正在努力寻找提取Origin元数据的方法。我想知道作者的姓名,创建的内容以及上次为每个文档保存的日期 - 请注意,当您使用鼠标右键单击word文档并选择时,可以在“详细信息”分隔符下查看这些属性“属性”。我希望有一个数据框,列表或类似的东西: [1]“document.name”“authors.name”“content.created”“date.lastsaved” [2]“document.name2”“authors.name2”“content.created2”“date.lastsaved2”

有没有人有一个很好的解决方案?

谢谢!

1 个答案:

答案 0 :(得分:0)

也许是这样的:

setwd("/Desktop/docs") # set directory to wherever your docx files are

file.info(list.files(getwd())) # obtain file info for docs in folder