是否具有刮擦Powerpoint幻灯片的注释部分的功能?

时间:2019-04-29 14:55:25

标签: r ms-office powerpoint officer

我正在尝试通读约100张PowerPoint幻灯片,并阅读每张幻灯片的注释部分。事实发生后,我将进行一些文字处理并将其写入csv,但需要首先以可行的格式获取注释。

我现在正在使用officer软件包read_pptx函数,但是可以使用任何需要的软件包。似乎没有注释,但我可能只是在看这个错误。

显示我尝试过的内容->

library(officer)

ppt_var <- read_pptx('test_presentation.pptx')
view(ppt_var)

理想情况下,我可以将每个注释幻灯片的文本添加到各个变量中以写入CSV。我相信读完笔记后就可以进行操作了,但似乎无法解决这一问题。

感谢您的指导或支持!

1 个答案:

答案 0 :(得分:1)

该如何执行,如以下代码所示:https://github.com/davidgohel/officer/issues/117

以下内容基于该代码:

library(magrittr)
library(officer)
library(xml2)

p <- read_pptx("mypresentation.pptx")
notes_dir <- file.path(p$package_dir, "ppt", "notesSlides")
files <- list.files(pattern = ".xml$", path = notes_dir, full.names = TRUE)

Notes <- lapply(files,
 . %>% 
   read_xml %>%
   xml_find_all("//a:t") %>%
   xml_text
)