Question

我正在尝试通读约100张PowerPoint幻灯片，并阅读每张幻灯片的注释部分。事实发生后，我将进行一些文字处理并将其写入csv，但需要首先以可行的格式获取注释。

我现在正在使用officer软件包read_pptx函数，但是可以使用任何需要的软件包。似乎没有注释，但我可能只是在看这个错误。

显示我尝试过的内容->

library(officer)

ppt_var <- read_pptx('test_presentation.pptx')
view(ppt_var)

理想情况下，我可以将每个注释幻灯片的文本添加到各个变量中以写入CSV。我相信读完笔记后就可以进行操作了，但似乎无法解决这一问题。

感谢您的指导或支持！

Answer 1

该如何执行，如以下代码所示：https://github.com/davidgohel/officer/issues/117。

以下内容基于该代码：

library(magrittr)
library(officer)
library(xml2)

p <- read_pptx("mypresentation.pptx")
notes_dir <- file.path(p$package_dir, "ppt", "notesSlides")
files <- list.files(pattern = ".xml$", path = notes_dir, full.names = TRUE)

Notes <- lapply(files,
 . %>% 
   read_xml %>%
   xml_find_all("//a:t") %>%
   xml_text
)

是否具有刮擦Powerpoint幻灯片的注释部分的功能？

1 个答案: