我正在尝试通读约100张PowerPoint幻灯片,并阅读每张幻灯片的注释部分。事实发生后,我将进行一些文字处理并将其写入csv,但需要首先以可行的格式获取注释。
我现在正在使用officer
软件包read_pptx
函数,但是可以使用任何需要的软件包。似乎没有注释,但我可能只是在看这个错误。
显示我尝试过的内容->
library(officer)
ppt_var <- read_pptx('test_presentation.pptx')
view(ppt_var)
理想情况下,我可以将每个注释幻灯片的文本添加到各个变量中以写入CSV。我相信读完笔记后就可以进行操作了,但似乎无法解决这一问题。
感谢您的指导或支持!
答案 0 :(得分:1)
该如何执行,如以下代码所示:https://github.com/davidgohel/officer/issues/117。
以下内容基于该代码:
library(magrittr)
library(officer)
library(xml2)
p <- read_pptx("mypresentation.pptx")
notes_dir <- file.path(p$package_dir, "ppt", "notesSlides")
files <- list.files(pattern = ".xml$", path = notes_dir, full.names = TRUE)
Notes <- lapply(files,
. %>%
read_xml %>%
xml_find_all("//a:t") %>%
xml_text
)