有人尝试使用R将一个文件夹内的Google幻灯片中的所有文本收集到一大块文本中吗?我们正在尝试了解过去几年中所有演示文稿中使用的语言和消息。收集完所有文本后,我们将尝试并使用它来产生未来的见解。
答案 0 :(得分:0)
最好的方法是将所有电源点下载为pptx,并循环遍历每个文件以读取每个pptx。
您可以使用“军官”包阅读所有电源点,并随时保存文本。
示例:
library(officer)
ppt_files = list.files(...\\ppt, pattern = ".ppt$", full.names = TRUE)
for (i in ppt_files){
ppt = pptx_summary(read_pptx(i))
### more code here
}