从Google幻灯片收集文字

时间:2019-12-13 15:49:01

标签: r

有人尝试使用R将一个文件夹内的Google幻灯片中的所有文本收集到一大块文本中吗?我们正在尝试了解过去几年中所有演示文稿中使用的语言和消息。收集完所有文本后,我们将尝试并使用它来产生未来的见解。

1 个答案:

答案 0 :(得分:0)

最好的方法是将所有电源点下载为pptx,并循环遍历每个文件以读取每个pptx。

您可以使用“军官”包阅读所有电源点,并随时保存文本。

示例:

library(officer)

ppt_files = list.files(...\\ppt, pattern = ".ppt$", full.names = TRUE)


for (i in ppt_files){
ppt = pptx_summary(read_pptx(i))

### more code here

}