我无法通过olefile从powerpoint 2003文件中提取文本

时间:2016-06-09 01:07:53

标签: python text extract

我无法从Powerpoint 2003 ppt中提取文本。在下面的代码之后,python shell将“没有响应”或挂起。

'%:%' <- function(object, range) { FUN <- if (!is.null(dim(object))) { if (is.matrix(object)) colnames else names } else identity wh <- if (is.numeric(range)) range else which(FUN(object) %in% range) FUN(object)[seq(wh[1], wh[2])] } df <- data.frame(c1=1:6, c2=2:7, c3=3:8, c4=4:9, c5=5:10, c6=6:11) rownames(df) <- c('r1', 'r2', 'r3', 'r4', 'r5', 'r6')

1 个答案:

答案 0 :(得分:0)

我认为这是因为流&#34; PowerPoint文档&#34;主要包含二进制数据。因此,您需要在打印之前对其进行处理以提取文本。

或者,您可以使用print(repr(read))来查看它包含的内容。