Tabulizer提取缺失

时间:2017-04-07 11:13:25

标签: r tabula

我使用extract_tables包中的tabulizer来从PDF文件中提取表格。一切正常,但如果表格少于4行标题,则不提取。如果表格超过4行,则可以正确提取。

这是我使用的代码:

text <- extract_tables("file path, file name")
table <- do.call(rbind, text)
table <- as.data.frame(table) 

我也尝试过使用固定区域的解决方案:

text <- extract_tables("file path, file name", area = c(0,0,595,842))

但在这种情况下,某些列会丢失,而某些列会合并。

有人面临同样的问题,知道如何解决吗?

0 个答案:

没有答案