我使用extract_tables
包中的tabulizer
来从PDF文件中提取表格。一切正常,但如果表格少于4行标题,则不提取。如果表格超过4行,则可以正确提取。
这是我使用的代码:
text <- extract_tables("file path, file name")
table <- do.call(rbind, text)
table <- as.data.frame(table)
我也尝试过使用固定区域的解决方案:
text <- extract_tables("file path, file name", area = c(0,0,595,842))
但在这种情况下,某些列会丢失,而某些列会合并。
有人面临同样的问题,知道如何解决吗?