pdftables R包抛出HTTP 400错误

时间:2018-07-12 18:41:26

标签: r dplyr

我正在尝试使用pdftables包将数据提取到csv中。

install.packages("pdftables")
library(pdftables)

write.csv(head(iris), file = "test.csv", row.names = FALSE)

打开test.csv并以PDF格式打印到“ test.pdf”

convert_pdf("test.pdf", "test2.csv")

但是,出现以下错误:

  

get_content(输入文件,格式,api_key)中的错误:错误的请求   (HTTP 400)。

这里的解决方法是什么?

2 个答案:

答案 0 :(得分:2)

您获得了API令牌吗?

要使用该软件包,用户首先需要注册PDFTables API以获得API令牌(他们提供了一个免费的软件包,最多可容纳50页)。

请参阅:https://cran.r-project.org/web/packages/pdftables/README.html

答案 1 :(得分:0)

要使用PDFTables R软件包,您需要运行以下命令:

convert_pdf('test/index.pdf', output_file = NULL, format = "xlsx-single", message = TRUE, api_key = "insert_API_key")

确保将insert_API_key替换为您的API密钥,然后更改文件路径和/或格式。

此处有更多信息:https://pdftables.com/blog/convert-pdf-to-excel-r