提取.pdf表

时间:2018-05-15 12:43:07

标签: r pdf-extraction

我编写了一大堆代码,用于获取我对 R 感兴趣的.pdf表,但必须有更好的方法。因此,从pdf导入数据我没有问题。我正在寻找比以下更好的方法来提取我感兴趣的表格。

df_st <- "http://www.drustvo-antropologov.si/AN/PDF/2012_2/Anthropological_Notebooks_XVIII_2_Bjelica.pdf"

df_st_table <- extract_tables(df_st)

df_str <- data.frame(matrix(unlist(df_st_table), nrow=195, byrow=T))

df_str_a <- df_str[29:52, ]
df_str_a <- data.frame(matrix(unlist(df_str_a), nrow=24, byrow=T))
df_str_b <- df_str[53:76, ]
df_str_b <- data.frame(matrix(unlist(df_str_b), nrow=24, byrow=T))
df_str_c <- df_str[101:126, ]
df_str_c <- data.frame(matrix(unlist(df_str_c), nrow=26, byrow=T))
df_str_d <- df_str[127:152, ]
df_str_d <- data.frame(matrix(unlist(df_str_d), nrow=26, byrow=T))

...然后我将它们全部合并。太长而且不优雅。

0 个答案:

没有答案