Question

我编写了一大堆代码，用于获取我对 R 感兴趣的.pdf表，但必须有更好的方法。因此，从pdf导入数据我没有问题。我正在寻找比以下更好的方法来提取我感兴趣的表格。

df_st <- "http://www.drustvo-antropologov.si/AN/PDF/2012_2/Anthropological_Notebooks_XVIII_2_Bjelica.pdf"

df_st_table <- extract_tables(df_st)

df_str <- data.frame(matrix(unlist(df_st_table), nrow=195, byrow=T))

df_str_a <- df_str[29:52, ]
df_str_a <- data.frame(matrix(unlist(df_str_a), nrow=24, byrow=T))
df_str_b <- df_str[53:76, ]
df_str_b <- data.frame(matrix(unlist(df_str_b), nrow=24, byrow=T))
df_str_c <- df_str[101:126, ]
df_str_c <- data.frame(matrix(unlist(df_str_c), nrow=26, byrow=T))
df_str_d <- df_str[127:152, ]
df_str_d <- data.frame(matrix(unlist(df_str_d), nrow=26, byrow=T))

...然后我将它们全部合并。太长而且不优雅。

提取.pdf表

0 个答案: