我编写了一大堆代码,用于获取我对 R 感兴趣的.pdf表,但必须有更好的方法。因此,从pdf导入数据我没有问题。我正在寻找比以下更好的方法来提取我感兴趣的表格。
df_st <- "http://www.drustvo-antropologov.si/AN/PDF/2012_2/Anthropological_Notebooks_XVIII_2_Bjelica.pdf"
df_st_table <- extract_tables(df_st)
df_str <- data.frame(matrix(unlist(df_st_table), nrow=195, byrow=T))
df_str_a <- df_str[29:52, ]
df_str_a <- data.frame(matrix(unlist(df_str_a), nrow=24, byrow=T))
df_str_b <- df_str[53:76, ]
df_str_b <- data.frame(matrix(unlist(df_str_b), nrow=24, byrow=T))
df_str_c <- df_str[101:126, ]
df_str_c <- data.frame(matrix(unlist(df_str_c), nrow=26, byrow=T))
df_str_d <- df_str[127:152, ]
df_str_d <- data.frame(matrix(unlist(df_str_d), nrow=26, byrow=T))
...然后我将它们全部合并。太长而且不优雅。