应用错误收集

使用R和pdftools从PDF删除页脚

时间：2019-05-10 16:36:20

标签： r pdf text

我对R的功能要求最低。

我以前有一个员工文本分析脚本，该脚本是使用pdftools :: pdf_text导入数据构建的。

我想删除重复的页脚信息，这些信息只会使事情变得混乱。页脚包含一个文档编号，制作此报告的办公室以及页码。我不太担心页码。文档＃和office在每个文档中都是静态的，因此它似乎是grep或其他正则表达式方法的理想目标。

预先感谢您的任何建议。

0 个答案:

没有答案