我是一名为承包商公司工作的实习生,每天以pdf的形式收到几份80页的政府合同提案。包含这些pdf的电子邮件将发送到我公司的个人gmail帐户中的特定文件夹,我的任务是对它们进行排序。我给出了我公司的关键字列表,以帮助我根据文档与我公司想要完成的任务类型的相关性来分离文档。最初我想要做的就是通过基于这些关键字的自动化过程将重要的pdf与不重要的pdf分开。但最终,我希望能够自动化整个过程,其中包括:打开位于特定文件夹中的电子邮件的过程,打开电子邮件中pdf提案的链接,然后最终确定pdf是否符合条件我公司的好建议(基本上是第一阶段的任务)。最终产品有望成为一个自动准确的清单" good"并且"坏"建议可以节省我的高层时间和自己的时间。
我的问题是我真的不知道从哪里开始..我应该用什么语言来实现这样的脚本?一般而言,这个过程将如何发生?我可以很快学到任何我需要知道的东西......我只需要知道从哪里开始,因为我从未做过这样的事情。
谢谢!
答案 0 :(得分:-1)
我不知道你想要构建什么样的应用程序。但是使用PHP,您可以查看scandir函数和fopen / read / close函数。如果您想阅读PDF中的文本,可以查看:http://www.phpclasses.org/browse/file/31030.html