我们必须每月几次自动化数据库更新。
我目前的用例如下。
目前我们手动将输入数据与前一个月进行差异化 输入。如果是XML,我们使用MS xmldiff。如果它是Pdf,它就完全完成了 通过手动验证:-(。
一旦找到更改,我们就会通过表单界面(再次手动)更新数据库。更改可能是创建新条目,更新现有条目或删除旧条目。由于这个整个过程既耗时又手动 更不用说个人非常无聊和沮丧,我们是 寻找尽可能自动化这一过程的方法。
我们目前正在考虑使用脚本来实现整个事情 语言(特别是Python)。但我们现在没有任何人拥有 在脚本语言方面的经验,所以我们基本上必须学习。
在我们加入之前我们想要回答的问题是
1)使用脚本语言采用正确的方法吗?我们想过脚本 语言更好,因为有多个领域需要涵盖(XML diff, 数据库连接,创建XML等)。还有其他选择吗? 还是工具?
2)Python和其他语言一样好吗?基于我们 谷歌搜索,python似乎成熟,并支持各种数据库 通过图书馆连接。我们还有其他选择 调查?(再没有人写过一个Python代码)
3)是否有适用于pdf文件的好的免费Diff工具? 我们正在寻找可以检查特定表格的东西 标题内容在pdf中更改并转储输出。
仅供参考,数据库是MS访问。
感谢您的时间。
答案 0 :(得分:1)
我认为Python很容易学习语言,在我看来,如果你有VBScript经验,你应该能够快速学习它。
我使用BeautifulSoup进行XML / HTML解析,我发现它很容易使用。 http://www.crummy.com/software/BeautifulSoup/documentation.html
对于PDF的东西你可以看一下rportlab工具包(我没用过) http://www.reportlab.org/