从熟悉的XML / PDF输入更新后端数据库:哪种工具/方法最好?

时间:2009-04-08 14:27:38

标签: xml database pdf scripting

我们必须每月几次自动化数据库更新。

我目前的用例如下。

目前我们手动将输入数据与前一个月进行差异化 输入。如果是XML,我们使用MS xmldiff。如果它是Pdf,它就完全完成了 通过手动验证:-(。

一旦找到更改,我们就会通过表单界面(再次手动)更新数据库。更改可能是创建新条目,更新现有条目或删除旧条目。由于这个整个过程既耗时又手动 更不用说个人非常无聊和沮丧,我们是 寻找尽可能自动化这一过程的方法。

我们目前正在考虑使用脚本来实现整个事情 语言(特别是Python)。但我们现在没有任何人拥有 在脚本语言方面的经验,所以我们基本上必须学习。

在我们加入之前我们想要回答的问题是

1)使用脚本语言采用正确的方法吗?我们想过脚本    语言更好,因为有多个领域需要涵盖(XML diff,    数据库连接,创建XML等)。还有其他选择吗?    还是工具?

2)Python和其他语言一样好吗?基于我们    谷歌搜索,python似乎成熟,并支持各种数据库    通过图书馆连接。我们还有其他选择    调查?(再没有人写过一个Python代码)

3)是否有适用于pdf文件的好的免费Diff工具?    我们正在寻找可以检查特定表格的东西    标题内容在pdf中更改并转储输出。

仅供参考,数据库是MS访问。

感谢您的时间。

1 个答案:

答案 0 :(得分:1)

我认为Python很容易学习语言,在我看来,如果你有VBScript经验,你应该能够快速学习它。

我使用BeautifulSoup进行XML / HTML解析,我发现它很容易使用。 http://www.crummy.com/software/BeautifulSoup/documentation.html

对于PDF的东西你可以看一下rportlab工具包(我没用过) http://www.reportlab.org/