使用ETL(非MS)从Sharepoint 2007中存储的Infopath表单中获取数据

时间:2010-09-19 11:02:26

标签: sharepoint infopath etl

我正在研究DW项目的架构,需要一些手工收集[结构化]数据,例如来自国家/地区经理的月度会计结果,他们需要填写表格并填写一半打十几个等等。

我非常喜欢使用SP和InfoPath的想法,因为它提供了安全性,工作流程和可定制性等,这意味着它可以轻松部署,因为客户已经推出了SP。我不太清楚的是,从技术上讲,我们可以如何与SP工作流程和表单本身进行交互。理想情况下,数据最终会被丢弃到数据库中,我们会通过ODBC使用我们的[他们的]标准ETL(DataStage,可能是坐在Linux服务器上),并像任何其他数据源一样选择它,但我不确定这需要什么SP方面。另一种方法是获取各个表单的XML并从那里提取信息。

这些appaoches可行吗?为了使这种集成尽可能健壮和无缝,需要在SP端设置什么?任何人都可以指出我可能会给我更多背景信息的文档/阅读材料吗?

谢谢, DEX

1 个答案:

答案 0 :(得分:1)

首先,访问sharepoint的数据库永远不是任何集成问题的答案。你应该把它当作一个黑盒子。

那么,您应该如何获取数据? Web服务+ HTTP。 SharePoint提供大量Web服务来获取所需的数据。如果您正在使用IP表单,那么最终您需要从文档库中获取生成的XML文件并对其进行解析以获取所需的数据。 Web服务可用于枚举IP表单,您可以使用直接HTTP来获取xml文件。这可能是大多数经验丰富的锐人所提供的方法。