从解析的XML开发数据仓库

时间:2015-04-05 13:06:44

标签: xml data-warehouse dimensional-modeling

我的目的是开发一个数据仓库,我从dblp (computer science bibliography website)下载了一个XML文件。 然后,我使用SAX XML解析器解析了该XML文件。

解析后,我现在有以下实体(不会故意打印关闭标签):

  <dblp>
    <www mdate key>
      <author>
      <title>
      <url>
      <year>
    <inproceedings mdate key>
      <author>
      <title>
      <month>
      <year>
      <pages>
      <booktitle>
      <url>
      <note>
      <cdrom>
    <article mdate key>
      <author>
      <author>
      <title>
      <journal>
      <volume>
      <month>
      <year>
    <book mdate key>
      <author>
      <title>
      <year>
      <publisher>
      <isbn>
      <url>
    <incollection mdate key publtype>
      <author>
      <author>
      <author>
      <title>
      <year>
      <booktitle>
      <ee>
      <crossref>
      <url>
    <proceedings mdate key>
      <editor>
      <editor>
      <editor>
      <title>
      <booktitle>
      <volume>
      <series href>
      <year>
      <isbn>
      <publisher>
      <url>

根据mu知识,现在下一步是从这些实体开发一个维度模型(星型模式),但我不明白我是如何用这么多数据做到的。 (注意:这是我的第一个数据仓库项目)

这些数据足够吗? 我有什么需要照顾的?

接下来我该怎么做?

0 个答案:

没有答案