我的目的是开发一个数据仓库,我从dblp (computer science bibliography website)下载了一个XML文件。 然后,我使用SAX XML解析器解析了该XML文件。
解析后,我现在有以下实体(不会故意打印关闭标签):
<dblp>
<www mdate key>
<author>
<title>
<url>
<year>
<inproceedings mdate key>
<author>
<title>
<month>
<year>
<pages>
<booktitle>
<url>
<note>
<cdrom>
<article mdate key>
<author>
<author>
<title>
<journal>
<volume>
<month>
<year>
<book mdate key>
<author>
<title>
<year>
<publisher>
<isbn>
<url>
<incollection mdate key publtype>
<author>
<author>
<author>
<title>
<year>
<booktitle>
<ee>
<crossref>
<url>
<proceedings mdate key>
<editor>
<editor>
<editor>
<title>
<booktitle>
<volume>
<series href>
<year>
<isbn>
<publisher>
<url>
根据mu知识,现在下一步是从这些实体开发一个维度模型(星型模式),但我不明白我是如何用这么多数据做到的。 (注意:这是我的第一个数据仓库项目)
这些数据足够吗? 我有什么需要照顾的?
接下来我该怎么做?