我正在开发一个项目,我需要使用SSAS分析Apache日志。我已经将数据加载到临时表中。我创建了维度表(主键和attibute_name),空事实表(每个维度表和fact_attribute的外键)并创建了它们之间的关系。然后我使用
将该表中的数据拆分为维度表INSERT INTO DimIP (IP) SELECT DISTINCT RemoteHostName FROM tmp
......等等。
现在我需要使用外键填充Fact表,但我不知道如何使用单个查询执行此操作。我试过这样的事情:
INSERT INTO Facts (DimDateID, DimIPID, DimRefererID, DimRequestID, DimStatusCodeID, DimUserAgentID)
SELECT DimDate.ID WHERE (DimDate.Data = tmp.DateTime)
SELECT DimIP.ID WHERE (DimIP.IP = tmp.RemoteHostName)
SELECT DimReferer.ID WHERE (DimReferer.Referer = tmp.Referer)
SELECT DimRequest.ID WHERE (DimRequest.Request = tmp.Request)
SELECT DimStatusCode.ID WHERE (DimStatusCode.StatusCode = tmp.StatusCode)
SELECT DimUserAgent.ID WHERE (DimUserAgent.UserAgent = tmp.UserAgent)
但它不起作用(它表示插入列表包含的项目少于选择列表),可能我不能使用这样的语法。
我尝试一个接一个地做,像这样:
INSERT INTO Facts (DimDateID)
SELECT DimDate.ID WHERE (DimDate.Data = tmp.DateTime)
但有时它说其他列不能为NULL(例如DimUserAgentID),因此查询失败,有时会执行查询,说“受影响的806000行”但没有插入任何内容。
我将非常感谢你的帮助,因为我已经从头上撕下了一半的头发,不知道如何用尺寸表中的外键填充事实表。
答案 0 :(得分:2)
我相信您需要做的是在查询中引用其他表。下面我使用tmp
作为查询的主要驱动程序,然后尝试根据您提供的逻辑查找生成的ID。这些查找是通过LEFT OUTER JOIN
来进行的,这意味着关系可能不存在,在这种情况下,NULL将进入您的事实表。如果您希望过滤掉事实表中的行,请用INNER JOIN
替换所有出现的事件。我还假设你的表都是dbo架构。
INSERT INTO
dbo.Facts
(
DimDateID
, DimIPID
, DimRefererID
, DimRequestID
, DimStatusCodeID
, DimUserAgentID
)
SELECT
DimDate.ID
, DimIP.ID
, DimReferer.ID
, DimRequest.ID
, DimStatusCode.ID
, DimUserAgent.ID
FROM
TMP T
LEFT OUTER JOIN
dbo.DimDate
ON DimDate.Data = T.DateTime
LEFT OUTER JOIN
dbo.DimIP
ON DimIP.IP = T.RemoteHostName
LEFT OUTER JOIN
dbo.DimReferer
ON DimReferer.Referer = T.Referer
LEFT OUTER JOIN
dbo.DimRequest
ON DimRequest.Request = T.Request
LEFT OUTER JOIN
dbo.DimStatusCode
ON DimStatusCode.StatusCode = T.StatusCode
LEFT OUTER JOIN
dbo.DimUserAgent
ON DimUserAgent.UserAgent = T.UserAgent
最后,你似乎错过了一些可衡量的东西,除非你只计算Facts
表中的行。