如何在填充星型模式期间为ETL使用临时表?

时间:2016-02-03 07:26:14

标签: database etl data-warehouse star-schema fact-table

我有脚本从RDBMS中提取数据并填充数据仓库。有用。我想知道Temp表是如何进入的。 ETL到底有哪些步骤?即使我的数据仓库已填充,我的老师也说我们需要使用临时表。为什么这很重要?

请帮帮我。我现在很困惑。谢谢。

我们需要从两个不同地点的两个不同办事处的数据库中提取数据。我将提供下表的详细信息。

  

lds_job_role

     

job_role_id:整数
job_role_desc:varchar
  key_skill_1:INEGER
key_skill_2:INEGER
key_skill_3:INEGER
  recommended_sal:INTEGER

     

lds_account

     

account_id:INTEGER
acc_name:VARCHAR
acc_postcode:VARCHAR

     

lds_placement

     

placement_id:INTEGER
plt_short_desc:VARCHAR
  plt_required_start_date:日期
plt_estimated_end_date:日期
  plt_actual_start_date:日期
plt_renewal_no:INTEGER
  plt_to_permanent:VARCHAR
max_salary:INTEGER
  min_salary:INTEGER
actual_salary:INTEGER

     

mch_job_role

     

job_role_id:INTEGER
job_role_desc:VARCHAR
  recommended_sal:INTEGER

     

mch_account

     

account_id:INTEGER
acc_name:VARCHAR
acc_postcode:VARCHAR

     

mch_placement

     

placement_id:INTEGER
plt_short_desc:INTEGER
  plt_required_start_date:日期
plt_estimated_end_date:日期
  plt_actual_start_date:日期
plt_actual_end_date:日期
  plt_renewal_no:INTEGER
plt_to_permanent:VARCHAR
  max_salary:INTEGER
min_salary:INTEGER
  actual_salary:INTEGER
supervisor_name:VARCHAR

     

以下是星型模式的事实和维度:

     

job_roe_dim

     

job_role_id
job_role_desc

     

time_dim

     

time_id

     

account_dim

     

account_id
account_name

     

fact_accounts

     

Report_id
no_of_placements
薪酬
FK1_time_id
  FK2_account_id
FK3_job_role_id

该练习告诉我们要处理数据质量问题,FACT措施,标识符等等。我认为我已经用脚本完成了这个,但我不知道如何显示它。也许这就是为什么需要临时表?

0 个答案:

没有答案