我有脚本从RDBMS中提取数据并填充数据仓库。有用。我想知道Temp表是如何进入的。 ETL到底有哪些步骤?即使我的数据仓库已填充,我的老师也说我们需要使用临时表。为什么这很重要?
请帮帮我。我现在很困惑。谢谢。
我们需要从两个不同地点的两个不同办事处的数据库中提取数据。我将提供下表的详细信息。
lds_job_role
job_role_id:整数
job_role_desc:varchar
key_skill_1:INEGER
key_skill_2:INEGER
key_skill_3:INEGER
recommended_sal:INTEGER
lds_account
account_id:INTEGER
acc_name:VARCHAR
acc_postcode:VARCHAR
lds_placement
placement_id:INTEGER
plt_short_desc:VARCHAR
plt_required_start_date:日期
plt_estimated_end_date:日期
plt_actual_start_date:日期
plt_renewal_no:INTEGER
plt_to_permanent:VARCHAR
max_salary:INTEGER
min_salary:INTEGER
actual_salary:INTEGER
mch_job_role
job_role_id:INTEGER
job_role_desc:VARCHAR
recommended_sal:INTEGER
mch_account
account_id:INTEGER
acc_name:VARCHAR
acc_postcode:VARCHAR
mch_placement
placement_id:INTEGER
plt_short_desc:INTEGER
plt_required_start_date:日期
plt_estimated_end_date:日期
plt_actual_start_date:日期
plt_actual_end_date:日期
plt_renewal_no:INTEGER
plt_to_permanent:VARCHAR
max_salary:INTEGER
min_salary:INTEGER
actual_salary:INTEGER
supervisor_name:VARCHAR
以下是星型模式的事实和维度:
job_roe_dim
job_role_id
job_role_desc
time_dim
time_id
年account_dim
account_id
account_name
fact_accounts
Report_id
no_of_placements
薪酬
FK1_time_id
FK2_account_id
FK3_job_role_id
该练习告诉我们要处理数据质量问题,FACT措施,标识符等等。我认为我已经用脚本完成了这个,但我不知道如何显示它。也许这就是为什么需要临时表?