我正在建立一个数据库,对学校的公司进行一些历史销售/市场研究,我对基本格式和表格组织有一些问题。
我将每天分析各个销售人员的销售数据以及公司范围的统计数据和一般市场统计数据。有两种基本类型的数据集,一种用于公司/市场,一种用于各个销售人员。公司的数据基本上是时间序列,每日间隔,而销售人员数据目前在每天的单个csv中提供,并包含给定日期的每个销售人员的销售/个人统计数据。
似乎很清楚,我希望有两种不同类型的表,一种用于时间序列中的公司/市场数据,另一种用于销售人员的数据。然而,销售人员的数据可以采用以下三种形式之一:要么保持不变,要么保持不同,每天一个主键是salesperon的id,或者重新组织成每个销售人员的时间序列表。主键是日期(与公司/市场数据一样),或者所有销售人员数据(每天的所有CSV)组合成一个大表,其中包含某种具有date和saleperson-id的复合主数据。
大约有250,000行销售人员数据和大约5,000行公司/市场数据。
我的问题是两个:
首先,考虑到数据本质上属于时间序列,是否最好将此研究设置在时间序列数据库中?
第二,上面列出的销售人员数据安排的选项哪个更好?为什么?
答案 0 :(得分:-1)
这里的硬数据不足以让我理解你的问题。也许尝试从每个输入表共享一行CSV数据?根据我所读到的内容,听起来您需要一张销售员表和另一张表以销售员ID为主的表现数据。
创建表SalesPeople(first_name varchar(50),last_name varchar(50),sales_ID int) 创建表SalePerformance(sales_ID int,[date] date,sales_volume float)