交易级别数据的帐户级别视图

时间:2016-09-30 20:56:55

标签: transactions sas large-data

所以我的问题是关于我所面临的一个特殊问题,即我必须在当前工作中工作的一个领域。

域名是信用卡交易。因此它在交易级别上是独一无二的。但是一个人可能正在进行多笔交易。现在显然每笔交易都不一样。

所以我有这个基本的特征数据集,我可以轻松管理。从这个数据集中,我想要评估跨段的客户级别性能,这些性能应该易于访问,而无需为不同的变量组合运行我的代码。基本上,我瞄准的目标是达到客户级别的观点,这不会导致帐户方面的任何信息丢失,我仍然可以在各个细分市场中查看客户级别的绩效。< / p>

你们有没有做过类似的分析?或者你对我该怎么做这个有什么好主意吗?我不知道这个解释是多么清醒,但如果你需要进一步解释,请告诉我。谢谢你的帮助!

1 个答案:

答案 0 :(得分:0)

假设您有来自10个客户的30个交易的数据(每个交易3个交易)。在关系数据库中(通常在SAS中也是一个好主意),您通常会有一个事务表(包含列transactionID,customerID,transactionDate,transactionAmount)和一个customer表(包含customerID,customerName,customerSegment等列) 。这是数据库规范化的一部分。您将事务级数据与客户级数据分开。

如果您是PROC SQL的粉丝,那么该设置在SAS中将很适合您。如果要分析某个customerSegment的事务,只需加入表(或子查询或其他)。

SAS中的另一个选项是通过customerID合并两个表,创建一个每个事务有一个记录的数据集,并且有一些变量是事务的属性,其他变量是客户的属性。可能看起来像:

custID  transID  transDate  transAmount  customerSegment  customerDOB
1       1        1/1/2015   100          A                1/1/1990
1       2        1/2/2015   50           A                1/1/1990
1       3        1/3/2015   75           A                1/1/1990
2       4        1/1/2015   10           B                12/12/1950
2       5        1/2/2015   5            B                12/12/1950
2       6        1/3/2015   75           B                12/12/1950

这是效率较低的存储(并且标准化程度较低),因为对于来自同一客户的每个交易,都会重复客户属性的值。但是,当您希望按客户属性分析交易数据时,它可以使生活更轻松。

有关此内容的更多信息,请参阅Google数据库规范化。 Toby Dunn有一些关于SAS标准化的好文章,例如: http://analytics.ncsu.edu/sesug/2007/TU03.pdf