所以我的问题是关于我所面临的一个特殊问题,即我必须在当前工作中工作的一个领域。
域名是信用卡交易。因此它在交易级别上是独一无二的。但是一个人可能正在进行多笔交易。现在显然每笔交易都不一样。
所以我有这个基本的特征数据集,我可以轻松管理。从这个数据集中,我想要评估跨段的客户级别性能,这些性能应该易于访问,而无需为不同的变量组合运行我的代码。基本上,我瞄准的目标是达到客户级别的观点,这不会导致帐户方面的任何信息丢失,我仍然可以在各个细分市场中查看客户级别的绩效。< / p>
你们有没有做过类似的分析?或者你对我该怎么做这个有什么好主意吗?我不知道这个解释是多么清醒,但如果你需要进一步解释,请告诉我。谢谢你的帮助!
答案 0 :(得分:0)
假设您有来自10个客户的30个交易的数据(每个交易3个交易)。在关系数据库中(通常在SAS中也是一个好主意),您通常会有一个事务表(包含列transactionID,customerID,transactionDate,transactionAmount)和一个customer表(包含customerID,customerName,customerSegment等列) 。这是数据库规范化的一部分。您将事务级数据与客户级数据分开。
如果您是PROC SQL的粉丝,那么该设置在SAS中将很适合您。如果要分析某个customerSegment的事务,只需加入表(或子查询或其他)。
SAS中的另一个选项是通过customerID合并两个表,创建一个每个事务有一个记录的数据集,并且有一些变量是事务的属性,其他变量是客户的属性。可能看起来像:
custID transID transDate transAmount customerSegment customerDOB
1 1 1/1/2015 100 A 1/1/1990
1 2 1/2/2015 50 A 1/1/1990
1 3 1/3/2015 75 A 1/1/1990
2 4 1/1/2015 10 B 12/12/1950
2 5 1/2/2015 5 B 12/12/1950
2 6 1/3/2015 75 B 12/12/1950
这是效率较低的存储(并且标准化程度较低),因为对于来自同一客户的每个交易,都会重复客户属性的值。但是,当您希望按客户属性分析交易数据时,它可以使生活更轻松。
有关此内容的更多信息,请参阅Google数据库规范化。 Toby Dunn有一些关于SAS标准化的好文章,例如: http://analytics.ncsu.edu/sesug/2007/TU03.pdf