具有有效贷款数据的hadoop用例

时间:2014-06-16 04:18:39

标签: hadoop use-case

我有一些 - 在TXT文件中贷款收购的重要数据集 注 - 过去3年我可以获得Q1-Q4数据。

另请在图像文件中找到“采集文件”的每列的字段描述。

1)您能否帮助我生成一些有效的逻辑业务用例,我希望使用HDFS和Mapreduce JAVA编程来实现。

因为大多数样本都使用套管 - 与字数统计和天气数据分析有关。

要获取数据文件 - 只需登录

数据 - 文件

链接---------- loanperformancedata.fanniemae.com/lppub-docs/acquisition-sample-file.txt

100009503314 |记者| WARS FARGO BANK,NA | 3.75 | 320000 | 360 | 12/2011 | 02/2012 | 67 | 67 | 1 | 32 | 798 |没有|购买| PUD | 1 | PRINCIPAL | CA | 949 || FRM

100010175842 |零售|其他| 3.875 | 255000 | 360 | 02/2012 | 04/2012 | 73 | 73 | 1 | 49 | 778 |否|没有现金退还| SF | 1 | PRINCIPAL | OH | 432 || FRM

100013227768 |经纪| FLAGSTAR CAPITAL MARKETS CORPORATION | 3.875 | 415000 | 360 | 12/2011 | 03/2012 | 46 | 46 | 2 | 21 | 780 | NO |没有现金退还| PUD | 1 | PRINCIPAL | VA | 223 || FRM

100016880542 |零售| WELLS FARGO BANK,NA | 4.25 | 417000 | 360 | 11/2011 | 012012 | 90 | 90 | 2 | 40 | 794 | NO |购买| SF | 1 | PRINCIPAL | CA | 956 | 25 | FRM

2)数据的列描述

link - loanperformancedata.fanniemae.com/lppub-docs/lppub_file_layout.pdf

贷款标识 渠道 卖家名称 原始利率 原始不支付的主要平衡(UPB) 原始贷款期限 原始日期 第一次付款日期 原始贷款价值(LTV) 原始组合贷款 - 价值 借款人数量 债务 - 比率 信用评分 首次购房者指标 贷款目的 财产类型 单位数 占用状况 财产状况 ZIP(3-DIGIT) 按揭保险百分比 产品类型

link -------> loanperformancedata.fanniemae.com/lppub-docs/lppub_glossary.pdf

请帮助我 - 构建一些有效的业务用例和Java程序来实现相同的目标。

- Hadoop的大部分数据是 - 天气计数和字数统计示例:(

1 个答案:

答案 0 :(得分:0)

您可以进行简单的过滤和汇总,以确定具有最大贷款数量和最低信用评分的州。这可以提供洞察力,以确定在违约率高得多的情况下批准贷款的问题。