用于预测薪水的任何统计或机器学习方法

时间:2017-08-01 09:48:36

标签: machine-learning statistics

我在FinTech公司工作。我们为客户提供贷款。想要申请贷款的客户必须在我们的应用程序中填写一些信息,其中一个信息是薪资信息。使用网页编制,我们能够在过去的3-7个月内获取客户的银行交易数据。

使用任何统计或机器学习技术,我如何轻松发现客户银行交易数据中的工资金额(或几乎相同)?我应该为每个客户制作一个模型(逻辑),还是只有一个模型适用于所有客户?

请告知

1 个答案:

答案 0 :(得分:2)

我认为你不需要机器学习。

  1. 在所有交易列表中,只保留那些为帐户添加资金的内容,而不是从帐户中减去款项
  2. 将所有数字舍入到一定的准确度(例如2510美元 - > 2500美元)
  3. 构建一个数据集,其中包含每天添加到帐户的总金额。换句话说,按天分组交易,并在需要的地方添加0
  4. 应用离散傅立叶变换以查找此时间序列中的周期性分量
  5. 应该只有1个周期性项目,每30天重复一次
  6. 将所有其他周期性重复项的值设置为0
  7. 应用反离散傅立叶变换以仅获得每28/30天重复的信息
  8. 有关傅立叶变换的更多信息,请查看https://en.wikipedia.org/wiki/Fourier_transform

    对于一个实际例子(使用MatLab), 查看 https://nl.mathworks.com/help/matlab/examples/fft-for-spectral-analysis.html?requestedDomain=www.mathworks.com

    它显示了如何给出时间信号的频率分解。如果应用相同的逻辑,则可以使用此频率分解来确定哪些频率占主导地位(通常工资将是其中之一)。