Tensorflow实现银行交易分类

时间:2019-07-12 06:54:08

标签: python tensorflow machine-learning

我正在构建一个简单的机器学习模型,该模型将银行交易作为输入(请参见下面的功能),并且我想预测支出类别(标签)。我已经完成了一些初学者的教程,例如ML Crash CourseText Classification GuidesWord Embeddings等。

以下是示例输入数据:

Date;Sender / Recipient;IBAN / Account#;BIC / Bank Code;Text;Amount;Category
02.07.2019;Tesco Market;HSVSDDMM;Grocery Market London Heathrow - Thank you for purchase;-48.06;Groceries

我的目标是预测Category,例如Groceries等。到目前为止,借助TensorFlow,我走得很远:

from __future__ import absolute_import, division, print_function, unicode_literals
import tensorflow as tf
import pandas as pd
URL = "transactions-0263445.csv"
dataframe = pd.read_csv(URL, sep=';')


# Build the keras Sequential model
model = Sequential()
model.add(...)
model.add(Activation(...))

# Train and evaluate the model

如何构建sequential model?我对指定输入形状感到困惑。

1 个答案:

答案 0 :(得分:0)

这似乎是一个分类问题,但是您的问题对我来说有些问题,在将所有数据转储到模型中之前,需要采取一些步骤。

问题是我看不到数据的预处理,您正在使用所有功能吗?是否需要缩放?您需要编码一些数据吗?在创建模型之前,有很多事情要看。

在这种情况下,我猜您的主要特征是文字? 这是如何执行此操作的不错指南: https://medium.com/data-from-the-trenches/text-classification-the-first-step-toward-nlp-mastery-f5f95d525d73

或您自己的链接: https://medium.com/data-from-the-trenches/text-classification-the-first-step-toward-nlp-mastery-f5f95d525d73

然后,您可以构建和训练: https://developers.google.com/machine-learning/guides/text-classification/step-4

仔细检查这些内容,您将可以得到目前缺少的东西。