无法使用神经网络解释预测

时间:2019-08-29 15:51:39

标签: python tensorflow deep-learning

我正在尝试在python中使用TensorFlow,以对加密货币数据进行一些预测。问题在于预测的输出就像是0.1-0.9的数字,而加密货币数据应该是10000-10100的格式,而且我找不到将0. *数字转换为真实数字的解决方案。

我尝试创建一个比率,从预测值中减去最大-最小值,从测试数据中得出-min-min,然后除以一个比率,但是当我将此比率与预测相乘时,会有很大的错误率(找到一个14000号而不是10000个)

以下代码:

train_start = 0
train_end = int(np.floor(0.7*n))
test_start = train_end
test_end = n
data_train = data[np.arange(train_start, train_end), :]
data_test = data[np.arange(test_start, test_end), :]


Scale data:

from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
data_train = scaler.fit_transform(data_train)
data_test = scaler.transform(data_test)

Build X and y:

X_train = data_train[:, 1:]
y_train = data_train[:, 0]
X_test = data_test[:, 1:]
y_test = data_test[:, 0]

.
.
.

n_data = 10
n_neurons_1 = 1024
n_neurons_2 = 512
n_neurons_3 = 256
n_neurons_4 = 128
n_target = 1
X = tf.compat.v1.placeholder(dtype=tf.compat.v1.float32, shape=[None, n_data])
Y = tf.compat.v1.placeholder(dtype=tf.compat.v1.float32, shape=[None])

Hidden layer
..
Output layer (must be transposed)
..
Cost function
..
Optimizer
..

Make Session:

sess = tf.compat.v1.Session()

Run initializer:

sess.run(tf.compat.v1.global_variables_initializer())

Setup interactive plot:

plt.ion()
fig = plt.figure()
ax1 = fig.add_subplot(111)
line1, = ax1.plot(y_test)
line2, = ax1.plot(y_test*0.5)
plt.show()


epochs = 10
batch_size = 256
for e in range(epochs):

# Shuffle training data
shuffle_indices = np.random.permutation(np.arange(len(y_train)))
X_train = X_train[shuffle_indices]
y_train = y_train[shuffle_indices]

# Minibatch training
for i in range(0, len(y_train) // batch_size):
    start = i * batch_size
    batch_x = X_train[start:start + batch_size]
    batch_y = y_train[start:start + batch_size]
    # Run optimizer with batch
    sess.run(opt, feed_dict={X: batch_x, Y: batch_y})

    # Show progress
    if np.mod(i, 5) == 0:
        # Prediction
        pred = sess.run(out, feed_dict={X: X_test})

        #This pred var is the output of the prediction 

我将结果保留在文件中,这就是它的样子:

2019-08-21 06-AM; 15310.444858356934; 0.50021994;

2019-08-21 12-PM; 14287.717187390663; 0.46680558;

2019-08-21 06-PM; 14104.63871795706; 0.46082407;

例如,最后的预测是0.46,但是当我尝试将其转换时,我发现14104,而它应该更接近10000值

有人知道如何转换这些预测吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

您将不得不使用MinMaxScaler中的inverse_transform来转换回您所获得的0-1范围内的输出。

您还没有给出模型,但是我相信您正在使用很少密集层的回归任务。您将必须保持损失最小化。如果使用均方误差,则损失越大,则输出与预期结果集相距遥远的可能性就越大。

即使损失很小,并且对于火车样本来说结果是好的,但是对于测试数据集来说预测是不利的,您可能还必须考虑增加火车数据集,以便涵盖更多的可能性。如果不可能,请考虑减少神经网络中神经元的数量,以使其停止过度拟合。

您可以进行一些后处理,以将输出限制在所需的范围内。