将两次调用的结果连接到tf.contrib.learn.datasets.base.load_csv_with_header

时间:2016-10-27 10:08:34

标签: python tensorflow

我正在尝试将两次调用的结果连接到tf.contrib.learn.datasets.base.load_csv_with_header。我必须这样做是因为我在Juypter Notebook服务器上不能有大于25MB的文件,所以我必须将它们分成两部分。

目前我正在尝试这样做,但它只是提供tuple


import tensorflow as tf
import numpy as np
import pandas
import time

# Data sets
TRAINING1 = "data/tensorflow/matching/xaa"
TRAINING2 = "data/tensorflow/matching/xab"

training_set1 = tf.contrib.learn.datasets.base.load_csv_with_header(
    filename=TRAINING1,
    target_dtype=np.int,
    features_dtype=np.float32
    )

training_set2 = tf.contrib.learn.datasets.base.load_csv_with_header(
    filename=TRAINING2,
    target_dtype=np.int,
    features_dtype=np.float32
    )

training_set = training_set1 + training_set2

我确信这是一个相当简单的问题,但我找不到答案。

1 个答案:

答案 0 :(得分:0)

所以我找到了另一种方法。从以后的脚本开始,我将datatarget部分分开,就像这样简单:

my_x = training_set1.data + training_set2.data
my_y = training_set1.target + training_set2.target