从python中的本地目录导入训练数据

时间:2017-08-12 22:19:55

标签: python tensorflow

我需要将一些训练数据从我的本地目录导入到python程序中。目前我正在学习一个教程,在本教程中,数据是借助以下代码导入的:

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot = True) 

但我的问题是我的数据存在于我的本地目录中,所以我不能使用这种方法。我们将非常感谢您的帮助。我的本地目录包含多个文件,我必须通过一个变量将它们全部导入。

2 个答案:

答案 0 :(得分:1)

在您放置所有数据的本地目录中创建一个文件夹data,然后您可以使用./data来引用它。然后,要访问本地data文件夹,以下内容应该有效:

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("./data/", one_hot = True) 

您也可以通过编程方式获取当前目录,然后按如下方式构建数据目录的路径

import os 

# get the current directory 
current_directory = os.path.join(os.path.dirname(__file__))

# create the path to the data directory within the current directory
data_directory = os.path.join(current_directory, "data")

然后,按如下方式编辑代码:

import os 
from tensorflow.examples.tutorials.mnist import input_data

# get the current directory 
current_directory = os.path.join(os.path.dirname(__file__))

# create the path to the data directory within the current directory
data_directory = os.path.join(current_directory, "data")

mnist = input_data.read_data_sets(data_directory, one_hot = True) 

编辑:根据您的评论,您询问如何在tensorflow中加载自己的数据:

根据文档中的建议,如果您是TF新手,最好从本教程开始:

答案 1 :(得分:0)

我在scikit的帮助下解决了这个问题。首先安装它,然后使用以下代码从本地目录中读取文件

 import sklearn.datasets
 data = sklearn.datasets.load_files(path, shuffle='False')