我想用大型数据集训练CNN。目前我将所有数据加载到tf.constant中,然后在tf.Session()中以小批量大小循环遍历它。这适用于数据集的一小部分,但是当我增加输入大小时,我得到错误:
ValueError: Cannot create a tensor proto whose content is larger than 2GB.
我该如何避免?
答案 0 :(得分:6)
不要将数据加载到常量,它将成为计算图的一部分。
你应该宁愿:
答案 1 :(得分:4)
对于TensorFlow 1.x和Python 3,有一个简单的解决方案:
X_init = tf.placeholder(tf.float32, shape=(m_input, n_input))
X = tf.Variable(X_init)
sess.run(tf.global_variables_initializer(), feed_dict={X_init: data_for_X})
实际上,您将主要指定Graph和Session进行连续计算,以下代码将帮助您:
my_graph = tf.Graph()
sess = tf.Session(graph=my_graph)
with my_graph.as_default():
X_init = tf.placeholder(tf.float32, shape=(m_input, n_input))
X = tf.Variable(X_init)
sess.run(tf.global_variables_initializer(), feed_dict={X_init: data_for_X})
.... # build your graph with X here
.... # Do some other things here
with my_graph.as_default():
output_y = sess.run(your_graph_output, feed_dict={other_placeholder: other_data})