Question

validation_split说：＆＃34; 嘿，它给我所有的输入数据 - 我将负责在测试和验证之间进行拆分＆＃34;。

model.fit(inputX, inputY, validation_split=0.20, epochs=10, batch_size=10)

validation_data说＆＃34; 请明确告诉我验证数据＆＃34;

model.fit(inputX, inputY, validation_data=(testX,testY), epochs=10, batch_size=10)

除了我的理解之外，是否有任何隐藏的伎俩或遗漏的东西？

Answer 1

不，一切都是正确的。这种分离背后的一个潜在原因是，人们有时会分别获得培训和验证数据（在许多学术数据集中），有时您拥有所有数据，并且可以随意拆分。

Answer 2

您的理解是正确的。要添加更多详细信息- v alidation_split keras函数使用户可以轻松地将训练数据集分为训练和验证（节省您的自定义工作）。

例如-设置 validation_split = 0.2 ，告诉keras在改组进行验证之前使用最后20％的数据。

Answer 3

在处理不平衡的数据集时，我只会添加一些重要的内容。使用 validation_split 不会保留每个类的百分比。通常，您将执行自己的 validation_data ，因此您要保留这些百分比。此外，我建议StratifiedShuffleSplit这样做。

Answer 4

如果使用validation_data选项，则需要准备验证数据并分别训练数据，这将花费更多的精力。之后，validation_split选项允许您仅输入整堆数据并将其拆分到内部。以某种方式，最好节省时间。