用于keras model.fit_generator的拆分图像数据集

时间:2018-02-11 05:24:30

标签: tensorflow deep-learning keras

我有一个目录,数据集,其中包含图像的子文件夹(标签/类) 这是数据集中动物图像的子文件夹:

我想将数据集拆分为model.fit_generotar()的训练和测试集。

我该怎么做?

1 个答案:

答案 0 :(得分:1)

使用function f1() { var newpass = document.getElementById('npass').value; var confirmpass = document.getElementById('cpass').value; if(newpass!=confirmpass) { document.getElementById('npass').value = ""; document.getElementById('cpass').value = ""; alert("Password Mismatch. Please enter again!"); //window.location.href = "/file.html"; // window.location = 'file.html'; // window.location.replace('file.html'); //window.location.assign("file.html"); //window.location.href = "file.html"; } else { alert("Password Match"); // window.location.href= "/file.html"; // document.write("check"); } } </script> <form method="POST" onsubmit="f1()"> <label for="npass">New Password:</label> <input type="password" id="npass" placeholder="Enter New Password" name="newpassword" required="required" size="8"> <label for="cpass">Confirm Password:</label> <input type="password" id="cpass" placeholder="Confirm New Password" name="cpass" required="required" size="8"><br><br> <input type="submit" class="btn btn-info" name="submit" value="Submit"> </form> 获取文件路径迭代器。

然后,您可以使用glob的训练测试分割来获取训练和测试数据路径(使用scikit-learn参数在测试/训练中获得与整个数据集中相同的类分布。)< / p>

结果将是两个路径列表,您可以将其写入相应的测试/训练文件夹,然后您可以应用生成器的stratify方法。

编辑:

第二种方法是不使用flow_from_directory,而是加载列车/测试集(加载所有内容并使用flow_from_directory方法或使用我之前描述过的方法),然后使用generator's {{ 1}}方法。

另请注意,您可能不希望将生成器用于测试/验证数据,因为它会使得比较准确性很难,因为您没有固定的有效/测试集。