我是机器学习的新手。我只是偶然发现了“训练实例”这个术语。在一篇关于使用CNN进行图像分割的论文中。在该论文中,总共1100个图像用于建模。作者从图像中选择了子区域进行训练,并提出了超过500K训练实例的分类性能曲线。我很困惑他们只从1100张图片中获得如此大量的训练实例。一个培训实例是指一个培训样本还是与培训规模相关的其他内容?
答案 0 :(得分:2)
您可以将培训实例可视化为培训批次。如果要测试数百万个数据集,您不希望同时在实例或批处理中执行所有这些操作。
如果您拍摄'n'张图像并将每张图片拆分为“m”子部分,您将获得<ul>
<?php
foreach ($files as $key => $file) {
$f = pathinfo($file['name']);
echo '<li>';
echo $f['filename'].' - '.$f['extension'].'('.$file['size'].')';
echo '</li>';
}
?>
</ul>
个子部分。
所以在你的情况下假设我们将每个图像分成4096个部分(为什么4096,因为它甚至是64x64网格分割)我们将得到 1100 * 4096 = 4505600给定训练数据的子部分。
要获得500K实例或训练数据子集,我们只需将4505600除以500k即可获得9张图像。
因此,我们将在每个500k子集中获得大约9个图像。
如果图像在像素分辨率方面足够密集并因此尺寸较大,则可以进一步增加子部分以在每个训练批次或实例中获得更多数量的图像。