在研究论文中难以理解图像中的补丁数量

时间:2018-05-16 18:49:35

标签: tensorflow computer-vision

我想了解一篇关于暗影检测link)的论文。

第3.4节中,作者提到,给定一个图像,他们会创建一批训练实例,其中批处理包括: -

  1. 原始图像调整为256×256像素。
  2. 修补原始图像大小的3/4 步幅为20,下采样到256×256。
  3. 原始图像的256×256个补丁,采样 20步。
  4. 平均而言,每张图片可获得13个训练实例/补丁。

    如果我理解正确,他们分别使用了tf.extract_image_patches函数,其中ksizes为[1, 0.75*image_height, 0.75*image_width, 1][1, 256, 256, 1]为第2部分和第3部分,并且为[1, 20, 20, 1]

    我尝试使用上面提到的ksizesstrides运行上述功能,但我从训练数据中得到每个图像平均267个补丁。超过 90%的图片分别有heightwidth 300 。本文使用 SBU阴影数据集link)。

    所以我不确定作者声称每张图片平均只有13个补丁。

    这里的任何帮助都会帮助我加快阅读和理解论文。

    提前致谢

0 个答案:

没有答案