表示图像到类别映射所需的位

时间:2019-02-11 11:26:05

标签: deep-learning computer-vision byte bit

您想将尺寸为64 x 64的每个可能的图像映射到一个二进制类别(猫或非猫)。每个图像都有3个通道,每个通道中的每个像素可以取0(至255)之间(包括0和255)的整数值。 来源:http://cs230.stanford.edu/files/cs230exam_win18.pdf

我将假设每个像素值占用8位时间,每个图像每个图像占用64 ^ 2个像素,每个通道占用3个像素,再加上各个类别的总和:8 * 64 ^ 2 * 3 + 1。

但是,正确的解决方案是256 ^ {3×64×64}。我想念什么?预先感谢。

2 个答案:

答案 0 :(得分:0)

使用64x64图片和3频道,您有64x64x3个单位需要填充。
对于第一个单位,您可以用256值(0255)填充它
对于第二个单位,您可以使用256值填充它
因此,您可以256x256=256^2的方式填充前两个单位,因为您可以选择整数的任意组合。 同样,您可以用256x56x256=256^3方式填充前三个单元。
因此,您可以用256^(64x64x3)方式填充所有单位,即整个图像,因为您可以为每个64x64x3单位选择256个选项。

答案 1 :(得分:0)

我认为大多数人都错过了问题的第一行:

“您想将尺寸为64 x 64的所有图像映射到二进制类别(猫或非猫)”

如果问题询问要映射一张图片需要多少位,那么您的答案是正确的:256 * 64 * 64 * 3

但是,该问题询问了映射所有可能组合所需的位数,因此正确答案应该是:256 ^(64 * 64 * 3)