假设我想通过以下映射的方式,通过培训CNN培训套房图像来了解房屋的建造时间:
Input Pictures [244, 244, 3] -> Output Year [1850, 1850, ... , 2018]
这是一个受监督的学习问题,所以标签是已知的(1850年至1818年)。
我是否会构建分类或回归分类器来解决此问题?我不确定,因为我从1850年到1818年没有每年的输入,但我希望分类器输出我在训练结束后给分类器的新图片的所有值。所以这会指向一个回归分类。
另一方面,我不希望分类器输出连续的Y,因为我对建筑物建造的具体年份感兴趣。不是中间值。
对此的答案可能非常简单,但我无法弄明白。
答案 0 :(得分:2)
这显然是回归问题。如果您将每年视为单独的课程,则课程1900
和2017
将同样接近2018
(数值无关紧要分类)。但显然有两个预测 - 2017
vs 1900
,当真正的标签是2018
时 - 是非常不同的。此外,回归问题将允许您概括到看不见的年份,正如您所说的那样。如果培训中没有这些课程,这在分类中几乎是不可能的。
如果您的最终结果必须是整数,我建议您实现回归输出的解释。例如,如果它在某个范围内,则可以返回一个圆值,否则返回两年(当模型不确定时):
regression_output=2000.23 -> result_year=2000
regression_output=2000.96 -> result_year=2001
regression_output=2000.45 -> result_year=2000/2001
这样你就可以再调整一个参数。例如,拥有tolerance=0.5
将使您的模型始终确定。