我已经开始研究神经网络,现在我正在学习使用它们来分类对象。
但我有一个疑问:
如果输入具有不同类型(例如数字和字符串),我应该如何表示输入数组?
例如,如果我必须对公寓进行分类(具有相同类型的数组(所有int)),我可以考虑卧室,浴室等的数量,所以我将有这样的数组:
[2,2,1] = [2间浴室,2间卧室,1间起居室]
然后我会将这个值标准化为0到1之间的范围,如下所示:
[1,1,0.5]
是吗?
但是如果我必须根据年龄和国籍(数字和字符串)对一组人进行分类会怎样?
第一个想法可能是将不同的国籍分配给0到1之间的特定值,但这个解决方案是否会影响分类?因为价值1的国籍可能比价值0,1的国籍更能影响结果。
假设是愚蠢的吗?谢谢你的帮助:)