作者姓名的神经网络架构作为输入?

时间:2017-11-24 13:15:07

标签: architecture neural-network author

我正在建立一个神经网络来预测一件具有广泛输入(大小,艺术媒介等)的艺术品的价值,我想将作者也包括在内(它通常是单件艺术品价值的一个重要因素。)

我目前关注的是作者的名字并不是NN的理想数字输入(即如果我只是用增加的整数值对每个作者进行编码,我会间接地为作者提供更多的价值。列表-_-)。我的想法是为我的数据集中的所有作者创建单独的输入,然后只使用一个热编码来更好地表示NN的输入。

然而,当未包括在我的训练数据中的作者被用作NN(即新作者)的输入时,该方法遇到问题。我可以和其他作者一起解决这个问题"输入字段,但我担心这不会准确,因为我没有为此输入培训NN(所有具有估价的艺术作品都有作者)。

我还没有完全考虑到这一点,但我想过或许可以培训2个NN,一个用于没有作者的估价,一个用于与作者进行估价以确保我有足够的培训数据用于& #34;无用的评估"仍然相当准确。

在我坚持实施之前,我仍然试图将最好的NN架构概念化,所以如果有人有任何建议/意见,我将非常感激!

提前致谢, 文斯

2 个答案:

答案 0 :(得分:0)

为避免在可比数字中翻译作者姓名,您可以对名称进行哈希处理,这将创建均匀分布。

答案 1 :(得分:0)

尝试使用艺术家名称的one-hot encoding

这是categorical feature

的示例