我想构建一个基于我创建的数据训练的神经网络。我的问题是这些数据应该具有什么形式?换句话说,keras是否允许将字符串/字符作为输入的神经网络?如果没有,并且只能接受输入/输出应在什么范围内的数字?
答案 0 :(得分:1)
输入数据即功能的唯一条件是它应该是数字的。对范围没有任何限制,但做Feature Scaling,Normalization等总是一个好主意,以确保我们的模型不会混淆。神经网络或其他机器学习方法不能直接接受字符串(字符,单词),因此,您需要先将字符串转换为数字。有很多方法可以做到这一点,最常见的技术包括Bag of Words,tf-idf功能,word embeddings等。 以下教程(使用scikit)可能是一个很好的起点: