使用pybrain,不可能在数据集中使用字母作为输入。例如,如果我这样做:
from pybrain.datasets import ClassificationDataSet
ds = ClassificationDataSet(2)
ds.addSample(('a','b'),1)
我明白了:
ValueError: could not convert string to float: a
将每个字母转换为整数并将这些整数作为pybrain的特征是否有意义?例如,字母a为1,字母z为26。
我对此的关注是,字母之间存在0关系,我不确定替换字符串中每个位置的数字是否会被神经网络错误地视为更多/更少量的某些特征。