应用错误收集

将角色设置为训练模型特征的正确方法是什么？

我尝试使用DecisionTreeClassifier中的sklearn.tree，在那里我将字符分成几列（因此我必须设置最大字长），转换为它们的ascii代码，然后尝试预测其音素。如下，

但是我得到的是胡说八道，而且需要花很多时间来训练。

培训数据来自CMU dictionary

或者由于我是ML的新手，是否还有其他方法可以解决这个问题？我读了一些有关音素到音素问题的论文，但是它们没有显示实现方法，因此很难将抽象思想转化为实际算法。