标签: python scikit-learn
将角色设置为训练模型特征的正确方法是什么?
我尝试使用DecisionTreeClassifier中的sklearn.tree,在那里我将字符分成几列(因此我必须设置最大字长),转换为它们的ascii代码,然后尝试预测其音素。如下,
DecisionTreeClassifier
sklearn.tree
但是我得到的是胡说八道,而且需要花很多时间来训练。
培训数据来自CMU dictionary
或者由于我是ML的新手,是否还有其他方法可以解决这个问题?我读了一些有关音素到音素问题的论文,但是它们没有显示实现方法,因此很难将抽象思想转化为实际算法。