应用错误收集

我正在研究一个波斯分类项目。波斯文本与阿拉伯文本非常相似。当我使用Tokenize时，它没有在wordlist页面和Example Set Page中显示任何单词，下面的图片将会显示：

我需要将波斯文本分类到某个类别，但我不知道如何？。

我遵循以下一些步骤：

1-读取Excel（使用Read Excel组件）数据集，其中包含2列=＆gt; col1：persian Text，col2：Category

2-我使用Set role组件来标记数据

3-我使用来自数据组件的处理文档，其中包含：（Tokenize（任何模式不改变任何模式）和Filter Token（min：5，max：25））

4-然后我使用交叉验证组件来训练SVM或Basian并在测试模式下获得性能。

该程序运行正常，性能也不错，例如准确率为50％，但我认为我的工作是错误的。

任何帮助都将不胜感激。