格式化培训数据以实现空间文本分类

时间:2018-07-27 19:26:44

标签: json nlp spacy

我一直在使用快速文本进行个人项目(用于文本分类),并将训练数据的格式设置为:

标签 [text ....]

这是我现有培训数据的每一行。作为免责声明,我对NLP和培训数据格式比较陌生。我想知道是否有人可以提供有关如何正确格式化现有培训数据以用于spacy文本分类程序的建议。通过阅读他们的文档,我了解到接受的数据格式是JSON格式。可能打算将GoldParse工具用于此任务吗?

编辑:在此处找到有关此主题的一些帮助:How do I create gold data for TextCategorizer training?

0 个答案:

没有答案