标签: nlp stanford-nlp spacy opennlp
我获得了用于信息提取的语料库数据。计数以百万计。而是我手动做注释,训练并验证结果。有没有一种方法/方法可以检查训练数据的完整性,例如句子长度等,
我的语料库中平均句子长度为7个单词就足够了。
或
应该假设语料库始终是正确的数据。
谢谢