标签: parsing nlp stanford-nlp
我使用Stanford CoreNLP获取选区解析树。我想知道我应该在预处理之后还是在预处理之前执行此操作。在预处理中,我将字符设置为小写,删除标点,删除停用词(例如,您,...),删除数字,保留字母等等。
我的任务是通过将每个叶子(即令牌)视为矢量嵌入来获得每个选区解析树的矢量表示。
我想知道如果我在预处理后得到选区解析树会有多大差异?
答案 0 :(得分:0)
我会在不进行自定义处理的情况下运行完整的管道。解析器将对尚未应用预处理的数据进行培训。