应用错误收集

通常我可以通过分割句子并将其标记化来实现，但有一个例子：

“士兵来了......我......你必须去。”

标记

有/ EX 说到/ VBZ 在/ DT 战士/ NN ... /： I./NNP ./。 ./.

你/ PRP 必须/ MD 去/ VB ./。解析

（ROOT （S （NP（EX那里））（副总裁（VBZ来）（NP （NP（DT）（NN士兵））（：......）（NP（NNP I.）（。）））））（。））））

（ROOT （S （NP（PRP你））（VP必须）（VP（VB go）））（。））））

普遍依赖

expl（来2，有-1） root（ROOT-0，来-2） det（士兵-4，the-3） dobj（来2，士兵-4） dep（士兵-4，I.-6）

nsubj（go-3，you-1） aux（go-3，must-2） root（ROOT-0，go-3）

句子不会停在第一个“......”，而是停在第二个。因此，在这种情况下，轻松拆分句子并计算令牌数量将无济于事。（因为它会将此视为三句话。）

我可以知道哪个解析树属于一个令牌吗？或者解析树是这个例子的子串？或者直接在这个例子中标签的位置（三个句子）？