有关实体标尺的令牌规则的文档不是很详细。
似乎Matcher只允许令牌属性的子集,并且必须以全大写形式指定它们,例如{“ IS_PUNCT”:True},而实体标尺似乎允许使用原始属性名称,例如“ is_punct”:是,还允许匹配器中不可用的其他属性,例如“ whitespace_”或“ is_left_punct”?
另一方面,匹配器的令牌规则可以具有类似{“ <=”:10}的值,这也适用于实体标尺吗?那正则表达式或量词/运算符呢?
我发现匹配器要求使用属性的全部上层子集非常奇怪和有限,为什么要这样实现?