我一直在查看斯坦福大学的TokensRegexNER官方文档。对我来说,这是一个正确的工具,可以根据正则表达式从原始文本中提取一些模式。
问题在于我无法找到任何实施示例。他们在官方网站上提供的例子不完整。 (下面是一个例子)。没有评论可以帮助实施或者什么......
List<CoreLabel> tokens = ...;
TokenSequencePattern pattern = TokenSequencePattern.compile(...);
TokenSequenceMatcher matcher = pattern.getMatcher(tokens);
while (matcher.find()) {
String matchedString = matcher.group();
List<CoreMap> matchedTokens = matcher.groupNodes();
...
}
任何人都可以帮助我使用他们自己的示例示例吗?