需要从Java中的源字符串中提取出标签字符串。任何想法/例子?
谢谢, 斯
答案 0 :(得分:9)
这是我正在使用的(它也处理UTF-8标签,而不仅仅是ASCII):
private static final Pattern TAG_PATTERN =
Pattern.compile("(?:^|\\s|[\\p{Punct}&&[^/]])(#[\\p{L}0-9-_]+)");
顺便说一下,你应该能够从推文实体(include_entities=true
)获取主题标签