Java Regex - 从String中提取Hashtags

时间:2011-02-13 14:57:05

标签: java regex twitter

需要从Java中的源字符串中提取出标签字符串。任何想法/例子?

谢谢, 斯

1 个答案:

答案 0 :(得分:9)

这是我正在使用的(它也处理UTF-8标签,而不仅仅是ASCII):

private static final Pattern TAG_PATTERN = 
   Pattern.compile("(?:^|\\s|[\\p{Punct}&&[^/]])(#[\\p{L}0-9-_]+)");

顺便说一下,你应该能够从推文实体(include_entities=true)获取主题标签