是否有任何java库或正则表达式模式用于从Instagram媒体标题中提取主题标签和用户提及?我知道twitter-text api但它无法处理没有空格标签。
答案 0 :(得分:1)
这个应该有效(^|\s)(#[a-z\d-]+)
(从here获得)
无论如何,如果你使用的是Instagram API,当你调用它时会有一部分结果给你所有的标签:
["data"]=>
array(14) {
["attribution"]=>
NULL
["tags"]=>
array(3) {
[0]=>
string(13) "workingermany"
[1]=>
string(18) "trabajarenalemania"
[2]=>
string(10) "radeberger"
}
如果您根据评论中的要求需要使用韩语字符,只需将它们添加到正则表达式中,如下所示:(^|\s)(#[a-z\p{Hangul}\d-]+)
您想要的字母越多,您应添加的字符集就越多,例如\p{Hiragana}
,\p{Katakana}
或\p{Latin}