使用Twitter4j从tweet中删除主题标签,用户名和URL

时间:2014-10-19 08:40:16

标签: java twitter twitter4j

是否有一种简单的方法可以使用twitter4j删除推文中提到的主题标签,用户名和URL? 我知道使用getHashtagEntities(),getUserMentionEntities()和getURLEntities()我可以检索这些实体及其在字符串中的位置,但我将如何使用它们来清理"鸣叫?

我正在考虑使用replaceAll(实体,"")方法用""替换推文中的所有实体。但是,这并不总能给出正确的结果(例如,它会删除#h;##ht"推文中的#ht,即使它不应该也是如此)。

1 个答案:

答案 0 :(得分:1)

我最终为每个实体使用了一个带有"(?<!\w)"方法的lookbehind replaceAll(),我想这解决了我的问题。但是有人告诉我,正则表达式和replaceAll()方法可能会很慢,所以如果有人有任何其他建议,我会乐意阅读它们。