如何删除主题标签,用户提及&来自推特的网址。 Twitter4j库(情绪分析)无法正常使用这些噪音词

时间:2017-04-14 04:05:37

标签: url twitter4j sentiment-analysis hashtag tweets

如何删除主题标签,用户提及&来自推特的网址。 Twitter4j库(情绪分析)无法正常使用这些噪音词

实施例: 鸣叫:你好今天早上好#summermorning @evilpriest @holysinner https://goo.le/asxmo/dataload .......

应该看起来像 - 你好,今天早上好,早上好。

twitter4J本身是否有任何方法或实用程序,或者我们需要编写自己的方法或实用程序?请指导。

2 个答案:

答案 0 :(得分:0)

在通过情感分析管道解析句子之前,使用正则表达式过滤掉#es! 使用此:

String withoutHashTweet = originalTweet.replaceAll("[#]", "");

所以"你好今天早上好#summermorning @evilpriest @holysinner"应该回来:"你好今天早上好夏天早上@evilpriest @ holysinner"

同样用@替换代码中的散列以删除相应的符号

答案 1 :(得分:0)

类似的东西:

$(document).ajaxStart(function (event, request, settings) {
     $("#ajax-loader").show();
});

$(document).ajaxComplete(function (event, request, settings) {
    if ($.active == 1) {
        $("#ajax-loader").hide();
    }
});