使用SentiWordNet进行情绪分析

时间:2013-07-10 09:50:48

标签: java python-2.7 sentiment-analysis

我迫切需要对以下方面提供一些帮助。

对于我的硕士论文,我必须对某些亚马逊,Twitter和Facebook数据进行情绪分析。我已将这些数据保存在csv文档中。现在我想使用SentiWordNet来获得极性分数。但是我无法使用python运行他们网站上提供的脚本。

首先,我要说我是Java的新手。所以请不要责怪我不知道这一切。我花了很多时间在互联网上搜索一些没有运气的信息或教程。虽然我遇到了一个不同的问题,但本网站上有一个主题来自一个有类似问题的人(How to use SentiWordNet)。每当我运行下面的脚本时,我都会收到以下消息:ImportError:没有名为java.io.BufferedReader的模块。我试图在互联网上搜索解决方案,但我找不到任何解决方案。有人可以帮我解决一下如何运行这个脚本。首先,我已经删除了sentiwordnet.txt文件中的垃圾。 SentiWordNet.txt文件的路径是\ Users \ Mo \ Documents \ etc.这也是csv文件的途径。顺便说一下,我在OSX上用python 2.7.5运行这个脚本。

非常感谢你提前帮助!!!

    import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Set;
import java.util.Vector;

public class SWN3 {
    private String pathToSWN = "data"+File.separator+"SentiWordNet_3.0.0.txt";
    private HashMap<String, String> _dict;

    public SWN3(){

        _dict = new HashMap<String, String>();
        HashMap<String, Vector<Double>> _temp = new HashMap<String, Vector<Double>>();
        try{
            BufferedReader csv =  new BufferedReader(new FileReader(pathToSWN));
            String line = "";           
            while((line = csv.readLine()) != null)
            {
                String[] data = line.split("\t");
                Double score = Double.parseDouble(data[2])-Double.parseDouble(data[3]);
                String[] words = data[4].split(" ");
                for(String w:words)
                {
                    String[] w_n = w.split("#");
                    w_n[0] += "#"+data[0];
                    int index = Integer.parseInt(w_n[1])-1;
                    if(_temp.containsKey(w_n[0]))
                    {
                        Vector<Double> v = _temp.get(w_n[0]);
                        if(index>v.size())
                            for(int i = v.size();i<index; i++)
                                v.add(0.0);
                        v.add(index, score);
                        _temp.put(w_n[0], v);
                    }
                    else
                    {
                        Vector<Double> v = new Vector<Double>();
                        for(int i = 0;i<index; i++)
                            v.add(0.0);
                        v.add(index, score);
                        _temp.put(w_n[0], v);
                    }
                }
            }
            Set<String> temp = _temp.keySet();
            for (Iterator<String> iterator = temp.iterator(); iterator.hasNext();) {
                String word = (String) iterator.next();
                Vector<Double> v = _temp.get(word);
                double score = 0.0;
                double sum = 0.0;
                for(int i = 0; i < v.size(); i++)
                    score += ((double)1/(double)(i+1))*v.get(i);
                for(int i = 1; i<=v.size(); i++)
                    sum += (double)1/(double)i;
                score /= sum;
                String sent = "";               
                if(score>=0.75)
                    sent = "strong_positive";
                else
                if(score > 0.25 && score<=0.5)
                    sent = "positive";
                else
                if(score > 0 && score>=0.25)
                    sent = "weak_positive";
                else
                if(score < 0 && score>=-0.25)
                    sent = "weak_negative";
                else
                if(score < -0.25 && score>=-0.5)
                    sent = "negative";
                else
                if(score<=-0.75)
                    sent = "strong_negative";
                _dict.put(word, sent);
            }
        }
        catch(Exception e){e.printStackTrace();}        
    }

    public String extract(String word, String pos)
    {
        return _dict.get(word+"#"+pos);
    }
}

1 个答案:

答案 0 :(得分:0)

首先,你是如何运行课程的?通过命令行或在Eclipse等IDE中。 如果使用命令行,则必须确保已正确设置类路径。如果您不熟悉这些问题,我会鼓励在IDE中创建一个java项目并从那里运行它,因为将为您配置类路径。 Creating your first Java project