删除不在数据库中的单词

时间:2014-03-19 20:59:57

标签: java mysql nlp

我正在编程Java并使用MySQL数据库。是否可以向数据库发送一个相当大的字符串(+/- 500个单词)。接下来我希望它删除所有不在数据库中的单词,删除停用词,拼写错误的单词和其他噪音。应该返回较短的字符串。所以最好都应该在数据库本身中发生

这有可能吗?解决方案应该很快,因为我有+/- 6百万字符串。

2 个答案:

答案 0 :(得分:1)

是。这是可能的,实施应该是一项微不足道的工作。

答案 1 :(得分:0)

尝试这样的事情:

                 //statement that checks to make sure user enters only letters
                 if(fname.matches("[a-zA-Z]+"))
                 {
                    //updates 'Fname' field in db to text that user inputted in 'fname' textfield
                    rs2.updateString("Fname", fname);
                 }

                 //statement that prompts user if they enter something other letters
                 else
                 {
                    JOptionPane.showMessageDialog(null, "Please enter first name in correct format!");
                    fNameTextBoxResults.setText("");
                 }

这是一些逻辑,而不是使用" fname"使用您的数据库名称并检查您的数据库中是否包含选定的单词...