用分隔符过滤整个单词

时间:2014-02-06 06:15:59

标签: java regex filter delimiter

我有一个过滤掉符号和数字的分隔符。我的程序正在读取文件,我想从中排除一些单词而不是所有单词。例如,这可能听起来令人困惑。如果我的文件中的第一行包含单词light而第二行包含单词lightning,是否可以以某种方式过滤掉light,但保留lightning?< / p>

这是我已经实施的代码和分隔符。

String delimiters = " ,*.-?|\t\r\n^;{}()[]+=<>/1234567890_";
ASCIIDataFile file = new ASCIIDataFile();

2 个答案:

答案 0 :(得分:0)

您是否使用分隔符进行任何拆分或替换操作? 您可以在分割/替换操作中使用:正则表达式 - “\ blight \ b”,它将与“light”匹配,而不是“闪电”。

您可以验证/测试这个@ JavaScript RegExp Example

希望这有帮助。

答案 1 :(得分:0)

您可以在java中使用模式匹配

Set<String> Word = new TreeSet<String>(); 
while((line=br.readLine()) != null) {
                            Pattern pattern = Pattern.compile("^YourString");
                            Matcher matcher = pattern.matcher(line);
                            while(matcher.find()) {
                                Word.add(line);
                            }
                        }