jflex中的元音正则表达式

时间:2013-02-01 04:27:03

标签: java regex jflex

所以我使用jflex进行了练习,这是关于计算包含3个以上元音的输入文本文件中的单词数量。我最终做的是为word定义一个标记,然后创建一个接收该文本作为输入的java函数,并检查每个字符。如果它是一个元音,我将计数器加起来,然后检查它是否大于3,如果是的话,我将计算单词的数量加起来。

我想知道的是,如果正则表达式可以匹配超过3个元音的单词。我认为这将是一个更清洁的解决方案。提前谢谢。

令牌

   Letra = [a-zA-Z]
   Palabra = {Letra}+

3 个答案:

答案 0 :(得分:1)

很简单。如果要检查单词是否包含至少3个元音,请使用此选项。

(?i)(?:[a-z]*[aeiou]){3}[a-z]*

你只关心它包含至少3个元音,所以其余的可以是任何字母字符。上面的正则表达式可以在String.matchesMatcher循环中工作,因为有效单词(包含至少3个元音)不能是无效单词的子串(包含少于3个元音)。


不可能,但对于辅音,您可以使用字符类交集,这是Java正则表达式[a-z&&[^aeiou]]的一个独特功能。因此,如果您想检查完全 3个元音(对于String.matches):

(?i)(?:[a-z&&[^aeiou]]*[aeiou]){3}[a-z&&[^aeiou]]*

如果您在Matcher循环中使用它:

(?i)(?<![a-z])(?:[a-z&&[^aeiou]]*[aeiou]){3}[a-z&&[^aeiou]]*(?![a-z])

请注意,我必须使用环视来确保匹配的字符串(正好3个元音)不是无效字符串的一部分(当它有超过3个元音时可能)。

答案 1 :(得分:0)

由于您自己编写了一个Java方法,因此可以按如下方式完成:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class VowelChecker {
    private static final Pattern vowelRegex = Pattern.compile("[aeiouAEIOU]");

    public static void main(String[] args) {
        System.out.println(checkVowelCount("aeiou", 3));
        System.out.println(checkVowelCount("AEIWW", 3));
        System.out.println(checkVowelCount("HeLlO", 3));
    }

    private static boolean checkVowelCount(String str, int threshold) {
        Matcher matcher = vowelRegex.matcher(str);
        int count = 0;
        while (matcher.find()) {
            if (++count > threshold) {
                return true;
            }
        }
        return false;
    }

}

此处threshold定义您要查找的元音数量(因为您要查找的值超过3,因此在main方法中为3)。输出如下:

true
false
false

希望这有帮助!

谢谢,
EG

答案 2 :(得分:0)

我最终使用了这个正则表达式。如果有人有更好的发布意见

     Cons = [bcdBCDfghFGHjklmnJKLMNpqrstPQRSTvwxyzVWXYZ]
      Vocal = [aeiouAEIOU]
       Match = {Cons}*{Vocal}{Cons}*{Vocal}{Cons}*{Vocal}{Cons}*{Vocal}({Cons}*{Vocal}*|{Vocal}*{Cons}*) | {Vocal}{Cons}*{Vocal}{Cons}*{Vocal}{Cons}*{Vocal}({Cons}*{Vocal}*|{Vocal}*{Cons}*)