正则表达式计算文本中的音节数

时间:2016-01-02 12:41:27

标签: java regex

我搜索了整个互联网,我的悲伤发现在互联网上使用正则表达式在文本中没有正确实现音节计数。首先,我想清楚一个音节的定义:

音节被定义为:一个连续的元音序列,除了单词末尾的单个“e”,如果该单词具有另一组连续的元音,则构成一个音节。 y被认为是元音。

我使用了以下正则表达式语句(在Java中使用split):

import java.io.FileReader;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;
import java.util.Map.Entry;
import java.util.Scanner;

class Graph {
    private Map<Integer, ArrayList<Integer>> adjLists;
    private int numberOfVertices;
    private int numberOfEdges;

    public Graph(int V){
        adjLists = new HashMap<>(V);
        for(int i=0; i<V; i++){
            adjLists.put(i, new ArrayList<Integer>());
        }
        this.numberOfVertices = V;
        this.numberOfEdges = 0;
    }

    public int getNumberOfEdges(){
        return this.numberOfEdges;
    }
    public int getNumberOfVertices(){
        return this.numberOfVertices;
    }

    public void addVertex(){
        adjLists.put(getNumberOfVertices(), new ArrayList<Integer>());
        this.numberOfVertices++;
    }

    public void addEdge(int u, int v){
        adjLists.get(u).add(v);
        adjLists.get(v).add(u);
        this.numberOfEdges++;
    }

    public ArrayList<Integer> getNeighbours(int u){
        return new ArrayList<Integer>(adjLists.get(u));
    }

    public void printTheGraph() {
        for(Entry<Integer, ArrayList<Integer>> list: adjLists.entrySet()){
            System.out.print(list.getKey()+": ");
            for(Integer i: list.getValue()){
                System.out.print(i+" ");
            }
            System.out.println();
        }

    }
}

@SuppressWarnings("resource")
public class AdjacencyListGraphTest {

    public static void main(String[] args) throws Exception {
        FileReader reader = new FileReader("graphData");
        Scanner in = new Scanner(reader);

        int E, V;
        V = in.nextInt();
        E = in.nextInt();
        Graph graph = new Graph(V);
        for(int i=0; i<E; i++){
            int u, v;
            u = in.nextInt();
            v = in.nextInt();
            graph.addEdge(u, v);
        }

        graph.printTheGraph();


    }
}

但是它不起作用。 主要问题是如何使用正则表达式来计算最后的'e'规则。只有正则表达式就足够了。谢谢。

P.S:主题未知的人请不要指向其他stackoverflow问题,因为他们都没有正确的实现答案。

1 个答案:

答案 0 :(得分:1)

这会在一个单词中为您提供多个音节元音:

public int getNumVowels(String word) {

    String regexp = "[bcdfghjklmnpqrstvwxz]*[aeiouy]+[bcdfghjklmnpqrstvwxz]*";
    Pattern p = Pattern.compile(regexp);
    Matcher m = p.matcher(word.toLowerCase());

    int count = 0;

    while (m.find()) {
        count++;
    }
    return count;
}

您可以在字符串数组中的每个单词上调用它:

String[] words = getText().split("\\s+");
for (String word : words ) {
  System.out.println("Word: " + word + ", vowels: " + getNumVowels(word));
}