在字符串中查找日期,重量,数字和货币

时间:2013-11-22 16:15:56

标签: java netbeans text-mining named-entity-extraction

我有一个名为MyFile.txt的文本文件。它包含:

“我的名字是约翰。我的工资是每月3000.00英镑。我的体重是100磅。”

我正在使用Text挖掘应用程序。到目前为止,我可以通过检测Person.txt中的名称列表来提取Person。但我完全迷失了,因为我无法确定我正在阅读的文本文件中是否存在日期,重量,数字和货币。下面是代码。请帮我。谢谢。

File textSRC = new File("MyText.txt");
File personE = new File("Person.txt");
String MyTextcount = null;
String personcount = null;
String personFile = "Person";
BufferedReader MyTextbr = null;
BufferedReader personbr = null;

try {
    String MyTextsCurrentLine;
    String personsCurrentLine;

    personbr = new BufferedReader(new FileReader(personE));
    MyTextbr = new BufferedReader(new FileReader(textSRC));

    while ((MyTextsCurrentLine = MyTextbr.readLine()) != null) {
        jTextArea1.append(MyTextsCurrentLine);
        MyTextcount = MyTextcount + " " + MyTextsCurrentLine;
    }

    while ((personsCurrentLine = personbr.readLine()) != null) {
         personcount = personcount + " " + personsCurrentLine;
    }


    String[] MyTextwords = MyTextcount.split("\\W");
    String[] personwords = personcount.split(" ");

    for(int i = 1; i < MyTextwords.length; i++){
        for (String personword : personwords) {
            if (MyTextwords[i].equals(personword)) {
                jTextArea2.append(MyTextwords[i]);
                break;
            }
        }
    }

} catch (IOException e) { } 

0 个答案:

没有答案