Java从包含senteces的文本文件中提取单词或(搜索字符)的最佳方法

时间:2014-10-14 23:11:35

标签: java file loops file-read

我试图从文本文件中获取单词。该文件包含句子,因为它本质上是一本书。但是我在阅读所有角色时遇到了麻烦,陷入了无休止的循环。这是我必须阅读的txt文件。

try
{
    File myFile = new File(tale);                 
    Scanner inputFile = new Scanner(myFile);            
}
catch(FileNotFoundException FNFE)
{

}

我一直在网上寻找,但我找不到从文本文件中提取单词的最佳方法。文本文件是一本书,因此应该忽略昏迷和引文。但是我似乎只是陷入无休止的循环中。我试过while(inputFile.hasnext())但是发生了无限循环。我假设它没有检查每个角色。

我认为这对于许多曾经从文件中读取的新程序员来说都是一个很好的主题。

1 个答案:

答案 0 :(得分:1)

扫描程序是指将数据除以某些分隔符作为“令牌”。'默认分隔符是空格。调用scanner.next()会返回下一个标记。因此,调用scanner.next将返回由空格分隔的文件中的下一个单词或标点符号。

像这样:

File myFile = new File(tale);                 
Scanner inputFile = new Scanner(myFile);
while(inputFile.hasNext())
{
    String next = inputFile.next();
}

查看documentation on the Scanner课程以获取更多信息。