在java中访问许多文本文件

时间:2012-01-18 04:15:17

标签: java arrays data-structures file-handling large-data

我必须阅读20个奇怪的分区大文件(在某些情况下大多是txt或pdf),然后对它们执行一些文本处理。

我使用BufferedReader和循环来读取这些文件,有没有一种有效的方法呢?

我的问题:阅读这些文件的内容并将它们分成标记,然后将它们存储在数据结构中。我现在正在使用数组,但我想利用一个有效的结构。

有人可以提出解决这两个问题的方法

1 个答案:

答案 0 :(得分:0)

由于你要计算每个单词的频率,你应该使用一个列表,然后遍历列表并使用一个地图,其中关键是单词来跟踪出现的次数