标签: java arrays data-structures file-handling large-data
我必须阅读20个奇怪的分区大文件(在某些情况下大多是txt或pdf),然后对它们执行一些文本处理。
我使用BufferedReader和循环来读取这些文件,有没有一种有效的方法呢?
我的问题:阅读这些文件的内容并将它们分成标记,然后将它们存储在数据结构中。我现在正在使用数组,但我想利用一个有效的结构。
有人可以提出解决这两个问题的方法
答案 0 :(得分:0)
由于你要计算每个单词的频率,你应该使用一个列表,然后遍历列表并使用一个地图,其中关键是单词来跟踪出现的次数