我有印地语的文本文件,大约30000字。我必须从文件中获取唯一的单词并将其保存为表格形式。 我在java中尝试这个。但我不知道该怎么做。 有人可以帮忙吗?
答案 0 :(得分:0)
我建议您使用Set http://docs.oracle.com/javase/6/docs/api/java/util/Set.html来存储字符串。
优点是它不允许多次使用该值。这是一个例子:
Set<String> storage = new HashSet<String>; //use TreeSet<String> if you need to sort the values
storage.add("dog");
storage.add("cat");
storage.add("cat");
for(String name: set) {
System.out.println(name); //Values are: dog, cat
}
您可以像这样阅读文件:Reading a plain text file in Java。
基本上你可以用“,”之间的方式将其保存为明文,并将文件另存为csv。然后您可以轻松地将其导入excel