我有一个特殊的.txt文件可以从Java中读取,这是其中的一部分:
absolute mutlak(IBM)(MS)
absolute address mutlak adres(IBM)
absolute device mutlak aygıt(IBM)
absolute positioned object mutlak konumlu nesne(MS)
absolute positioned paragraph mutlak konumlu paragraf(MS)
absolute positioning mutlak konumlama(IBM)
absolute priority mutlak öncelik(IBM)
Absolute reference Mutlak referans(MS)
abstract soyut(IBM)(MS)
第一列是原始,第二列是描述。现在我必须单独阅读原始和描述并存储在哈希表中。我该怎么做?
答案 0 :(得分:1)
逐行读取文件。对于每一行,找到" "
子字符串的索引(两个空格)。提取索引之前的所有内容以及之后的所有内容修剪两个部分。
如果分隔符实际上是一系列标签,则使用与"\t"
而不是" "
相同的算法。
答案 1 :(得分:0)
您可以对此文件进行布局描述,其中包含行中的长度和位置。
start end description
0 10 original
11 50 description
逐行阅读,然后在每一行中,通过开始位置和结束位置进行子串。
答案 2 :(得分:0)
使用正则表达式/ Pattern作为String.split()
的参数。像\\s{2,}
这样的东西会将字符串拆分为任何连续序列(超过1个)的空白字符(空格,制表符等)。