我有一个数据集,现在有相同的元素行。我试图在MapReduce
中使用分布式缓存。数据如下:
3467 r009345, r234956, r453437
8462 r6364785, r3450344, r0489832, r99982523
10093, r542557, r0922352
代码如下所示:
for(Path p: genes2snps)
{
if(p.getName().equals("genes2snps.txt"));
{
BufferedReader reader = new BufferedReader(new FileReader(p.toString()));
String line = reader.readLine();
while(line != null)
{
//String[] tokens = line.split("\t");
String[] tokens = line.split("\t", limit)
String geneID = tokens[0];
String state = tokens["\^0"];
}
}
}
我想说,使用array [0]作为键,使用数组[NOT 0]作为值。我该怎么做才是Regex?