如何将相同的文本行(以...开头)拆分为一个文件?

时间:2013-10-26 06:56:46

标签: java

我有一个大型的网络日志文件。用户由不同的数字表示。每行以数字开头。

我必须拆分文本文件,以便相同的用户进入一个文件。

我的输入文本文件如下所示:

6993    xylazine    2006-03-01 19:09:30 3   
6993    xylazine    2006-03-01 19:09:30 9   
6993    irs 
6993    
6997    veterinarian horses 2006-03-05 10:39:16     
6997    socil security admin.   2006-03-06 18:57:30     
6997    social security administration  2006-03-06 18:58:35 
6997    bank of america branches    2006-03-07 20:08:03     
6997    phonebokk   2006-03-07 20:12:15     
6997    phone book  2006-03-07 20:12:19

我用FileReader和BufferedReader编写了以下代码,但是这些代码似乎没有提供我需要的功能。但是它生成了许多文件。但是这段代码将每一行拆分成单独的文件。但我想将它分成相同的用户(相同的数字(开头))分成一个文件。任何人都可以告诉我如何修复下面的代码,以便它完成我想要的东西?

package fileread;

import java.io.*;
import java.io.BufferedReader;
import java.io.PrintWriter;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;

public class FileRead {
    public static void main( String[] args ) {
        File f = new File( "D:test.txt" );
        BufferedReader fileReader = null;
        FileOutputStream fout = null;
        BufferedWriter out = null;
        try {
            String text = " ", text1 = "content";
            int x = 2;
            fileReader = new BufferedReader( new InputStreamReader(
                    new FileInputStream( f ) ) );
            fout = new FileOutputStream( new File( "test1.txt" ) );
            OutputStreamWriter osr = new OutputStreamWriter( fout, "UTF-8" );// No
                                                                             // I18N
            PrintWriter pwr = new PrintWriter( osr, false );
            out = new BufferedWriter( new OutputStreamWriter( fout ) );
            while( (text = fileReader.readLine()) != null ) {
                text = text.trim();
                int inde = text.indexOf( " " );
                System.out.println( inde );
                if( inde > 0 ) {
                    String text2 = text1;
                    text1 = text.substring( 0, inde );
                    text1 = text1.trim();
                    text2 = text2.trim();
                    // System.out.println(text1);

                    if( text1.equals( text2 ) || text2.equals( "content" ) ) {
                        pwr.print( text );
                        pwr.print( "\n" );

                    } else {
                        osr.flush();
                        osr.close();
                        fout = new FileOutputStream( new File( "D:test" + x
                                + ".txt" ) );
                        osr = new OutputStreamWriter( fout, "UTF-8" );// No I18N
                        pwr = new PrintWriter( osr, false );
                        pwr.print( text );
                        pwr.print( "\n" );
                        x++;
                    }

                }
            }

            osr.flush();
            osr.close();

        } catch( Exception e ) {
            e.printStackTrace();

        } finally

        {
            try {
                if( fileReader != null ) {
                    fileReader.close();
                }
                if( fout != null ) {
                    fout.close();
                }
                if( out != null ) {
                    out.close();
                }
            } catch( Exception e ) {
            }
        }
    }

}

但是这段代码将每一行拆分成单独的文件。但我想将它分成相同的用户(相同的数字(开头))分成一个文件。任何人都可以提出想法???我是java的新手。请给出一些建议。提前谢谢。

1 个答案:

答案 0 :(得分:0)

您应该检查用户名,然后将该行写入正确的文件。我将文件的每对用户名和数据记录到Map中。然后根据用户名,我将每条记录放入不同的List中,最后将每个List写入单独的文件中。 它看起来像这样(伪代码):

Map<String, String> userListPairs = new HashMap<String, List<String>>();

while(next line exists) {
  extract username
  if (!userListPairs.contains(username)) {
      userListPairs.put(username, new LinkedList<String>());
  }
  userListPairs.get(username).add(line);

}
for (Entry<String, List<String>> fileData : userListPairs.entrySet()) {
  //open file with name fileData.key()
  //write records from fileData.value() to the file.
}