优雅地将一组字符串(.txt文件)附加到另一组字符串(.txt)?

时间:2013-08-01 08:29:01

标签: sql string algorithm text append

这个请求可能看起来有点荒谬,不幸的是,我的小公司急需它,因此我将获得最大的奖励以获得良好的解决方案。

我们有一组存储在.txt文件中的旧订单信息。为了将此订单信息导入我们的新自定义数据库系统,我们需要为每一行追加来自另一组的值。

所以,在我的.txt文件中,我有:

Trans Date,NorthTotal,NorthSoFar,SouthTotal,SouthSoFar,IsNorthWorkingDay,IsSouthWorkingDay
2012-01-01,21,0,21,0,0,0
2012-01-02,21,0,21,0,0,0
2012-01-03,21,1,21,1,1,1
...

现在,我在.txt文件中也有一组位置,我需要添加两列 - 城市和国家/地区。让我们说:

City, Country
London,England
Paris,France

对于我的第一个文本文件中的每一行,我需要追加第二个文本文件的一行!因此,对于我的最终结果,使用上面的示例数据,我希望:

Trans Date,NorthTotal,NorthSoFar,SouthTotal,SouthSoFar,IsNorthWorkingDay,IsSouthWorkingDay,City,Country
2012-01-01,21,0,21,0,0,0,London,England
2012-01-02,21,0,21,0,0,0,London,England
2012-01-03,21,1,21,1,1,1,London,England
2012-01-01,21,0,21,0,0,0,Paris,France
2012-01-02,21,0,21,0,0,0,Paris,France
2012-01-03,21,1,21,1,1,1,Paris,France
...

目前我唯一的想法就是将这两个文件导入一个SQL数据库并编写一个复杂的函数将两者连在一起(因此我的标签) - 当然有人可以拯救我并想到一些不会占用所有内容的东西但是一天!请?!非常感谢你。

编辑:我对使用所有编程语言编写的解决方案持开放态度;但是更喜欢使用DOS或某种控制台/程序的东西,这很容易重新出现!

4 个答案:

答案 0 :(得分:2)

如果您愿意使用数据库并导入这些文件(这应该不是很困难),那么您不需要“复杂的功能来将两者附加在一起”。您只需要一个简单的交叉连接...... select t1.*, t2.* from t1, t2

亲身体验...... http://sqlfiddle.com/#!2/0c584/1

答案 1 :(得分:1)

这是C#中的解决方案。你运行它:

joinfiles a.txt b.txt c.txt

其中a.txt是第一个文件,b.txt是第二个文件,c.txt是将要创建的输出文件。它在我的机器上以100 MB / s的速度生成输出,因此可能足够快。

using System;
using System.IO;
using System.Text;

namespace JoinFiles
{
    class Program
    {
        static void Main(string[] args)
        {
            if (args.Length != 3)
                return;

            string[] file1, file2;

            try
            {

                using (var sr1 = new StreamReader(args[0]))
                using (var sr2 = new StreamReader(args[1]))
                {
                    file1 = sr1.ReadToEnd().Split(new string[] { Environment.NewLine }, StringSplitOptions.RemoveEmptyEntries);
                    file2 = sr2.ReadToEnd().Split(new string[] { Environment.NewLine }, StringSplitOptions.RemoveEmptyEntries);
                }

                using (var outstream = new StreamWriter(args[2], false, Encoding.Default, 1048576))
                {
                    outstream.WriteLine(file1[0] + "," + file2[0]);

                    for (int i = 1; i < file2.Length; i++)
                        for (int j = 1; j < file1.Length; j++)
                            outstream.WriteLine(file1[j] + "," + file2[i]);
                }
            }
            catch (Exception ex)
            {
                Console.WriteLine(ex.Message);
            }
        }
    }
}

答案 2 :(得分:0)

bash脚本示例

echo -e 'c1\na\nb' > t1
echo -e 'c2\n1\n2' > t2
while read l1;do
  read -u 3 l2
  echo "$l1,$l2"
done <t1 3<t2

man bash /内部功能/阅读

答案 3 :(得分:0)

您也可以编写WSH脚本来执行此操作并从命令行执行。这是一个快速的黑客(工作但肯定需要一些提炼)。您需要将其保存为vbs文件并在cli上执行,如下所示... wscript script.vbs infile1.txt infile2.txt outfile.txt其中script.vbs是您的脚本,infile 1和2是输入文件名,outfile.txt是输出文件。

Set FSO_In1 = CreateObject("Scripting.FileSystemObject")
Set FSO_In2 = CreateObject("Scripting.FileSystemObject")
Set FSO_Out = CreateObject("Scripting.FileSystemObject")
Set File_Out = FSO_In1.CreateTextFile(Wscript.Arguments.Item(2),2)
Set F1_file = FSO_In1.OpenTextFile(Wscript.Arguments.Item(0),1)
HeaderWritten = False
Header = F1_File.Readline 'Read the first header line from first file
Do While F1_File.AtEndOfStream = False
   F1_Line = F1_file.Readline
   Set F2_File = FSO_In2.OpenTextFile(Wscript.Arguments.Item(1),1)
   if HeaderWritten = False then
       Header = Header & "," & F2_File.Readline
       File_Out.Writeline(Header)
       HeaderWritten = True
   else
       F2_File.Readline 'Read the first header line from second file and ignore it
   end if
   Do While F2_File.AtEndOfStream = False
       F2_Line = F2_File.Readline
       out = F1_Line & "," & F2_Line
       File_Out.Writeline(out)
   Loop
   F2_File.Close
Loop
F1_File.Close
File_Out.Close