如何提取唯一字符串的第一个实例

时间:2019-04-13 13:36:44

标签: delphi-2010 tstringlist

我需要从价值12年的一致的计算机生成的每天一次的文本文件中提取唯一项列表。文件名仅随包含的日期而变化,因此很容易在代码中生成所需的名称。它们按时间顺序列出了当日我在当地机场的所有飞机起降情况。自然,同一架飞机来回走了好多次,目的是循环浏览文件,挑选出每架飞机出现的第一个实例(首次访问或FV),然后将其复制到列表中,然后从那时开始忽略它上。结果应为按日期顺序列出的所有首次访问的列表。应该很简单,但是...我的程序很小,所以我包括了整个实现代码。

procedure TForm1.FormCreate(Sender: TObject);
begin
  FileDate := StrToDate('01/01/2007');
  FName := 'E:LGW Reports/SBSLGW2007-01-01.txt'; //1st file to be read
  FDStr := copy(FName, 21, 10);
  TempList := TStringList.Create; //temp holder for file contents
  FVCheckList := TStringList.Create; //holds unique identifier (UID)
  FVCheckList.Sorted := TRUE;
  FVCheckList.Duplicates := dupIgnore;
  FVList:= TStringList.Create;  //the main output
end;

procedure TForm1.Button1Click(Sender: TObject);
var
  i: integer;
begin
  Memo1.Lines.Append('Started');
  Repeat
    TempList.Clear;
    TempList.LoadFromFile(FName);
    for i := 1 to TempList.Count-1 do
    begin
      Line := TempList.Strings[i];
      //create a //create a Unique identifier (UID) from elements in Line          
      Serial := Trim(Copy(Line, 22, 9)); 
      MsnPos1 := Pos('[', Line) + 1;
      MsnPos2 := Pos(']', Line);
      Msn := copy(Line, MsnPos1, (MsnPos2 - MsnPos1));
      UID := Serial + '/' + Msn;
      //          
      if (FVCheckList.IndexOf(UID) < 0) then
      begin
        FVCheckList.Append(UID);
      //Add date of file to Line, otherwise it gives no clue when FV was
        FVList.Append(FormatDateTime('YYYY-MM-DD', FileDate) + ' ' + Line);
        FileDate := IncDay(FileDate, 1);
        FName := 'E:LGW Reports/SBSLGW' + FormatDateTime('YYYY-MM-DD', FileDate) + '.txt';
      end;
    end;
  Until FileExists(FName) = FALSE;
  FVCheckList.SaveToFile('E:LGW Reports/First Visit Checklist.txt');
  FVList.SaveToFile('E:LGW Reports/First Visits.txt');
  Memo1.Lines.Append('Finished');
  Memo1.Lines.SaveToFile('E:LGW Reports/Files parsed.txt');
end;

procedure TForm1.FormClose(Sender: TObject; var Action: TCloseAction);
begin
  TempList.Free;
  FVCheckList.Free;
  FVList.Free;
end;

没有编译器错误,它可以在几秒钟内完成运行,并生成指定的两个文本文件,格式正确。最大的问题是FVList中实际列出的行不是不是总是飞机的第一次访问,它们可以是第一次,最近访问或介于两者之间。我看不到任何有关出现错误实例的明显线索:如果我的代码正确,则TStringList FVCheckList的功能有问题。该错误很可能是我所忽略的东西,或者是我对.dupIgnore的工作方式的理解,或者我的循环无法正常工作。

我将非常感谢您提供任何实际帮助。预先非常感谢。

1 个答案:

答案 0 :(得分:0)

Repeat
  ...
Until FileExists(FName) = FALSE;

应该是

While FileExists(FName) = TRUE do
Begin
End;

如果第一个2007-01-01文件不存在,则代码将在第一个LoadFromFile()上崩溃,因为与加载后的文件不同,您在加载文件之前不检查文件是否存在。

否则,我建议坚持使用repeat,但在每个循环迭代的顶部分配FName,而不是在循环外部进行初始化,然后在每个迭代的底部重新分配。无需重复努力。

如果您手动检查IndexOf(),则根本不需要使用SorteddupIgnore。在这种情况下,这就是您应该做的。当dupIgnore忽略新字符串时,Append()不会告诉您该字符串已被忽略。为此,您必须检查Count是否确实增加了。

在外部循环内部,FileDateFName的重新分配应该在内部for循环外部,而不是在for循环内部。

尝试以下方法:

procedure TForm1.FormCreate(Sender: TObject);
begin
  FileDate := EncodeDate(2007,1,1);
  FDStr := FormatDateTime('YYYY-MM-DD', FileDate);
  TempList := TStringList.Create; //temp holder for file contents
  FVCheckList := TStringList.Create; //holds unique identifier (UID)
  FVList := TStringList.Create; //the main output
end;

procedure TForm1.Button1Click(Sender: TObject);
var
  i: integer;
begin
  Memo1.Lines.Append('Started');
  Repeat
    FName := 'E:LGW Reports/SBSLGW' + FormatDateTime('YYYY-MM-DD', FileDate) + '.txt';
    if not FileExists(FName) then Break;
    Memo1.Lines.Append(FName)
    TempList.LoadFromFile(FName);
    for i := 1 to TempList.Count-1 do
    begin
      Line := TempList.Strings[i];
      //create a Unique identifier (UID) from elements in Line
      Serial := Trim(Copy(Line, 22, 9));
      MsnPos1 := Pos('[', Line) + 1;
      MsnPos2 := PosEx(']', Line, MsnPos1);
      Msn := copy(Line, MsnPos1, (MsnPos2 - MsnPos1));
      UID := Serial + '/' + Msn;
      if FVCheckList.IndexOf(UID) = -1 then
      begin
        FVCheckList.Append(UID);
        //Add date of file to Line, otherwise it gives no clue when FV was
        FVList.Append(FormatDateTime('YYYY-MM-DD', FileDate) + ' ' + Line);
      end;
    end;
    FileDate := IncDay(FileDate, 1);
  end;
  FVCheckList.SaveToFile('E:LGW Reports/First Visit Checklist.txt');
  FVList.SaveToFile('E:LGW Reports/First Visits.txt');
  Memo1.Lines.Append('Finished');
  Memo1.Lines.SaveToFile('E:LGW Reports/Files parsed.txt');
end;

procedure TForm1.FormDestroy(Sender: TObject);
begin
  TempList.Free;
  FVCheckList.Free;
  FVList.Free;
end;