Вопрос

Я использую Delphi 2007, и у меня есть приложение, которое считывает файлы журналов из нескольких мест по внутренней сети и отображает исключения.Эти каталоги иногда содержат тысячи файлов журнала.У приложения есть возможность читать только лог-файлы за последние n дней, бит также может находиться в любом диапазоне дат и времени.

Проблема в том, что при первом чтении каталога журнала это может быть очень медленно (несколько минут).Во второй раз это происходит значительно быстрее.

Интересно, как я могу оптимизировать свой код, чтобы читать лог-файлы как можно быстрее ?Я использую vCurrentFile:TStringList для сохранения файла в памяти.Это обновляется из FileStream, так как я думаю, что это быстрее.

Вот некоторый код:

Обновить:Основной цикл для чтения лог-файлов

// In this function the logfiles are searched for exceptions. If a exception is found it is stored in a object.
// The exceptions are then shown in the grid
procedure TfrmMain.Refresh;
var
  FileData : TSearchRec;  // Used for the file searching. Contains data of the file
  vPos, i, PathIndex : Integer;
  vCurrentFile: TStringList;
  vDate: TDateTime;
  vFileStream: TFileStream;
begin
  tvMain.DataController.RecordCount := 0;
  vCurrentFile := TStringList.Create;
  memCallStack.Clear;

  try
    for PathIndex := 0 to fPathList.Count - 1 do                      // Loop 0. This loops until all directories are searched through
    begin
      if (FindFirst (fPathList[PathIndex] + '\*.log', faAnyFile, FileData) = 0) then
      repeat                                                      // Loop 1. This loops while there are .log files in Folder (CurrentPath)
        vDate := FileDateToDateTime(FileData.Time);

        if chkLogNames.Items[PathIndex].Checked and FileDateInInterval(vDate) then
        begin
          tvMain.BeginUpdate;       // To speed up the grid - delays the guichange until EndUpdate

          fPathPlusFile := fPathList[PathIndex] + '\' + FileData.Name;
          vFileStream := TFileStream.Create(fPathPlusFile, fmShareDenyNone);
          vCurrentFile.LoadFromStream(vFileStream);

          fUser := FindDataInRow(vCurrentFile[0], 'User');          // FindData Returns the string after 'User' until ' '
          fComputer := FindDataInRow(vCurrentFile[0], 'Computer');  // FindData Returns the string after 'Computer' until ' '

          Application.ProcessMessages;                  // Give some priority to the User Interface

          if not CancelForm.IsCanceled then
          begin
            if rdException.Checked then
              for i := 0 to vCurrentFile.Count - 1 do
              begin
                vPos := AnsiPos(MainExceptionToFind, vCurrentFile[i]);
                if vPos > 0 then
                  UpdateView(vCurrentFile[i], i, MainException);

                vPos := AnsiPos(ExceptionHintToFind, vCurrentFile[i]);
                if vPos > 0 then
                  UpdateView(vCurrentFile[i], i, HintException);
              end
            else if rdOtherText.Checked then
              for i := 0 to vCurrentFile.Count - 1 do
              begin
                vPos := AnsiPos(txtTextToSearch.Text, vCurrentFile[i]);
                if vPos > 0 then
                  UpdateView(vCurrentFile[i], i, TextSearch)
              end
          end;

          vFileStream.Destroy;
          tvMain.EndUpdate;     // Now the Gui can be updated
        end;
      until(FindNext(FileData) <> 0) or (CancelForm.IsCanceled);     // End Loop 1
    end;                                                          // End Loop 0
  finally
    FreeAndNil(vCurrentFile);
  end;
end;

Метод просмотра обновлений:Добавьте одну строку в displaygrid

{: Update the grid with one exception}
procedure TfrmMain.UpdateView(aLine: string; const aIndex, aType: Integer);
var
  vExceptionText: String;
  vDate: TDateTime;
begin
  if ExceptionDateInInterval(aLine, vDate) then     // Parse the date from the beginning of date
  begin
    if aType = MainException then
      vExceptionText := 'Exception'
    else if aType = HintException then
      vExceptionText := 'Exception Hint'
    else if aType = TextSearch then
      vExceptionText := 'Text Search';

    SetRow(aIndex, vDate, ExtractFilePath(fPathPlusFile), ExtractFileName(fPathPlusFile), fUser, fComputer, aLine, vExceptionText);
  end;
end;

Способ определить, находится ли строка в диапазоне дат:

{: This compare exact exception time against the filters
@desc 2 cases:    1. Last n days
                  2. From - to range}
function TfrmMain.ExceptionDateInInterval(var aTestLine: String; out aDateTime: TDateTime): Boolean;
var
  vtmpDate, vTmpTime: String;
  vDate, vTime: TDateTime;
  vIndex: Integer;
begin
  aDateTime := 0;
  vtmpDate := Copy(aTestLine, 0, 8);
  vTmpTime := Copy(aTestLine, 10, 9);

  Insert(DateSeparator, vtmpDate, 5);
  Insert(DateSeparator, vtmpDate, 8);

  if TryStrToDate(vtmpDate, vDate, fFormatSetting) and TryStrToTime(vTmpTime, vTime) then
    aDateTime := vDate + vTime;

  Result := (rdLatest.Checked and (aDateTime >= (Now - spnDateLast.Value))) or
            (rdInterval.Checked and (aDateTime>= dtpDateFrom.Date) and (aDateTime <= dtpDateTo.Date));

  if Result then
  begin
    vIndex := AnsiPos(']', aTestLine);

    if vIndex > 0 then
      Delete(aTestLine, 1, vIndex + 1);
  end;
end;

Проверьте, находится ли filedate внутри диапазона:

{: Returns true if the logtime is within filters range
@desc Purpose is to sort out logfiles that are no idea to parse (wrong day)}
function TfrmMain.FileDateInInterval(aFileTimeStamp: TDate): Boolean;
begin
  Result := (rdLatest.Checked and (Int(aFileTimeStamp) >= Int(Now - spnDateLast.Value))) or
            (rdInterval.Checked and (Int(aFileTimeStamp) >= Int(dtpDateFrom.Date)) and (Int(aFileTimeStamp) <= Int(dtpDateTo.Date)));
end;
Это было полезно?

Решение

Насколько быстрым ты хочешь быть?Если вы хотите работать действительно быстро, то вам нужно использовать что-то помимо сети Windows для чтения файлов.Причина в том, что если вы хотите прочитать последнюю строку файла журнала (или все строки с момента последнего чтения), то вам нужно прочитать весь файл еще раз.

В своем вопросе вы сказали, что проблема в том, что перечисление вашего списка каталогов происходит медленно.Это ваше первое узкое место.Если вы хотите работать очень быстро, то вам нужно либо переключиться на HTTP, либо добавить какой-нибудь сервер журналов на компьютер, где хранятся файлы журналов.

Преимущество использования HTTP заключается в том, что вы можете выполнить запрос диапазона и просто получить новые строки файла журнала, которые были добавлены с момента вашего последнего запроса.Это действительно повысит производительность, поскольку вы передаете меньше данных (особенно если вы включаете сжатие HTTP), и у вас также есть меньше данных для обработки на стороне клиента.

Если вы добавите какой-либо сервер журналов, то этот сервер сможет выполнять обработку на стороне сервера, где у него есть собственный доступ к данным, и возвращать только те строки, которые находятся в диапазоне дат.Простым способом сделать это может быть просто помещение ваших журналов в какую-либо базу данных SQL, а затем выполнение запросов к ней.

Итак, как быстро вы хотите ехать?

Другие советы

Проблема не в вашей логике, а в базовой файловой системе.

Большинство файловых систем работают очень медленно, когда вы помещаете много файлов в каталог.Это очень плохо с FAT, но NTFS также страдает от этого, особенно если у вас тысячи файлов в каталоге.

Лучшее, что вы можете сделать, это реорганизовать эти структуры каталогов, например, по возрасту.

Тогда у вас будет не более пары 100 файлов в каждом каталоге.

--джерун

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top