Pergunta

Estou lendo um arquivo .gz de alguma fonte lenta (como FTP Server) e estou processando os dados recebidos imediatamente. É algo como isto:

FtpWebResponse response = ftpclientRequest.GetResponse() as FtpWebResponse;
using (Stream ftpStream = response.GetResponseStream())
using (GZipStream unzipped = new GZipStream(ftpStream, CompressionMode.Decompress))
using (StreamReader linereader = new StreamReader(unzipped))
{
  String l;
  while ((l = linereader.ReadLine()) != null)
  {
    ...
  }
}

Meu problema está mostrando uma barra de progresso precisas. Com antecedência posso obter o tamanho do arquivo .gz comprimido, mas não tenho idéia de como grande o conteúdo seria descompactado. Lendo o arquivo linha por linha Eu sei muito bem quantos bytes descompactado eu li, mas eu não sei como isso se relaciona com o tamanho do arquivo compactado.

Assim, há alguma maneira de obter a partir GZipStream quão longe o ponteiro do arquivo é avançado para o arquivo compactado? Eu só preciso da posição atual, o tamanho do arquivo gz I pode buscar antes de ler o arquivo.

Foi útil?

Solução

Você pode conectar um fluxo entre que conta, quantos bytes GZipStream leu.

  public class ProgressStream : Stream
  {
    public long BytesRead { get; set; }
    Stream _baseStream;
    public ProgressStream(Stream s)
    {
      _baseStream = s;
    }
    public override bool CanRead
    {
      get { return _baseStream.CanRead; }
    }
    public override bool CanSeek
    {
      get { return false; }
    }
    public override bool CanWrite
    {
      get { return false; }
    }
    public override void Flush()
    {
      _baseStream.Flush();
    }
    public override long Length
    {
      get { throw new NotImplementedException(); }
    }
    public override long Position
    {
      get
      {
        throw new NotImplementedException();
      }
      set
      {
        throw new NotImplementedException();
      }
    }
    public override int Read(byte[] buffer, int offset, int count)
    {
      int rc = _baseStream.Read(buffer, offset, count);
      BytesRead += rc;
      return rc;
    }
    public override long Seek(long offset, SeekOrigin origin)
    {
      throw new NotImplementedException();
    }
    public override void SetLength(long value)
    {
      throw new NotImplementedException();
    }
    public override void Write(byte[] buffer, int offset, int count)
    {
      throw new NotImplementedException();
    }
  }

// usage
FtpWebResponse response = ftpclientRequest.GetResponse() as FtpWebResponse;
using (Stream ftpStream = response.GetResponseStream())
using (ProgressStream progressStream = new ProgressStream(ftpstream))
using (GZipStream unzipped = new GZipStream(progressStream, CompressionMode.Decompress))
using (StreamReader linereader = new StreamReader(unzipped))
{
  String l;
  while ((l = linereader.ReadLine()) != null)
  {
    progressStream.BytesRead(); // does contain the # of bytes read from FTP so far.
  }
}

Outras dicas

Eu sugiro que você dê uma olhada no seguinte código:

public static readonly byte[] symbols = new byte[8 * 1024];

public static void Decompress(FileInfo inFile, FileInfo outFile)
{
    using (var inStream = inFile.OpenRead())
    {
        using (var zipStream = new GZipStream(inStream, CompressionMode.Decompress))
        {
            using (var outStream = outFile.OpenWrite())
            {
                var total = 0;
                do
                {
                    var async = zipStream.BeginRead(symbols, 0, symbols.Length, null, null);
                    total = zipStream.EndRead(async);
                    if (total != 0)
                    {
                        // Report progress. Read total bytes (8K) from the zipped file.
                        outStream.Write(symbols, 0, total);
                    }
                } while (total != 0);
            }
        }
    }
}

Eu revisitado meu código e tenho realizado alguns testes. IMHO Darin é certo. No entanto eu acho que é possível ler apenas o cabeçalho (tamanho?) Do fluxo compactado e descobrir o tamanho do arquivo resultante. (WinRar "sabe" qual é o tamanho do arquivo descompactado sem descompactar todo o arquivo zip. Ele lê essas informações de cabeçalho do arquivo.) Se você encontrar o tamanho do arquivo resultante este código vai ajudar você a relatar um progresso preciso.

public static readonly byte[] symbols = new byte[8 * 1024];

public static void Decompress(FileInfo inFile, FileInfo outFile, double size, Action<double> progress)
{
    var percents = new List<double>(100);

    using (var inStream = inFile.OpenRead())
    {
        using (var zipStream = new GZipStream(inStream, CompressionMode.Decompress))
        {
            using (var outStream = outFile.OpenWrite())
            {
                var current = 0;

                var total = 0;
                while ((total = zipStream.Read(symbols, 0, symbols.Length)) != 0)
                {
                    outStream.Write(symbols, 0, total);
                    current += total;

                    var p = Math.Round(((double)current / size), 2) * 100;
                    if (!percents.Contains(p))
                    {
                        if (progress != null)
                        {
                            progress(p);
                        }
                        percents.Add(p);
                    }
                }
            }
        }
    }
}

Espero que isso ajude.

Como um proxy para descomprimir progresso que você pode tentar obter as informações de progresso do download do arquivo a partir do fluxo subjacente usando:

var percentageProgress = ftpStream.Position / (double)ftpWebResponse.ContentLength;

ou

var percentageProgress = ftpStream.Position / (double)ftpStream.Length;

Ele funciona em um FileStream e deve trabalho em um GetResponseStream ( ) desde que implementa Posição propriedade eo FTP servidor retorna informações sobre o comprimento do arquivo baixado: http://msdn.microsoft.com/en-us/library/system.net.ftpwebresponse.contentlength (v = vs.110) aspx

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top