Apertura di file compressi con gzip per la lettura in C senza creare file temporanei
Domanda
Ho alcuni file gzip che voglio leggere in C tramite fopen e fscanf. Esiste un modo per farlo senza dover eseguire il gunzip dei file in file temporanei?
Grazie.
Soluzione
Puoi usare libzlib per aprire direttamente i file compressi con gzip.
Offre anche un "gzopen" funzione che si comporta in modo simile a fopen ma opera su file compressi con gzip. Tuttavia, fscanf probabilmente non funzionerebbe su tale handle, poiché prevede normali puntatori FILE.
Altri suggerimenti
Se popen
è un gioco leale , puoi farlo con fopen
e fscanf
:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>
int main(int argc, char *argv[])
{
const char prefix[] = "zcat ";
const char *arg;
char *cmd;
FILE *in;
char buf[4096];
if (argc != 2) {
fprintf(stderr, "Usage: %s file\n", argv[0]);
return 1;
}
arg = argv[1];
cmd = malloc(sizeof(prefix) + strlen(arg) + 1);
if (!cmd) {
fprintf(stderr, "%s: malloc: %s\n", argv[0], strerror(errno));
return 1;
}
sprintf(cmd, "%s%s", prefix, arg);
in = popen(cmd, "r");
if (!in) {
fprintf(stderr, "%s: popen: %s\n", argv[0], strerror(errno));
return 1;
}
while (fscanf(in, "%s", buf) == 1)
printf("%s: got [%s]\n", argv[0], buf);
if (ferror(in)) {
fprintf(stderr, "%s: fread: %s\n", argv[0], strerror(errno));
return 1;
}
else if (!feof(in)) {
fprintf(stderr, "%s: %s: unconsumed input\n", argv[0], argv[1]);
return 1;
}
return 0;
}
Ad esempio:
$ zcat file.gz
Every good boy does fine.
$ ./gzread file.gz
./gzread: got [Every]
./gzread: got [good]
./gzread: got [boy]
./gzread: got [does]
./gzread: got [fine.]
Non utilizzare
sprintf(cmd, "zcat %s", argv[1]);
popen(cmd,"r");
per aprire i file .gz. Invece, evita correttamente argv [1]. Altrimenti potresti finire con una vulnerabilità, specialmente quando alcuni inietta un argomento argv [1] come
123;rm -rf /
Aiuta già a cambiare le istruzioni sopra in
sprintf(cmd, "zcat \'%s\'",argv[1]);
Potresti anche voler sfuggire a caratteri come '\ 0', '\' ',' \; ' ecc.
Tentativo di principiante su gzscanf ():
#include <stdio.h>
#include <stdarg.h>
#include <zlib.h>
#define MAXLEN 256
int gzscanf(gzFile *stream, const char *fmt, ...) {
/* read one line from stream (up to newline) and parse with sscanf */
va_list args;
va_start(args, fmt);
int n;
static char buf[MAXLEN];
if (NULL == gzgets(stream, buf, MAXLEN)) {
printf("gzscanf: Failed to read line from gz file.\n");
exit(EXIT_FAILURE);
}
n = vsscanf(buf, fmt, args);
va_end(args);
return n;
}
Puoi utilizzare zlib , ma ti richiederà di sostituire le tue chiamate I / O per essere zlib SPECIFICI.
devi aprire una pipe per farlo. Il flusso di base in pseudo codice è:
create pipe // man pipe
fork // man fork
if (parent) {
close the writing end of the pipe // man 2 close
read from the pipe // man 2 read
} else if (child) {
close the reading end of the pipe // man 2 close
overwrite the file descriptor for stdout with the writing end of the pipe // man dup2
call exec() with gzip and the relevant parameters // man 3 exec
}
Puoi usare le pagine man
nei commenti per maggiori dettagli su come farlo.
Puoi usare zlib e racchiuderlo in un normale puntatore a file, in questo modo puoi usare fscanf, fread, ecc. in modo trasparente.
FILE *myfopen(const char *path, const char *mode)
{
#ifdef WITH_ZLIB
gzFile *zfp;
/* try gzopen */
zfp = gzopen(path,mode);
if (zfp == NULL)
return fopen(path,mode);
/* open file pointer */
return funopen(zfp,
(int(*)(void*,char*,int))gzread,
(int(*)(void*,const char*,int))gzwrite,
(fpos_t(*)(void*,fpos_t,int))gzseek,
(int(*)(void*))gzclose);
#else
return fopen(path,mode);
#endif
}
È abbastanza semplice usare zlib
per aprire i file .gz
. C'è un manuale ragionevole su zlib.net .
Ecco un breve esempio per iniziare:
#include <stdio.h>
#include <zlib.h>
int main( int argc, char **argv )
{
// we're reading 2 text lines, and a binary blob from the given file
char line1[1024];
char line2[1024];
int blob[64];
if (argc > 1)
{
const char *filename = argv[1];
gzFile gz_in = gzopen( filename, "rb" ); // same as fopen()
if (gz_in != NULL)
{
if ( gzgets( gz_in, line1, sizeof(line1) ) != NULL ) // same as fgets()
{
if ( gzgets( gz_in, line2, sizeof(line2) ) != NULL )
{
if ( gzfread( blob, sizeof(int), 64, gz_in ) == 64 ) // same as fread()
{
printf("Line1: %s", line1);
printf("Line2: %s", line2);
// ...etc
}
}
}
gzclose(gz_in); // same as fclose()
}
else
{
printf( "Failed to GZ-open [%s]\n", filename );
}
}
return 0;
}
Ricorda di collegarti con zlib
, sotto UNIX gcc ... -lz