Come posso confrontare lista dei file da un archivio tar e directory?
Domanda
sto ancora imparando Perl. Qualcuno può per favore mi suggeriscono il codice Perl per confrontare i file da .tar.gz e un percorso di directory.
Diciamo che ho il backup tar.gz di seguire il percorso della directory che ho preso qualche giorno fa.
a/file1
a/file2
a/file3
a/b/file4
a/b/file5
a/c/file5
a/b/d/file and so on..
Ora voglio confrontare i file e le directory in questo percorso con il file di backup tar.gz.
Si prega di suggerire codice Perl per farlo.
Soluzione
Questo potrebbe essere un buon punto di partenza per un buon programma Perl. Fa quello che la questione ha chiesto però.
E 'stato appena messo insieme, e ignora la maggior parte delle migliori pratiche per il Perl.
perl test.pl full \ Downloads/update-dnsomatic-0.1.2.tar.gz \ Downloads/ \ update-dnsomatic-0.1.2
#! /usr/bin/env perl
use strict;
use 5.010;
use warnings;
use autodie;
use Archive::Tar;
use File::Spec::Functions qw'catfile catdir';
my($action,$file,$directory,$special_dir) = @ARGV;
if( @ARGV == 1 ){
$file = *STDOUT{IO};
}
if( @ARGV == 3 ){
$special_dir = '';
}
sub has_file(_);
sub same_size($$);
sub find_missing(\%$);
given( lc $action ){
# only compare names
when( @{[qw'simple name names']} ){
my @list = Archive::Tar->list_archive($file);
say qq'missing file: "$_"' for grep{ ! has_file } @list;
}
# compare names, sizes, contents
when( @{[qw'full aggressive']} ){
my $next = Archive::Tar->iter($file);
my( %visited );
while( my $file = $next->() ){
next unless $file->is_file;
my $name = $file->name;
$visited{$name} = 1;
unless( has_file($name) ){
say qq'missing file: "$name"' ;
next;
}
unless( same_size( $name, $file->size ) ){
say qq'different size: "$name"';
next;
}
next unless $file->size;
unless( same_checksum( $name, $file->get_content ) ){
say qq'different checksums: "$name"';
next;
}
}
say qq'file not in archive: "$_"' for find_missing %visited, $special_dir;
}
}
sub has_file(_){
my($file) = @_;
if( -e catfile $directory, $file ){
return 1;
}
return;
}
sub same_size($$){
my($file,$size) = @_;
if( -s catfile($directory,$file) == $size ){
return $size || '0 but true';
}
return; # empty list/undefined
}
sub same_checksum{
my($file,$contents) = @_;
require Digest::SHA1;
my($outside,$inside);
my $sha1 = Digest::SHA1->new;
{
open my $io, '<', catfile $directory, $file;
$sha1->addfile($io);
close $io;
$outside = $sha1->digest;
}
$sha1->add($contents);
$inside = $sha1->digest;
return 1 if $inside eq $outside;
return;
}
sub find_missing(\%$){
my($found,$current_dir) = @_;
my(@dirs,@files);
{
my $open_dir = catdir($directory,$current_dir);
opendir my($h), $open_dir;
while( my $elem = readdir $h ){
next if $elem =~ /^[.]{1,2}[\\\/]?$/;
my $path = catfile $current_dir, $elem;
my $open_path = catfile $open_dir, $elem;
given($open_path){
when( -d ){
push @dirs, $path;
}
when( -f ){
push @files, $path, unless $found->{$path};
}
default{
die qq'not a file or a directory: "$path"';
}
}
}
}
for my $path ( @dirs ){
push @files, find_missing %$found, $path;
}
return @files;
}
Dopo aver rinominato config
a config.rm
, l'aggiunta di un carattere in più per README
, cambiando un char in install.sh
, e l'aggiunta di un file .test
. Questo è ciò che in uscita:
missing file: "update-dnsomatic-0.1.2/config" different size: "update-dnsomatic-0.1.2/README" different checksums: "update-dnsomatic-0.1.2/install.sh" file not in archive: "update-dnsomatic-0.1.2/config.rm" file not in archive: "update-dnsomatic-0.1.2/.test"
Altri suggerimenti
Il Archive::Tar
e moduli File::Find
sarà utile. Un esempio di base è mostrato sotto. Esso stampa solo le informazioni sui file in un tar ei file in un albero di directory.
Non era chiaro dalla tua domanda come si desidera confrontare i file. Se avete bisogno di confrontare il contenuto effettivo, sarà probabilmente necessario il metodo get_content()
in Archive::Tar::File
. Se un paragone più semplice è sufficiente (per esempio, il nome, la dimensione e mtime), non sarà necessario molto di più rispetto ai metodi utilizzati nell'esempio qui sotto.
#!/usr/bin/perl
use strict;
use warnings;
# A utility function to display our results.
sub Print_file_info {
print map("$_\n", @_), "\n";
}
# Print some basic information about files in a tar.
use Archive::Tar qw();
my $tar_file = 'some_tar_file.tar.gz';
my $tar = Archive::Tar->new($tar_file);
for my $ft ( $tar->get_files ){
# The variable $ft is an Archive::Tar::File object.
Print_file_info(
$ft->name,
$ft->is_file ? 'file' : 'other',
$ft->size,
$ft->mtime,
);
}
# Print some basic information about files in a directory tree.
use File::Find;
my $dir_name = 'some_directory';
my @files;
find(sub {push @files, $File::Find::name}, $dir_name);
Print_file_info(
$_,
-f $_ ? 'file' : 'other',
-s,
(stat)[9],
) for @files;
Perl è una specie di eccessivo per questo, davvero. Uno script di shell farebbe bene. I passi è necessario prendere però:
- Estrarre il tar in una cartella temporanea da qualche parte.
-
diff -uR
le due cartelle e reindirizzare l'output da qualche parte (o forse tuboless
come appropriato) - Pulire la cartella temporanea.
E il gioco è fatto. non dovrebbe essere più di 5-6 righe. Qualcosa di veloce e non testati:
#!/bin/sh
mkdir $TEMP/$$
tar -xz -f ../backups/backup.tgz $TEMP/$$
diff -uR $TEMP/$$ ./ | less
rm -rf $TEMP/$$
Ecco un esempio che controlla per vedere se tutti i file che si trova in un archivio, esiste anche in una cartella.
# $1 is the file to test
# $2 is the base folder
for file in $( tar --list -f $1 | perl -pe'chomp;$_=qq["'$2'$_" ]' )
do
# work around bash deficiency
if [[ -e "$( perl -eprint$file )" ]]
then
echo " $file"
else
echo "no $file"
fi
done
Questo è il modo che ho provato questo:
Ho rimosso / config
rinominato, poi corse il seguente:
bash test Downloads/update-dnsomatic-0.1.2.tar.gz Downloads/
che ha dato l'output di:
"Downloads/update-dnsomatic-0.1.2/" no "Downloads/update-dnsomatic-0.1.2/config" "Downloads/update-dnsomatic-0.1.2/update-dnsomatic" "Downloads/update-dnsomatic-0.1.2/README" "Downloads/update-dnsomatic-0.1.2/install.sh"
Sono nuovo di colpire / programmazione della shell, quindi c'è probabilmente un modo migliore per farlo.