¿De cuántas maneras diferentes hay para concatenar dos archivos línea por línea usando Perl?

https://stackoverflow.com/questions/1636755

06-07-2019
|

Pregunta

Suponga que el archivo1 se ve así:

bye bye
hello
thank you

Y file2 se ve así:

chao
hola
gracias

El resultado deseado es este:

bye bye chao
hello hola
thank you gracias

Yo mismo ya he ideado cinco enfoques diferentes para resolver este problema. Pero creo que debe haber más formas, probablemente formas más concisas y elegantes, y espero poder aprender más cosas interesantes :)

Lo siguiente es lo que he intentado hasta ahora, basado en lo que he aprendido de las muchas soluciones de mis problemas anteriores. Además, estoy tratando de digerir o internalizar el conocimiento que adquirí del libro Llama.

Código 1:

#!perl
use autodie;
use warnings;
use strict;

open my $file1,'<','c:/file1.txt';
open my $file2,'<','c:/file2.txt';

while(defined(my $line1 = <$file1>)
        and defined(my $line2 = <$file2>)){
    die "Files are different sizes!\n" unless eof(file1) == eof(file2);
    $line1 .= $line2;
    $line1 =~ s/\n/ /;
    print "$line1 \n";
}

Código 2:

#!perl
use autodie;
use warnings;
use strict;

open my $file1,'<','c:/file1.txt';
my @file1 = <$file1>;

open my $file2,'<','c:/file2.txt';
my @file2 =<$file2>;

for (my $n=0; $n<=$#file1; $n++) {
    $file1[$n] .=$file2[$n];
    $file1[$n]=~s/\n/ /;
    print $file1[$n];
}

Código 3:

#!perl
use autodie;
use warnings;
use strict;

open my $file1,'<','c:/file1.txt';
open my $file2,'<','c:/file2.txt';

my %hash;

while(defined(my $line1 = <$file1>)
      and defined(my $line2 = <$file2>)) {
  chomp $line1;
  chomp $line2;
  my ($key, $val) = ($line1,$line2);
  $hash{$key} = $val;
}
print map { "$_ $hash{$_}\n" } sort keys %hash;

Código 4:

#!perl
use autodie;
use warnings;
use strict;

open my $file1,'<','c:/file1.txt';
open my $file2,'<','c:/file2.txt';

while(defined(my $line1 = <$file1>)
      and defined(my $line2 = <$file2>)) {
  $line1 =~ s/(.+)/$1 $line2/;
  print $line1;
}

Código 5:

#!perl
use autodie;
use warnings;
use strict;

open my $file1,'<','c:/file1.txt';
my @file1 =<$file1>;

open my $file2,'<','c:/file2.txt';
my @file2 =<$file2>;

while ((@file1) && (@file2)){ 
    my $m = shift (@file1);
    chomp($m);

    my $n = shift (@file2);
    chomp($n);

    $m .=" ".$n;
    print "$m \n";
}

He intentado algo como esto:

foreach $file1 (@file2) && foreach $file2 (@file2) {...}

Pero Perl me dio una advertencia de error sintáctico. Estaba frustrado ¿Pero podemos ejecutar dos foreach bucles simultáneamente?

Gracias, como siempre, por cualquier comentario, sugerencia y, por supuesto, el generoso intercambio de código :)

Solución

Esto funciona para cualquier número de archivos:

use strict;
use warnings;
use autodie;

my @handles = map { open my $h, '<', $_; $h } @ARGV;

while (@handles){
    @handles = grep { ! eof $_ } @handles;
    my @lines = map { my $v = <$_>; chomp $v; $v } @handles;
    print join(' ', @lines), "\n";
}

close $_ for @handles;

Otros consejos

La forma más elegante no implica perl en absoluto:

paste -d' ' file1 file2

Si fuera un jugador de golf, podría volver a escribir Respuesta de @ FM como:

($,,$\)=(' ',"\n");@_=@ARGV;open $_,$_ for @_;print
map{chomp($a=<$_>);$a} @_=grep{!eof $_} @_ while @_

que puede ser capaz de convertir en una sola línea, pero eso es simplemente malvado. ;-)

Bueno, aquí está, con menos de 100 caracteres:

C:\Temp> perl -le "$,=' ';@_=@ARGV;open $_,$_ for @_;print map{chomp($a =<$_>);$a} @_=grep{!eof $_ }@_ while @_" file1 file2

Si está bien sorber (y ¿por qué diablos no & # 8212; nosotros somos buscando diferentes formas), creo que he descubierto el camino la locura:

@_=@ARGV;chomp($x[$.-1]{$ARGV}=$_) && eof
and $.=0 while<>;print "@$_{@_}\n" for @x

C:\Temp> perl -e "@_=@ARGV;chomp($x[$.-1]{$ARGV}=$_) && eof and $.=0 while<>;print qq{@$_{@_}\n} for @x" file1 file2

Salida:

bye bye chao
hello hola
thank you gracias

Una alternativa más fácil a su Código 5 que permite un número arbitrario de líneas y no le importa si los archivos tienen un número diferente de líneas (hat tip @FM):

#!/usr/bin/perl

use strict; use warnings;

use File::Slurp;
use List::AllUtils qw( each_arrayref );

my @lines = map [ read_file $_ ], @ARGV;

my $it = each_arrayref @lines;

while ( my @lines = grep { defined and chomp and length } $it->() ) {
    print join(' ', @lines), "\n";
}

Y, sin usar ningún módulo externo:

#!perl
use autodie; use warnings; use strict;

my ($file1, $file2) = @ARGV;

open my $file1_h,'<', $file1;
my @file1 = grep { chomp; length } <$file1_h>;

open my $file2_h,'<', $file2;
my @file2 =  grep { chomp; length } <$file2_h>;

my $n_lines = @file1 > @file2 ? @file1 : @file2;

for my $i (0 .. $n_lines - 1) {
    my ($line1, $line2) = map {
        defined $_ ? $_ : ''
    } $file1[$i], $file2[$i];
    print $line1, ' ', $line2, "\n";
}

Si desea concatenar solo las líneas que aparecen en ambos archivos:

#!perl
use autodie; use warnings; use strict;

my ($file1, $file2) = @ARGV;

open my $file1_h,'<', $file1;
my @file1 = grep { chomp; length } <$file1_h>;

open my $file2_h,'<', $file2;
my @file2 =  grep { chomp; length } <$file2_h>;

my $n_lines = @file1 < @file2 ? @file1 : @file2;

for my $i (0 .. $n_lines - 1) {
    print $file1[$i], ' ', $file2[$i], "\n";
}

Fácil con una mínima verificación de errores:

#!/usr/bin/perl -w

use strict;

open FILE1, '<file1.txt';
open FILE2, '<file2.txt';

while (defined(my $one = <FILE1>) or defined(my $twotemp = <FILE2>)){
    my $two = $twotemp ? $twotemp : <FILE2>;
    chomp $one if ($one);
    chomp $two if ($two);
    print ''.($one ? "$one " : '').($two ? $two : '')."\n";
}

Y no, no puede ejecutar dos bucles simultáneamente dentro del mismo hilo, tendría que fork, pero no se garantizaría que se ejecute sincrónicamente.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow