Come faccio a sostituire un numero arbitrario di backreference in sed o Perl? (Per offuscamento mailto)
Domanda
Sto cercando un modo per mailtos offuscare nel codice sorgente di un sito web. Mi piacerebbe andare da questo:
href="mailto:president@whitehouse.gov"
Per questo:
href="" onmouseover="this.href='mai'+'lto:'+'pre'+'sid'+'ent'+'@wh'+'ite'+'hou'+'se.'+'gov'"</code>
Sono probabilmente andando ad andare con una soluzione PHP, invece, come questo ( in questo modo ho solo sostituire globalmente l'intera mailto, e la sorgente da parte mia un aspetto migliore), ma ho trascorso troppo tempo a guardare sed e Perl e ora non riesco a pensare di arresto su come questo potrebbe essere fatto! Tutte le idee?
Aggiornamento: Sulla base pesantemente sulla soluzione di eclark, alla fine ho arrivato fino a questo:
#!/usr/bin/env perl -pi
if (/href="mailto/i) {
my $start = (length $`) +6;
my $len = index($_,'"',$start)-$start;
substr($_,$start,$len,'" onmouseover="this.href=' .
join('+',map qq{'$_'}, substr($_,$start,$len) =~ /(.{1,3})/g));
}
Soluzione
Sulla base dell'idea di Sinan, ecco una breve script perl che elaborerà un file riga per riga.
#!/usr/bin/env perl -p
my $start = index($_,'href="') +6;
my $len = index($_,'"',$start)-$start;
substr($_,$start,$len+1,'" onmouseover="this.href=' .
join('+',map qq{'$_'}, substr($_,$start,$len) =~ /(.{1,3})/g)
);
Se avete intenzione di usarlo, assicurarsi di avere i vecchi file impegnati a controllo del codice sorgente e modificare l'opzione -p per -i, che riscriverà un file sul posto.
Altri suggerimenti
#!/usr/bin/perl
use strict; use warnings;
my $s = 'mailto:president@whitehouse.gov';
my $obfuscated = join('+' => map qq{'$_'}, $s =~ /(.{1,3})/g );
print $obfuscated, "\n";
Output:
'mai'+'lto'+':pr'+'esi'+'den'+'t@w'+'hit'+'eho'+'use'+'.go'+'v'
Si noti che 'lto:
è di quattro caratteri, mentre sembra che si desidera tre gruppi di caratteri.
E 'questo abbastanza vicino?
use strict;
use warnings;
my $old = 'href="mailto:president@whitehouse.gov"';
$old =~ s/href="(.*)"/$1/;
my $new = join '+', map { qq('$_') } grep { length $_ } split /(.{3})/, $old;
$new = qq(href=""\nonmouseover="this.href=$new\n");
print "$new\n";
__END__
href=""
onmouseover="this.href='mai'+'lto'+':pr'+'esi'+'den'+'t@w'+'hit'+'eho'+'use'+'.go'+'v'
"
Solo un esempio.
$ echo $s
href="mailto:president@whitehouse.gov"
$ echo $s | sed 's|\(...\)|\1+|g' | sed 's/hre+f=\"/href="" onmouseover="this.href=/'
href="" onmouseover="this.href=+mai+lto+:pr+esi+den+t@w+hit+eho+use+.go+v"
Ack! ! Thppfft vi offro questo hairball:
s='href="mailto:president@whitehouse.gov"'
echo "$s" | sed -n 's/=/=\x22\x22\n/;
h;
s/\n.*//;
x;
s/[^\n]*\n//;
s/"//g;
s/\(...\)/\x27&\x27+/g;
s/.*/onmouseover=\x22this.href=&\x22/;
x;
G;
s/\n//2;
s/+\([^\x22]\{1,2\}\)\x22$/+\x27\1\x27\x22/;
s/+\x22$/\x22/;
p'