Como substituo um número arbitrário de referências em sed ou perl? (para ofuscar o correio)

StackOverflow https://stackoverflow.com/questions/3432752

  •  26-09-2019
  •  | 
  •  

Pergunta

Estou procurando uma maneira de ofuscar o Mailtos no código -fonte de um site. Eu gostaria de ir disso:

href="mailto:president@whitehouse.gov"

Para isso:

href="" onmouseover="this.href='mai'+'lto:'+'pre'+'sid'+'ent'+'@wh'+'ite'+'hou'+'se.'+'gov'"</code>

Provavelmente vou ir com uma solução PHP, como isto (Dessa forma, só preciso substituir globalmente o correio inteiro, e a fonte do meu lado ficará melhor), mas passei muito tempo olhando para sed e Perl e agora não consigo parar de pensar em como isso poderia ser feito! Alguma ideia?

Atualizar: Com base fortemente na solução do Eclark, eu finalmente inventei isso:

#!/usr/bin/env perl -pi
if (/href="mailto/i) {
    my $start = (length $`) +6;
    my $len = index($_,'"',$start)-$start;
    substr($_,$start,$len,'" onmouseover="this.href=' .
    join('+',map qq{'$_'}, substr($_,$start,$len) =~ /(.{1,3})/g));
}
Foi útil?

Solução

Com base na idéia de Sinan, aqui está um pequeno script Perl que processará uma linha de arquivo por linha.

#!/usr/bin/env perl -p

my $start = index($_,'href="') +6;
my $len = index($_,'"',$start)-$start;
substr($_,$start,$len+1,'" onmouseover="this.href=' .
  join('+',map qq{'$_'}, substr($_,$start,$len) =~ /(.{1,3})/g)
);

Se você quiser usá -lo, verifique se seus arquivos antigos estão comprometidos com o controle de origem e altere a opção -p para -i, que reescreverá um arquivo no local.

Outras dicas

#!/usr/bin/perl

use strict; use warnings;

my $s = 'mailto:president@whitehouse.gov';

my $obfuscated = join('+' => map qq{'$_'}, $s =~ /(.{1,3})/g );

print $obfuscated, "\n";

Resultado:

'mai'+'lto'+':pr'+'esi'+'den'+'t@w'+'hit'+'eho'+'use'+'.go'+'v'

Observe que 'lto: são quatro caracteres, enquanto parece que você quer três grupos de personagens.

Isso está perto o suficiente?

use strict; 
use warnings; 

my $old = 'href="mailto:president@whitehouse.gov"';
$old =~ s/href="(.*)"/$1/;
my $new = join '+', map { qq('$_') } grep { length $_ } split /(.{3})/, $old;
$new = qq(href=""\nonmouseover="this.href=$new\n");
print "$new\n";

__END__

href=""
onmouseover="this.href='mai'+'lto'+':pr'+'esi'+'den'+'t@w'+'hit'+'eho'+'use'+'.go'+'v'
"

Apenas um exemplo.

$ echo $s
href="mailto:president@whitehouse.gov"

$ echo $s | sed 's|\(...\)|\1+|g' | sed 's/hre+f=\"/href="" onmouseover="this.href=/'
href="" onmouseover="this.href=+mai+lto+:pr+esi+den+t@w+hit+eho+use+.go+v"

ACK! Thppfft! Eu te ofereço esta bola de cabelo:

s='href="mailto:president@whitehouse.gov"'
echo "$s" | sed -n 's/=/=\x22\x22\n/;
h;
s/\n.*//;
x;
s/[^\n]*\n//;
s/"//g;
s/\(...\)/\x27&\x27+/g;
s/.*/onmouseover=\x22this.href=&\x22/;
x;
G;
s/\n//2;
s/+\([^\x22]\{1,2\}\)\x22$/+\x27\1\x27\x22/;
s/+\x22$/\x22/;
p'
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top