Como posso obter um e -mail completo :: spamassassin :: MailMessage Object do texto?

StackOverflow https://stackoverflow.com/questions/2199442

  •  25-09-2019
  •  | 
  •  

Pergunta

Eu uso o código a seguir para gerar um relatório de spam usando spamassassin:

use Mail::SpamAssassin;

my $sa = Mail::SpamAssassin->new();

open FILE, "<", "mail.txt";
my @lines = <FILE>;
my $mail = $sa->parse(@lines);

my $status = $sa->check($mail);

my $report = $status->get_report();
$report =~ s/\n/\n<br>/g;

print "<h1>Spam Report</h1>";
print $report;

$status->finish();
$mail->finish();
$sa->finish();

O problema que tenho é que ele classifica 'Sample-Nonspam.txt' como spam:

Content preview: [...] 

Content analysis details: (6.9 points, 5.0 required) 

pts rule name description 
---- ---------------------- -------------------------------------------------- 
-0.0 NO_RELAYS Informational: message was not relayed via SMTP 
1.2 MISSING_HEADERS Missing To: header 
0.1 MISSING_MID Missing Message-Id: header 
1.8 MISSING_SUBJECT Missing Subject: header 
2.3 EMPTY_MESSAGE Message appears to have no textual parts and no 
Subject: text 
-0.0 NO_RECEIVED Informational: message has no Received headers 
1.4 MISSING_DATE Missing Date: header 
0.0 NO_HEADERS_MESSAGE Message appears to be missing most RFC-822 headers 

E essas informações -está- no arquivo. O que me preocupa é que, na documentação, afirma que "Parse retornará um e -mail :: spamassassin :: Message objeto com apenas os cabeçalhos analisados". Isso significa que não retornará uma mensagem completa?

Foi útil?

Solução

Você está perdendo um único personagem:

my $mail = $sa->parse(\@lines);

Dos documentos (com ênfase adicionada):

parse($message, $parse_now [, $suppl_attrib])

Parse retornará um Mail::SpamAssassin::Message Objeto apenas com os cabeçalhos analisados. Ao chamar essa função, existem dois parâmetros opcionais que podem ser passados: $message é também undef (que usará STDIN), um escalar de toda a mensagem, Uma referência de matriz da mensagem com 1 linha por elemento da matriz, ou um glob de arquivos que mantém todo o conteúdo da mensagem; e $parse_now, que especifica se deve ou não criar a árvore de mímica no tempo de análise ou mais tarde, conforme necessário.

Com a mudança acima, recebo a seguinte saída (HTML despojada):

 pts rule name              description
---- ---------------------- --------------------------------------------------
-2.6 BAYES_00               BODY: Bayesian spam probability is 0 to 1%
                            [score: 0.0000]

Como os documentos mencionam, parse é flexível. Você poderia usar

my $mail = $sa->parse(join "" => <FILE>);  # scalar of the entire message

ou

my $mail = $sa->parse(\*FILE);             # a file glob with the entire contents

ou

my $mail;
{ local $/; $mail = $sa->parse(<FILE>) }   # scalar of the entire message

ou até

open STDIN, "<", "mail.txt" or die "$0: open: $!";
my $mail = $sa->parse(undef);              # undef means read STDIN

Você removeria my @lines = <FILE> para esses últimos quatro exemplos funcionarem conforme o esperado.

Outras dicas

Esta é a maneira certa de construir uma mensagem:

my $mail = Mail::SpamAssassin::Message->new({ "message" => $content });
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top