htmlspecialchars che provoca il testo sparire
-
13-12-2019 - |
Domanda
Ho incontrato una stringa particolare (non è completamente stampabile, ma puoi vederlo sotto) che fa sì che un htmlspecialchars () restituisca una stringa a lunghezza zero.C'è un modo in cui questo può essere risolto?
$Stmnt = 'SELECT subject_name FROM bans WHERE id = 2321';
$Fetch = $Conn->query($Stmnt);
if(!$Fetch)
die('Could not query DB');
while($Row = $Fetch->fetch_array(MYSQLI_ASSOC))
{
$RawName = $Row['subject_name'];
$RawLen = strlen($RawName);
echo('RAW NAME: ['.$RawName.']'.', LENGTH: ['.$RawLen.']'.'<br />');
for($i = 0; $i < $RawLen; $i++)
echo('CHAR '.$i.' = ['.$RawName[$i].'] (ORD: '.ord($RawName[$i]).')<br />');
$CleanName = htmlspecialchars($RawName, ENT_QUOTES, 'UTF-8');
$CleanLen = strlen($CleanName);
echo('CLEAN NAME: ['.$CleanName.']'.', LENGTH: ['.$CleanLen.']'.'<br />');
for($i = 0; $i < $CleanLen; $i++)
echo('CHAR '.$i.' = ['.$CleanName[$i].'] (ORD: '.ord($CleanName[$i]).')<br />');
}
$Fetch->close();
echo('DONE');
.
Uscita:
RAW NAME: [━═★ Coммander Fι5н �], LENGTH: [31]
CHAR 0 = [�] (ORD: 226)
CHAR 1 = [�] (ORD: 148)
CHAR 2 = [�] (ORD: 129)
CHAR 3 = [�] (ORD: 226)
CHAR 4 = [�] (ORD: 149)
CHAR 5 = [�] (ORD: 144)
CHAR 6 = [�] (ORD: 226)
CHAR 7 = [�] (ORD: 152)
CHAR 8 = [�] (ORD: 133)
CHAR 9 = [ ] (ORD: 32)
CHAR 10 = [C] (ORD: 67)
CHAR 11 = [o] (ORD: 111)
CHAR 12 = [�] (ORD: 208)
CHAR 13 = [�] (ORD: 188)
CHAR 14 = [�] (ORD: 208)
CHAR 15 = [�] (ORD: 188)
CHAR 16 = [a] (ORD: 97)
CHAR 17 = [n] (ORD: 110)
CHAR 18 = [d] (ORD: 100)
CHAR 19 = [e] (ORD: 101)
CHAR 20 = [r] (ORD: 114)
CHAR 21 = [ ] (ORD: 32)
CHAR 22 = [F] (ORD: 70)
CHAR 23 = [�] (ORD: 206)
CHAR 24 = [�] (ORD: 185)
CHAR 25 = [5] (ORD: 53)
CHAR 26 = [�] (ORD: 208)
CHAR 27 = [�] (ORD: 189)
CHAR 28 = [ ] (ORD: 32)
CHAR 29 = [�] (ORD: 226)
CHAR 30 = [�] (ORD: 148)
CLEAN NAME: [], LENGTH: [0]
DONE
. Soluzione
Capisco ora perché restituisce una stringa zero. Mi dispiace per aver fatto questa domanda. Avrei dovuto studiarsi di più prima di postare. Ad ogni modo, la risposta è la seguente:
sul manuale PHP Pagina per htmlspecialchars :
.Se la stringa di input contiene una sequenza di unità di codice non valida all'interno della codifica dettagliata, verrà restituita una stringa vuota, a meno che non siano impostati i flag Ent_ignore o ENT_SubStitute.
Allora mi chiedo cosa è "non valido" su questa stringa? Sul wiki Pagina per UTF-8 Dona un buon diagramma di utf- 8 codifica. Tutti i codepoint che rappresentano "Testo chiaro ASCII" sarebbe 0-127 (il MSB nel byte è sempre 0).
Se il msb di un byte è 1 (decimale da 128 a 255) indica un parser conforme UTF-8 che il CodePoint è costituito da una catena multi-byte. e NEXT I primi due bit più significativi devono essere un 1 seguito da uno 0.
Ovviamente in questa stringa, c'è un caso in cui un byte è più di 127 e il seguente byte non inizia con un 1 e 0. Pertanto è la codifica UTF-8 non valida.
Grazie per Questo post Per la risoluzione, che a mio avviso, è quello di utilizzare la bandiera Ent_Substite (o suppongo Ent_ignore se sei sicuro che eliminazione di questi byte non conformi non saranno un problema di sicurezza ).