PHP DOMDocument: loadHTMLFile engasgando com um personagem misterioso: RS
-
18-09-2019 - |
Pergunta
Usando de php DOMDocument-> loadHTMLFile ( 'test.html'); continua retornando um erro para mim, relatando por um erro no conteúdo na linha 36. caráter Excluindo depois caracteres, verifica-se que é um espaço aparentemente vazio que era o culpado. Copiar / colar essa frase em outro editor (Editra), mostrou um personagem RS estranho.
O que é isso, e mais importante, como posso evitar que isso aconteça novamente?
Solução
É um Registro separador
Pode ser usado como delimitadores para campos de marca de estruturas de dados. Se for usado para níveis hierárquicos, US é o nível mais baixo (dividindo itens de dados de texto simples), enquanto RS, GS e FS são de crescente nível para grupos dividem compostas de itens do nível abaixo dela.
SEQ:^^
- Dec: 30 - Hex: 1E - sigla: RS
O que você pode fazer é usar strtr()
para despir não caracteres visíveis. Um exemplo de Joel Degan em PHP.net deverá fazê-lo no seu caminho.
Outras dicas
Se bem me lembro, PHP está jogando um erro não-fatal neste caso. Ele vai reclamar sobre um monte de coisas, que você não pode fazer nada sobre se o arquivo não é criado por você. O que você pode fazer, é práticas de programação mau uso e suprimir os erros, colocando @ antes do comando.
@DOMDocument->LoadHTMLFile('test.html');
Ele ainda deve carregar o arquivo, mas você vai ser "ignorando" os erros. A ignorância é felicidade?