Pergunta

Usando de php DOMDocument-> loadHTMLFile ( 'test.html'); continua retornando um erro para mim, relatando por um erro no conteúdo na linha 36. caráter Excluindo depois caracteres, verifica-se que é um espaço aparentemente vazio que era o culpado. Copiar / colar essa frase em outro editor (Editra), mostrou um personagem RS estranho.

O que é isso, e mais importante, como posso evitar que isso aconteça novamente?

Foi útil?

Solução

É um Registro separador

Pode ser usado como delimitadores para campos de marca de estruturas de dados. Se for usado para níveis hierárquicos, US é o nível mais baixo (dividindo itens de dados de texto simples), enquanto RS, GS e FS são de crescente nível para grupos dividem compostas de itens do nível abaixo dela.
SEQ: ^^ - Dec: 30 - Hex: 1E - sigla: RS

O que você pode fazer é usar strtr() para despir não caracteres visíveis. Um exemplo de Joel Degan em PHP.net deverá fazê-lo no seu caminho.

Outras dicas

Se bem me lembro, PHP está jogando um erro não-fatal neste caso. Ele vai reclamar sobre um monte de coisas, que você não pode fazer nada sobre se o arquivo não é criado por você. O que você pode fazer, é práticas de programação mau uso e suprimir os erros, colocando @ antes do comando.

@DOMDocument->LoadHTMLFile('test.html');

Ele ainda deve carregar o arquivo, mas você vai ser "ignorando" os erros. A ignorância é felicidade?

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top