Pregunta

Este es un ejemplo de correo electrónico prima que estoy tratando de analizar:

MIME-version: 1.0
Content-type: text/html; charset=UTF-8
Content-transfer-encoding: quoted-printable
X-Mailer: Verizon Webmail
X-Originating-IP: [x.x.x.x]

=C2=A0test testing testing 123

¿Cuál es = C2 = A0? He tratado de una media docena de programas de análisis citado imprimibles, pero ninguno mango esto correctamente. ¿Cómo se podría analizar adecuadamente esto en C #?

Sinceramente, por ahora, estoy de codificación:

//TODO WTF
encoded = encoded.Replace("=C2=A0", "");

Debido a que no puedo entender por qué ese texto no es al azar dentro del contenido MIME, y no se supone que debe ser dictada en cualquier cosa. Por sólo la eliminación de ella, me estoy haciendo el efecto deseado - pero ¿por qué

?!

Para ser claros, sé que (= [0-9A-F] {2}) es un carácter codificado. Pero en este caso, que aparentemente no representa nada.

¿Fue útil?

Solución

"= C2 = A0" representa los bytes C2 A0. Sin embargo, ya que este es UTF-8, que se traduce en 00A0, que es el Unicode para el espacio de no separación.

Consulte UTF-8 (Wikipedia).

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top