Qu'est-ce que "=C2=A0" dans le texte codé MIME, Cité-imprimable?

Ceci est un exemple de courriel brut que j'essaie d'analyser:

MIME-version: 1.0
Content-type: text/html; charset=UTF-8
Content-transfer-encoding: quoted-printable
X-Mailer: Verizon Webmail
X-Originating-IP: [x.x.x.x]

=C2=A0test testing testing 123

Qu'est-ce que =C2=A0? J'ai essayé une demi-douzaine de parsers Cités-imprimables, mais aucun ne gère cela correctement. Comment pourrait-on bien analyser ceci en C#?

Honnêtement, pour l'instant, je suis codage:

//TODO WTF
encoded = encoded.Replace("=C2=A0", "");

parce que je ne peux pas comprendre pourquoi ce texte est là au hasard dans le contenu MIME, et n'est pas censé être rendu en quoi que ce soit. En supprimant simplement, je suis la effet souhaité - mais pourquoi?!

pour être clair, je sais que (=[0-9A-f]{2}) est un caractère encodé. Mais dans ce cas, cela ne représente apparemment rien.

43
demandé sur TheSoftwareJedi 2010-05-05 19:15:37

1 réponses

"= C2=A0 " représente les octets C2 A0. Cependant, comme il S'agit de L'UTF-8, il se traduit par 00A0, qui est L'Unicode pour l'espace sans rupture.

voir http://en.wikipedia.org/wiki/UTF-8

77
répondu Steven Sudit 2014-05-02 13:28:43