Net 8 bits de codificação

https://stackoverflow.com/questions/111460

02-07-2019
|

Pergunta

Eu estou trabalhando em porta serial, transmitir e receber dados a algum hardware para os dados de 8 bits. Gostaria de armazená-lo como corda para facilitar a comparação e os dados pré-definidos são armazenados como string ou formato hexadecimal no arquivo xml. Descobri que apenas quando se utiliza Encoding.Default que é ANSI que codifica, em seguida, os dados de 8 bits é convertido de forma adequada e facilmente reversível. codificação ASCII vai só funciona para os dados de 7 bits, e não UTF8 ou UTF7 não funciona muito bem, desde que eu estou usando algum personagem 1-255. Encoding.Default seria muito bem, mas eu li no MSDN que é dependente da configuração de página de código do sistema operacional, o que significa que pode se comportar de forma diferente na página de códigos diferente configurado. Eu uso GetBytes () e GetString extensivamente usando a codificação, mas gostaria de uma prova de falhas e método portátil que trabalha o tempo todo, em qualquer configuração. Qualquer idéia ou sugestão melhor para isso?

Solução

Latin-1 aka ISO-8859-1 aka CodePage 28591 é uma página de código útil para este cenário, como ele mapeia valores na faixa de 128-255 inalterado. A seguir são intercambiáveis:

Encoding.GetEncoding(28591)
Encoding.GetEncoding("Latin1")
Encoding.GetEncoding("iso-8859-1")

O código a seguir ilustra o fato de que para Latin1, ao contrário Encoding.Default, todos os caracteres no intervalo 0-255 são mapeados inalterada:

static void Main(string[] args)
{

    Console.WriteLine("Test Default Encoding returned {0}", TestEncoding(Encoding.Default));
    Console.WriteLine("Test Latin1 Encoding returned {0}", TestEncoding(Encoding.GetEncoding("Latin1")));
    Console.ReadLine();
    return;
}

private static bool CompareBytes(char[] chars, byte[] bytes)
{
    bool result = true;
    if (chars.Length != bytes.Length)
    {
        Console.WriteLine("Length mismatch {0} bytes and {1} chars" + bytes.Length, chars.Length);
        return false;
    }
    for (int i = 0; i < chars.Length; i++)
    {
        int charValue = (int)chars[i];
        if (charValue != (int)bytes[i])
        {
            Console.WriteLine("Byte at index {0} value {1:X4} does not match char {2:X4}", i, (int) bytes[i], charValue);
            result = false;
        }
    }
    return result;
}
private static bool TestEncoding(Encoding encoding)
{
    byte[] inputBytes = new byte[256];
    for (int i = 0; i < 256; i++)
    {
        inputBytes[i] = (byte) i;
    }

    char[] outputChars = encoding.GetChars(inputBytes);
    Console.WriteLine("Comparing input bytes and output chars");
    if (!CompareBytes(outputChars, inputBytes)) return false;

    byte[] outputBytes = encoding.GetBytes(outputChars);
    Console.WriteLine("Comparing output bytes and output chars");
    if (!CompareBytes(outputChars, outputBytes)) return false;

    return true;
}

Outras dicas

Porque não basta usar uma matriz de bytes em vez disso? Teria que nenhum dos problemas que codificam é provável que você sofre com a abordagem do texto.

Eu acho que você deve usar um array de bytes em vez. Para efeito de comparação você pode usar algum método como este:

static bool CompareRange(byte[] a, byte[] b, int index, int count)
{
    bool res = true;
    for(int i = index; i < index + count; i++)
    {
        res &= a[i] == b[i];
    }
    return res;
}

Use a página de código hebraico para Windows-1255. Sua 8 bit.
Encoding enc = Encoding.GetEncoding ( "windows-1255");

Eu missunderstod você quando você escreveu "1-255", pensei em você como refereing de caracteres na página de códigos 1255.

Você pode usar codificação Base64 converter de byte para string e volta. Sem problemas com páginas de código ou caracteres estranhos dessa maneira, e ele vai ser mais espaço eficiente do que hex.

byte[] toEncode; 
string encoded = System.Convert.ToBase64String(toEncode);

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow