Вопрос
Я работаю над последовательным портом, передаю и получаю данные на некоторое оборудование со скоростью 8 бит данных.Я хотел бы сохранить его в виде строки, чтобы облегчить сравнение, а предустановленные данные хранятся в виде строки или шестнадцатеричного формата в xml-файле.Я обнаружил это только при использовании кодировки.По умолчанию используется кодировка ANSI, тогда 8-битные данные преобразуются должным образом и легко обратимы1.Кодировка ASCII будет работать только для 7-битных данных, а UTF8 или UTF7 тоже не очень хорошо работают, так как я использую некоторые символы из 1-255.Кодировка.По умолчанию было бы просто замечательно, но я прочитал в MSDN, что это зависит от настройки кодовой страницы ОС, что означает, что она может вести себя по-разному на разных настроенных кодовых страницах.Я широко использую getBytes() и getString, используя кодировку, но хотел бы иметь отказоустойчивый и переносимый метод, который работает постоянно при любой конфигурации.Есть какая-нибудь идея или лучшее предложение по этому поводу?
Решение
Latin-1, он же ISO-8859-1, он же codepage 28591, является полезной кодовой страницей для этого сценария, поскольку она отображает значения в диапазоне 128-255 без изменений.Следующие компоненты взаимозаменяемы:
Encoding.GetEncoding(28591)
Encoding.GetEncoding("Latin1")
Encoding.GetEncoding("iso-8859-1")
Следующий код иллюстрирует тот факт, что для Latin1, в отличие от Encoding.По умолчанию все символы в диапазоне 0-255 отображаются без изменений:
static void Main(string[] args)
{
Console.WriteLine("Test Default Encoding returned {0}", TestEncoding(Encoding.Default));
Console.WriteLine("Test Latin1 Encoding returned {0}", TestEncoding(Encoding.GetEncoding("Latin1")));
Console.ReadLine();
return;
}
private static bool CompareBytes(char[] chars, byte[] bytes)
{
bool result = true;
if (chars.Length != bytes.Length)
{
Console.WriteLine("Length mismatch {0} bytes and {1} chars" + bytes.Length, chars.Length);
return false;
}
for (int i = 0; i < chars.Length; i++)
{
int charValue = (int)chars[i];
if (charValue != (int)bytes[i])
{
Console.WriteLine("Byte at index {0} value {1:X4} does not match char {2:X4}", i, (int) bytes[i], charValue);
result = false;
}
}
return result;
}
private static bool TestEncoding(Encoding encoding)
{
byte[] inputBytes = new byte[256];
for (int i = 0; i < 256; i++)
{
inputBytes[i] = (byte) i;
}
char[] outputChars = encoding.GetChars(inputBytes);
Console.WriteLine("Comparing input bytes and output chars");
if (!CompareBytes(outputChars, inputBytes)) return false;
byte[] outputBytes = encoding.GetBytes(outputChars);
Console.WriteLine("Comparing output bytes and output chars");
if (!CompareBytes(outputChars, outputBytes)) return false;
return true;
}
Другие советы
Почему бы просто не использовать вместо этого массив байтов?У него не было бы ни одной из проблем с кодировкой, с которыми вы, вероятно, столкнетесь при текстовом подходе.
Я думаю, вместо этого вам следует использовать массив байтов.Для сравнения вы можете использовать какой-нибудь метод, подобный этому:
static bool CompareRange(byte[] a, byte[] b, int index, int count)
{
bool res = true;
for(int i = index; i < index + count; i++)
{
res &= a[i] == b[i];
}
return res;
}
Используйте кодовую страницу на иврите для Windows-1255.Его 8 бит.
Encoding enc = Кодирование.GetEncoding ("windows-1255");
Я не понял вас, когда вы написали "1-255", подумал, что вы ссылаетесь на символы кодовой страницы 1255.
Вы могли бы использовать кодировку base64 для преобразования из байта в строку и обратно.Таким образом, не будет проблем с кодовыми страницами или странными символами, и это будет более экономично по сравнению с шестнадцатеричным.
byte[] toEncode;
string encoded = System.Convert.ToBase64String(toEncode);