Вопрос

Я кодирую сортировку массива суффиксов, и этот алгоритм добавляет символ Sentinel к исходной строке. Этот символ не должен быть в исходной строке.

Поскольку этот алгоритм будет обрабатывать байты двоичных файлов, есть ли какой -нибудь особый байтовый символ, который я смогу убедиться, что я не найду в каком -либо двоичном файле? Если он существует, как мне представлять этот персонаж в кодировании C ++?

Я на Linux, я не уверен, что это имеет значение.

Это было полезно?

Решение

Нет, нет. Двоичные файлы могут содержать каждую комбинацию значений байтов. Я бы не назвал их «персонажами», потому что это двоичные данные, а не (обязательно) представляют символы. Но независимо от названия, они могут иметь какую -либо ценность.

Другие советы

Это больше похоже на вопрос, который вы должны ответить себе. Мы не знаем, какие бинарные данные у вас есть и какие символы могут быть там, а что нет. Если вы говорите о общих двоичных данных - может быть какая -либо комбинация битов и байтов и символов, поэтому такого персонажа нет.

С другой точки зрения вы говорите о струнах. Какие струны? Строки ASCII? Например, коды ASCII имеют очень ограниченный диапазон, так что вы можете использовать 128, например. Некоторые старые протоколы используют SOH (\1) для аналогичных целей. Так что может быть способ, если вы точно знаете, какие строки вы обрабатываете.

Насколько мне известно, массив суффиксов не может быть применен к произвольным бинарным данным (ну, это может, но это не имеет никакого смысла).

Файл может содержать только биты. Группы битов могут быть интерпретированы как персонаж ASCII, номер плавающей запятой, фотографию в формате JPEG, все, что вы можете себе представить. Интерпретация основана на схеме кодирования (например, ASCII, BCD), которую вы выбираете. Если ваша схема кодирования не заполняет всю таблицу возможных кодов, вы можете выбрать одну для своих специальных настроений (например, цифры могут быть кодированы наивно на 4 битах, 2^4 = 16, так что у вас есть 6 избыточных кодовых слов).

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top