Существуют ли какие-либо Java Frameworks для анализа двоичных файлов?

StackOverflow https://stackoverflow.com/questions/644737

Вопрос

Моя проблема в том, что я хочу анализировать двоичные файлы разных типов с помощью универсального парсера, реализованного на JAVA.Возможно, описание формата файла с помощью файла конфигурации, который читается анализатором, или создание классов Java, которые анализируют файлы в соответствии с какими-то правилами анализа.

Я много искал в Интернете, но почти ничего не нашел по этой теме.

То, что я нашел, - это всего лишь вещи, которые имеют дело с компиляторами-генераторами (Джей, Койен и т. д.), но я не думаю, что смогу использовать их для генерации чего-либо для анализа двоичных файлов.Но я могу ошибаться в этом предположении.

Существуют ли какие-либо структуры, которые специально предназначены для простого анализа двоичных файлов, или может ли кто-нибудь дать мне подсказку, как я мог бы использовать для этого генераторы синтаксического анализатора/компилятора?

Обновлять:Я ищу что-то, где я могу написать файл конфигурации, например

file:
  header: FIXED("MAGIC")
  body: content(10)

content:
  value1: BYTE
  value2: LONG
  value3: STRING(10)

и он автоматически генерирует что-то, что анализирует файлы, начинающиеся с «MAGIC», за которыми следует десятикратный пакет контента (который сам состоит из байтовой, длинной и 10-байтовой строки).

Обновление2:Я нашел нечто похожее на то, что ищу»,Построить", но, к сожалению, это Python-фреймворк.Возможно, это поможет кому-то понять, что я ищу.

Это было полезно?

Решение

попробовать преон

Другие советы

С использованием Преон:

public class File {

  @BoundString(match="MAGIC")
  private String header;

  @BoundList(size="10", type=Body.class)
  private List<Body> body;

  private static class Body {

    @Bound
    byte value1;

    @Bound
    long value2;

    @BoundString(size="10")
    String value3;

  }


}

Расшифровка данных:

Codec<File> codec = Codecs.create(File.class);
File file = codecs.decode(codec, buffer);

Дайте мне знать, если у вас возникнут проблемы.

Я использовал DataInputStream для чтения двоичных файлов и пишу правила на Java.;) Бинарные файлы могут иметь практически любой формат, поэтому не существует общего правила их чтения.

Фреймворки не всегда упрощают задачу.В вашем случае файл описания длиннее, чем код для простого чтения данных с помощью DataInputStream.

public static void parse(DataInput in) throws IOException {
//        file:
//          header: FIXED("MAGIC")
    String header = readAsString(in, 5);
    assert header.equals("MAGIC");
//          body: content(10)
// ?? not sure what this means
//        content:
    for(int i=0;i<10;i++) {
//          value1: BYTE
        byte value1 = in.readByte();
//          value2: LONG
        long value2 = in.readLong();
//          value3: STRING(10)
        String value3 = readAsString(in, 10);
    }
}

public static String readAsString(DataInput in, int len) throws IOException {
    byte[] bytes = new byte[len];
    in.readFully(bytes);
    return new String(bytes);
}

Если вы хотите иметь файл конфигурации, вы можете использовать файл конфигурации Java. http://www.google.co.uk/search?q=java+configuration+file

Библиотека комбинатора парсера является опцией. ДжПарсек работает нормально, однако может быть медленным.

Я разрабатываю платформу для Java, которая позволяет анализировать двоичные данные. https://github.com/raydac/java-binary-block-parserв случае, если вам нужно просто описать структуру вашего бинарного файла на псевдоязыке

Вы можете анализировать двоичные файлы с помощью таких парсеров, как JavaCC. Здесь вы можете найти простой пример.Вероятно, это немного сложнее, чем анализ текстовых файлов.

Вы изучаете мир парсеров?Хороший парсер — это якк, и может быть его порт для Java.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top