Обратное проектирование форматов файлов с использованием методов искусственного интеллекта

StackOverflow https://stackoverflow.com/questions/1843974

Вопрос

Это делается для того, чтобы расширить вопрос: Инструменты, помогающие перепроектировать двоичные форматы файлов

Существуют ли какие-либо общедоступные инструменты, использующие кластеризацию и / или методы интеллектуального анализа данных для обратного проектирования форматов файлов?

Например, с помощью инструмента у вас была бы коллекция файлов, имеющих одинаковый формат, и результатом работы инструмента была бы общая структура?

Это было полезно?

Решение

Если бы у кого-то был действительно эффективный формат двоичного кодирования (примером могут служить ZIP-файлы), то содержание информации в каждом бите было бы высоким.По сути, это будет выглядеть как идеальное случайное число.

Вы не можете сделать из этого никаких выводов без дополнительных знаний.

Если двоичное кодирование неэффективно, теоретически у вас есть слабый шанс увидеть структуру.Но это все еще звучит действительно сложно;как вы вообще начинаете угадывать, где проходят границы полей?

Типы машинного обучения ИИ скажут вам, что вы не сможете ничему научиться, если вы уже "почти" не знаете этого.Часто они преуспевают, кодируя проблему с помощью проблемных токенов, о которых, по крайней мере, вы можете рассуждать.

Я не думаю, что вы сможете сделать это, не предоставив дополнительной информации.Знаете ли вы что-нибудь о форматах файлов?Размеры полей всегда меньше N бит?Кодируются только строки ASCII или наоборот?

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top