Como a engenharia reversa de formatos de arquivo binário para fins de compatibilidade
-
21-08-2019 - |
Pergunta
Eu estou trabalhando de um software de preparação de arquivos para permitir tradutores trabalhar facilmente e de forma eficiente em uma ampla gama de formatos de arquivo.
Quanto formatos baseados em texto (XML, PHP, arquivos de recursos, ...) estão em causa, a minha utilidade preparação pequena funciona bem, mas um grande problema para a maioria dos tradutores é lidar com todos os tipos de formatos binários proprietários (Framemaker , Publisher, Quark ...).
Esses arquivos raramente são solicitados e necessidade de ser aberto em aplicações caros (alguns freelance pode dar ao luxo de comprar US $ 20.000 no valor de software apenas para lidar com alguns projetos por ano), e mesmo assim não é conveniente para trabalhar diretamente nesses aplicativos de qualquer forma.
Eu gostaria de ser capaz de ler esses arquivos e extrair o texto de tal forma a que possa ser traduzido e, em seguida, re-importados no aplicativo original com o mínimo esforço, ou melhor ainda, para recriar um arquivo binário nativo válida .
Será que isso factível som?
Onde posso encontrar mais informações sobre como lidar com formatos de arquivo binário e existem ferramentas úteis para este tipo de postos de trabalho (além de editores hexadecimais regulares)?
Agradecemos antecipadamente.
Solução
de Engenharia curso inverso é possível, mas sem especificações de formato que vai ter um monte de trabalho. Eu olhava para o retorno do esforço sobre apoio a estes formatos 'raramente solicitados, muito caro'. Você pode ser melhor gastar esse esforço melhorar a funcionalidade central do seu aplicativo.
Outro ângulo é contatar as empresas com estes formatos, explicar o seu objetivo, explicar que ele ajuda o seu produto, e se não vê-lo como concorrência que poderia estar disposto a ajudar.
Outras dicas
Eu sei que você quer fazer engenharia reversa - mas uma vez que estes formatos de arquivo pode ser decoro você está olhando para uma curva muito íngreme tentando decodificá-las ...
Alguns (como escrevi alguns formatos propritety para uso interal antes) têm métodos específicos e objetos escrito para eles que servem algum processo alternativo que os próprios conteúdo do arquivo. Material que provaria o novo arquivo é ilegal.
Apenas meus 2 centavos e eu não sou advogado =>
Talvez você pudesse escolher uma aplicação mais barato que tem características de importação para o QuarkXPress. Por exemplo InDesign deve ser capaz de ler documentos Quark. Em seguida, use a aplicação importar para exportar para qualquer formato que você precisa -. Talvez com a ajuda de plug-in