문제

자칭 파이썬 애호가로서 표준 형식을 사용하여 이진 파일을 가져오고 내보내는 법을 배우는 방법은 무엇입니까?

Epub eBooks (Zip에서 XHTML + CSS)를 가져 와서 Amazon Kindle이 읽을 수 있도록 (I '를 읽을 수 있도록 MobiPocket (PalmDoc) 형식으로 변환하는 스크립트를 구현하고 싶습니다. m 작업).

eBook 라이브러리 관리를위한 멋진 오픈 소스 프로젝트가 이미 있습니다. 구경. 나는 이것을 학습/자기 교사 운동으로 스스로 구현하고 싶었습니다. 나는 그들의 것을보기 시작했다 파이썬 소스 코드 그리고 무슨 일이 일어나고 있는지 전혀 모른다는 것을 깨달았습니다. 물론, 무엇이든 스스로 가르치는 데 큰 위험은 당신이 모르는 것을 알지 못하는 것입니다.

이 경우, 나는이 바이너리 파일에 대해 잘 모르고 파이썬 코드에서 그것들과 협력하는 방법을 알고 있습니다.구조?). 그러나 나는 일반적으로 이진 파일에 대한 많은 지식이 없을 것이라고 생각하며, 그들과 함께 일하는 방법을 이해하는 데 도움이되고 싶습니다. 자세한 개요는 다음과 같습니다 Mobi/Palmdoc 헤더의. 감사!

편집 : 의문의 여지가 없습니다. 이진 파일 작업에 대한 기본 지식을 얻는 방법에 대한 팁이 있습니까? 파이썬 특정이 도움이되지만 다른 접근법도 유용 할 수 있습니다.

Tom : 질문으로 편집, 추가 소개 / 더 나은 제목

도움이 되었습니까?

해결책

당신은 아마도 시작해야합니다 구조 모듈은 질문에서 지적한대로 파일을 이진으로 엽니 다.

기본적으로 파일의 시작 부분에서 시작하여 조각별로 골라냅니다. 번거 로움이지만 큰 문제는 아닙니다. 파일이 압축되거나 암호화되면 상황이 더 어려워 질 수 있습니다. 내용을 알고있는 파일로 시작하면 항상 추측하지 않으면 도움이됩니다.

조금 시도해 보면 더 구체적인 질문을 발전시킬 수 있습니다.

다른 팁

이진 파일을 구성하고 분석하려면 구조물 모듈은 기본 도구를 제공하지만 특히 바이트가 아닌 것들을보고 싶을 때는 그다지 친숙하지 않습니다.

도움이 될 수있는 몇 가지 모듈이 있습니다. 비트 벡터, Bitarray 그리고 비트 스트링. (나는 호의적이다 비트 스트링, 그러나 나는 그것을 썼다. 그래서 편향 될 수있다).

이진 형식을 구문 분석하기 위해 hachoir 모듈은 매우 좋지만 현재 요구에 비해 너무 높은 수준이라고 생각합니다.

이진 파일과 함께 작동하는 파이썬 도구를 가르치기 위해이것은 당신이 갈 것입니다. 재미도. 바이너리, 지퍼, 이미지와의 운동 ... 훨씬 더.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top