Pythonでフォーマットされたバイナリファイルをロードする最も効率的な方法

質問

サイズが20Mb以下のバイナリファイルがあり、ヘッダーセクションと、ucharのシーケンスを含むデータセクションがあります。Numpy、SciPyなどがあり、ライブラリごとにデータの読み込み方法が異なります。私が使用すべき最も効率的な方法について何か提案はありますか？

解決

struct はヘッダーセクションで機能するはずですが、numpyの memmap は、データセクションで効率的です。とにかくそれをぎこちなく操作するつもりです。ここで一貫性がないことについて強調する必要はありません。どちらの方法も互換性があり、ジョブごとに適切なツールを使用するだけです。

他のヒント

struct モジュール、またはパフォーマンスの場合はCで記述されたカスタムモジュールを使用します重要です。

bdec は有望なようです。

array.fromfileは、同種のデータを処理するための最速の方法であることがわかりました。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow