Pythonでフォーマットされたバイナリファイルをロードする最も効率的な方法

StackOverflow https://stackoverflow.com/questions/703262

  •  22-08-2019
  •  | 
  •  

質問

サイズが20Mb以下のバイナリファイルがあり、ヘッダーセクションと、ucharのシーケンスを含むデータセクションがあります。Numpy、SciPyなどがあり、ライブラリごとにデータの読み込み方法が異なります。私が使用すべき最も効率的な方法について何か提案はありますか?

役に立ちましたか?

解決

struct はヘッダーセクションで機能するはずですが、numpyの memmap は、データセクションで効率的です。とにかくそれをぎこちなく操作するつもりです。ここで一貫性がないことについて強調する必要はありません。どちらの方法も互換性があり、ジョブごとに適切なツールを使用するだけです。

他のヒント

struct モジュール、またはパフォーマンスの場合はCで記述されたカスタムモジュールを使用します重要です。

bdec は有望なようです。

array.fromfileは、同種のデータを処理するための最速の方法であることがわかりました。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top