HDF5 внутренняя организация данных и использование Numpy
Вопрос
Как говорится в документации HDF5, HDF5 хранит данные с использованием Numpy
"Он построен на вершине библиотеки HDF5, языка Python и пакета Numpy. Он оснащен объектно-ориентированным интерфейсом, который в сочетании с расширениями C для критических частей кода делает его быстрым, но чрезвычайно простым- Инструмент для использования для интерактивного хранения и получения очень больших объемов данных »
...
«Pytables использует эти контейнеры Numpy в качестве буферов в памяти, чтобы подтолкнуть полосу ввода/вывода в сторону пределов платформы».
Так что же за механизм? Как Pytables использует Numpy? В конце концов, они генерируют простые HDF5, доступные с других языков ...
Решение
HDF5 - это языковая библиотека C. HDF5 сохраняет номера, включая поплавки, в независимой платформе (Прокрутите вниз до таблицы под названием «Примеры собственных данных и соответствующих типов C». В руководстве пользователей больше информации).
Pytables просто преобразуется из данных DataType HDF5 в Numpy DataType. И он смешивает код Python и собственный код, чтобы уменьшить накладные расходы ввода/вывода.