Hierarchical Data Format

Hierarchical Data Format, HDF (Иерархический формат данных) — название формата файлов, разработанного для хранения большого объема цифровой информации. Первоначально был разработан Национальным центром суперкомпьютерных приложений, сейчас поддерживается некоммерческой организацией HDF Group.

Hierarchical Data Format
Изображение логотипа
Расширение .hdf, .h4, .hdf4, .he2, .h5, .hdf5 или .he5
MIME-тип application/x-hdf[2] и application/x-hdf5[3]
Сигнатура \211HDF\r\n\032\n
Разработчик The HDF Group
Последний выпуск 5-1.10.1[1] (27 апреля 2017; 7 лет назад (2017-04-27))
Тип формата семейство файловых форматов[вд]
Открытый формат? Да
Сайт hdfgroup.org/solu… (англ.)

Библиотеки для работы с форматом и связанные с ним утилиты доступны для использования под свободной лицензией, схожей с лицензией BSD. Формат HDF поддерживается многими коммерческими и некоммерческими программами, в том числе есть библиотеки для работы с ним в Java, Matlab, Scilab, Octave, Mathematica, IDL[англ.], Python, R и Julia. Свободно распространяемый пакет HDF состоит из библиотеки, утилиты командной строки, исходных текстов для тестирования, интерфейса для Java и Java-программы для просмотра HDF-файлов.

HDF4 — старая версия формата, однако все еще активно поддерживаемая HDF Group. Он поддерживает различные модели данных, включая многомерные массивы, растровые изображения и таблицы.

Использует 32-битные целые числа, поэтому имеет проблемы с хранением больших объёмов информации (более нескольких гигабайт).

HDF5 — современная версия формата. Получил премию R&D100 от журнала "R&D Magazine" в 2002 году.[4]

Содержит иерархию из двух основных типов объектов:

 
Пример структуры HDF
  • Datasets — наборы данных, многомерные массивы объектов одного типа
  • Groups — группы, являются контейнерами для наборов данных и других групп

Содержимое файлов HDF5 организовано подобно иерархической файловой системе, и для доступа к данным применяются пути, сходные с POSIX-синтаксисом, например, /path/to/resource. Метаданные хранятся в виде набора именованных атрибутов объектов.

Формат NetCDF 4 основан на HDF5.

Для индексации используются Б-деревья.

Примечания

править

Ссылки

править