FAIR-данные — это данные, соответствующие принципам Findability, Accessibility, Interoperability, Reusability — находимости, доступности, совместимости и переиспользования[1], акроним FAIR можно также перевести как «честные», «справедливые». Данные принципы были представлены в мартовской статье 2016 года в журнале Scientific Data консорциумом из нескольких ученых и организаций.[1]

Введение в FAIR-данные и постоянные идентификаторы
Findability, Accessibility, Interoperability, Reusability

Принципы FAIR фокусируются на возможностях автоматической обработки — то есть способность вычислительных систем находить, получать доступ, взаимодействовать и повторно использовать данные без вмешательства человека, или с минимальным его участием — это необходимо в связи с постоянным ростом объёма, сложности и скорости возникновения информации.[2]

Аббревиатура FAIR/O подразумевает добавление к описанным выше принципам явного указания открытой лицензии (Open license) на данные.

Принципы FAIR, опубликованные GO FAIRПравить

Оригинал на https://www.go-fair.org/fair-principles/

Findable — находимостьПравить

Первый шаг в (пере)использовании данных — это их поиск. Метаданные и данные должны быть легко обнаружимы как для людей, так и для компьютеров. Машиночитаемые метаданные необходимы для автоматического обнаружения наборов данных и сервисов, это важный компонент процесса FAIRфикации.

F1. (Мета)данным присваивается глобальный уникальный и постоянный идентификатор
F2. Данные описываются с помощью расширенных метаданных (определяются ниже в пункте R1).
F3. Метаданные чётко и явно включают идентификатор данных, которые они описывают
F4. (Мета)данные регистрируются или индексируются в системе с поисковыми возможностями

Accessible — доступностьПравить

Как только пользователь находит необходимые данные, ему становится нужно понять, как получить к ним доступ, возможно, с учётом аутентификации и авторизации.

A1. (Мета)данные могут быть получены по их идентификатору с использованием стандартизированного протокола связи
A1.1 Протокол является открытым, бесплатным и универсально реализуемым
A1.2 Протокол допускает процедуру аутентификации и авторизации, где это необходимо
A2. Метаданные остаются доступны, даже если сами данные больше недоступны

Interoperable — совместимостьПравить

Данные обычно должны соединяться с другими данными. Кроме того, данные должны взаимодействовать с приложениями или рабочими процессами для анализа, хранения и обработки.

I1. (Мета)данные используют формальный, доступный, общий и широко применяемый язык для представления знаний.
I2. (Мета)данные используют словари, которые следуют FAIR-принципам
I3. (Мета)данные включают квалифицированные ссылки на другие (мета)данные

Reusable — переиспользованиеПравить

Конечная цель FAIR — оптимизировать повторное использование данных. Для достижения этой цели метаданные и данные должны быть хорошо описаны, чтобы их можно было копировать и/или комбинировать в различных условиях.

R1. Мета(данные) подробно описаны с множеством точных и уместных свойств
R1.1. (Мета)данные публикуются с чёткой разрешающей использование лицензией
R1.2. (Мета)данные связаны с подробным описанием происхождения
R1.3. (Мета)данные соответствуют стандартам сообщества, относящимся к данной предметной области

Принципы относятся к трём типам объектов: данным (или любому цифровому объекту), метаданным (информация об этом цифровом объекте) и инфраструктуре. Например, принцип F4 определяет, что и метаданные, и данные регистрируются или индексируются в системе с поисковыми возможностями (часть инфраструктуры).

Принятие и внедрение принципов FAIR-данныхПравить

Одна из первых статей, в которой обсуждались аналогичные идеи, была опубликована ещё в 2007 году.[3]

На саммите G20 в Ханчжоу в 2016 году лидеры Большой двадцатки выступили с заявлением, в котором одобрили применение FAIR-принципов в исследованиях.[4][5]

В 2016 году группа австралийских организаций разработала Заявление о FAIR-доступе к Результатам исследований Австралии (Australia's Research Outputs), которое расширяло использование принципов на результаты исследований.[6]

В 2017 году Германия, Нидерланды и Франция договорились о создании[7] международного офиса поддержки FAIR-инициативы – GO FAIR International Support and Coordination Office.

Другие международные организации, действующие в экосистеме исследовательских данных, такие как CODATA или Альянс исследовательских данных (RDA), также поддерживают внедрение FAIR своими членами. Оценка реализации FAIR-принципов проводится Рабочей группой по модели зрелости FAIR-данных в составе RDA[8]. Стратегическая десятилетняя программа CODATA «Данные для планеты: использование данных для решения междоменных задач»[9] упоминает принципы FAIR-данных как фундаментальное свойство основанных на данных наук.

 
Руководство «Внедрение принципов FAIR-данных — роль библиотек»

Ассоциация Европейских исследовательских библиотек рекомендует использовать FAIR-принципы.[10]

В документе 2017 года, подготовленном сторонниками FAIR-данных, сообщалось о росте осведомленности о FAIR-концепции среди различных исследователей и институтов, но также отмечалось, что принцимы размываются, многие имеют своё особое видение.[11]

В руководствах по внедрению FAIR-методов обработки данных говорится, что стоимость плана управления данными в соответствии с FAIR-практиками должна составлять 5% от общего бюджета исследований.[12]

В 2019 году Глобальный альянс данных коренных народов (Global Indigenous Data Alliance — GIDA) опубликовал дополнение в виде CARE-принципов.[13] Принципы CARE («заботы») расширяют принципы FAIR, добавляя к ним Collective benefit (общую выгоду), Authority to control (полномочия по контролю), Responsibility (ответственность), Ethics (этику), чтобы обеспечить учёт исторического контекста и различий в возможностях.

Отмечается, что отсутствие информации о практическом применении руководящих принципов, привело к их непоследовательному толкованию.[14]

В январе 2020 года представители девяти групп университетов по всему миру подготовили Сорбоннскую декларацию о правах на исследовательские данные[15], которая включила обязательство предоставлять FAIR-данные и призвала правительства оказать поддержку для её реализации.[16]

См. такжеПравить

ПримечанияПравить

  1. 1 2 Wilkinson, Mark D. (15 March 2016). “The FAIR Guiding Principles for scientific data management and stewardship”. Scientific Data [англ.]. 3: 160018. Bibcode:2016NatSD...360018W. DOI:10.1038/sdata.2016.18. PMID 26978244.
  2. FAIR Principles (англ.) ?. GO FAIR. Дата обращения: 16 февраля 2020. Архивировано 1 марта 2020 года.   Material was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
  3. Sandra Collins; Françoise Genova; Natalie Harrower; Simon Hodson; Sarah Jones; Leif Laaksonen; Daniel Mietchen; Rūta Petrauskaité; Peter Wittenburg (7 June 2018), «Turning FAIR data into reality: interim report from the European Commission Expert Group on FAIR data», Zenodo, doi:10.5281/ZENODO.1285272
  4. G20 leaders. G20 Leaders' Communique Hangzhou Summit (англ.). europa.eu. European Commission (5 September 2016). Дата обращения: 17 ноября 2021. Архивировано 3 июля 2017 года.
  5. European Commission embraces the FAIR principles – Dutch Techcentre for Life Sciences. Dutch Techcentre for Life Sciences (20 April 2016). Дата обращения: 17 ноября 2021. Архивировано 20 июля 2018 года.
  6. Australian FAIR Access Working Group. www.fair-access.net.au. Дата обращения: 3 апреля 2020. Архивировано 26 марта 2020 года.
  7. Ministerie van Onderwijs. Progress towards the European Open Science Cloud – GO FAIR – News item – Government.nl (нид.). www.government.nl (1 декабря 2017). Дата обращения: 15 февраля 2020. Архивировано 21 февраля 2020 года.
  8. FAIR Data Maturity Model WG (англ.). RDA (23 сентября 2018). Дата обращения: 16 февраля 2020. Архивировано 16 февраля 2020 года.
  9. Decadal Programme – CODATA. www.codata.org. Дата обращения: 16 февраля 2020. Архивировано 15 февраля 2020 года.
  10. Association of European Research Libraries. Open Consultation on FAIR Data Action Plan – LIBER. LIBER (13 July 2018). Дата обращения: 17 ноября 2021. Архивировано 29 ноября 2020 года.
  11. Mons, Barend (7 March 2017). “Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud”. Information Services & Use. 37 (1): 49—56. DOI:10.3233/ISU-170824.
  12. Science Europe. Funding research data management and related infrastructures (May 2016). Дата обращения: 17 ноября 2021. Архивировано 17 ноября 2018 года.
  13. CARE Principles of Indigenous Data Governance (англ.) ?. Global Indigenous Data Alliance. Дата обращения: 30 сентября 2019. Архивировано 27 августа 2021 года.
  14. Jacobsen, Annika (January 2020). “FAIR Principles: Interpretations and Implementation Considerations”. Data Intelligence. 2 (1—2): 10—29. DOI:10.1162/dint_r_00024.
  15. Sorbonne Declaration on Research Data Rights Архивная копия от 25 февраля 2022 на Wayback Machine, Jan 27 2020
  16. Open data ‘tougher’ than open access and needs ‘mindset change’ Архивная копия от 6 ноября 2021 на Wayback Machine, Times Higher Education, January 31 2020

СсылкиПравить