FAIR-данные: различия между версиями

7111 байт добавлено ,  2 месяца назад
дополнения
({{subst:L}})
(дополнения)
{{редактирую|date=17 ноября 2021|user=[[Служебная:Contributions/Александр Сигачёв|Александр Сигачёв]]}}
[[FileФайл:FREYA-The-power-of-PIDs-V05-1.webm|времямини=0:30.0|мини|Введение в FAIR-данные и постоянные идентификаторы]]
[[Файл:FAIR_data_principles.jpg|справа|мини|FindableFindability, AccessibleAccessibility, InteroperableInteroperability, ReusableReusability]]
'''FAIR-данные''' - — это данные, которые соответствуют принципам Findability, Accessibility, Interoperability, Reusability - — [[Поисковая доступность|находимости]], [[Доступность|доступности]], [[Функциональная совместимость|совместимости]] и [[Повторное использование кода|переиспользования]]<ref name="FAIR principles 2016">{{Cite journal|author=Wilkinson|first=Mark D.|title=The FAIR Guiding Principles for scientific data management and stewardship|journal=Scientific Data|volume=3|pages=160018|language=En|doi=10.1038/sdata.2016.18|pmid=26978244|date=15 March 2016|bibcode=2016NatSD...360018W}}</ref>, акроним FAIR можно также перевести как "«честные"», "«справедливые"». Данные принципы были представлены в мартовской статье 2016 года в журнале ''Scientific Data'' консорциумом из нескольких ученых и организаций. <ref name="FAIR principles 2016" />
 
Принципы FAIR фокусируются на возможностях автоматической обработки  — то есть способность вычислительных систем находить, получать доступ, взаимодействовать и повторно использовать данные без вмешательства человека, или с минимальным его участием  потомуэто что люди все больше полагаются на компьютерную поддержкунеобходимо в обработкесвязи данных,с что связано спостоянным увеличениемростом объёма, сложности и скорости возникновения информации.<ref name="AutoSH-1">{{Cite web|lang=en-US|url=https://www.go-fair.org/fair-principles/|title=FAIR Principles|website=GO FAIR|access-date=2020-02-16}} [[FileФайл:CC-BY_iconBY icon.svg|50x50пкс]] Material was copied from this source, which is available under a [[creativecommons:by/4.0/|Creative Commons Attribution 4.0 International License]].</ref>
 
Аббревиатура '''{{Nobr|FAIR/O}}''' иногдаподразумевает используетсядобавление дляк обозначенияописанным того, что рассматриваемый набор данных или база данных помимо соответствиявыше принципам FAIR, также содержитявного явнуюуказания [[Свободная лицензия|открытуюоткрытой лицензиюлицензии]] (Open license) на данные.
 
== Принципы FAIR, опубликованные GO FAIR ==
Оригинал на https://www.go-fair.org/fair-principles/
 
 
=== Findable — находимость ===
{{Начало цитаты|источник=}}
Первый шаг в (пере)использовании данных — это их поиск. [[Метаданные]] и данные должны быть легко обнаружимы как для людей, так и для компьютеров. [[Машиночитаемость|Машиночитаемые]] метаданные необходимы для автоматического обнаружения наборов данных и сервисов, это важный компонент процесса FAIRфикации.
 
:F1. (Мета)данным присваивается глобальный уникальный и постоянный идентификатор
:F2. Данные описываются с помощью расширенных метаданных (определяются ниже в пункте R1).
:F3. Метаданные чётко и явно включают идентификатор данных, которые они описывают
:F4. (Мета)данные регистрируются или индексируются в системе с поисковыми возможностями
{{oq|en|
The first step in (re)using data is to find them. Metadata and data should be easy to find for both humans and computers. Machine-readable metadata are essential for automatic discovery of datasets and services, so this is an essential component of the FAIRification process.
 
:F1. (Meta)data are assigned a globally unique and persistent identifier
:F2. Data are described with rich metadata (defined by R1 below)
:F3. Metadata clearly and explicitly include the identifier of the data they describe
:F4. (Meta)data are registered or indexed in a searchable resource
}}
{{Конец цитаты}}
 
=== Accessible — доступность ===
{{Начало цитаты}}
Как только пользователь находит необходимые данные, ему становится нужно понять, как получить к ним доступ, возможно, с учётом [[Аутентификация|аутентификации]] и [[Авторизация|авторизации]].
 
:A1. (Мета)данные могут быть получены по их идентификатору с использованием стандартизированного протокола связи
::A1.1 Протокол является открытым, бесплатным и универсально реализуемым
::A1.2 Протокол допускает процедуру аутентификации и авторизации, где это необходимо
:A2. Метаданные остаются доступны, даже если сами данные больше недоступны
{{oq|en|
Once the user finds the required data, they need to know how they can be accessed, possibly including authentication and authorisation.
 
:A1. (Meta)data are retrievable by their identifier using a standardised communications protocol
::A1.1 The protocol is open, free, and universally implementable
::A1.2 The protocol allows for an authentication and authorisation procedure, where necessary
:A2. Metadata are accessible, even when the data are no longer available
}}
{{Конец цитаты}}
 
=== Interoperable — совместимость ===
{{Начало цитаты}}
Данные обычно должны соединяться с другими данными. Кроме того, данные должны взаимодействовать с приложениями или рабочими процессами для [[Анализ данных|анализа]], хранения и обработки.
 
:I1. (Мета)данные используют формальный, доступный, общий и широко применяемый язык для представления знаний.
:I2. (Мета)данные используют словари, которые следуют FAIR-принципам
:I3. (Мета)данные включают квалифицированные ссылки на другие (мета)данные
{{oq|en|
The data usually need to be integrated with other data. In addition, the data need to interoperate with applications or workflows for analysis, storage, and processing.
 
:I1. (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.
:I2. (Meta)data use vocabularies that follow FAIR principles
:I3. (Meta)data include qualified references to other (meta)data
}}
{{Конец цитаты}}
 
=== Reusable — переиспользование ===
{{Начало цитаты}}
Конечная цель FAIR — оптимизировать повторное использование данных. Для достижения этой цели метаданные и данные должны быть хорошо описаны, чтобы их можно было копировать и/или комбинировать в различных условиях.
 
:R1. Мета(данные) подробно описаны с множеством точных и уместных свойств
::R1.1. (Мета)данные публикуются с чёткой разрешающей использование лицензией
::R1.2. (Мета)данные связаны с подробным описанием происхождения
::R1.3. (Мета)данные соответствуют стандартам сообщества, относящимся к данной предметной области
{{oq|en|
The ultimate goal of FAIR is to optimise the reuse of data. To achieve this, metadata and data should be well-described so that they can be replicated and/or combined in different settings.
 
:R1. Meta(data) are richly described with a plurality of accurate and relevant attributes
::R1.1. (Meta)data are released with a clear and accessible data usage license
::R1.2. (Meta)data are associated with detailed provenance
::R1.3. (Meta)data meet domain-relevant community standards
}}
{{Конец цитаты}}
 
{{Начало цитаты}}
Принципы относятся к трём типам объектов: данным (или любому цифровому объекту), метаданным (информация об этом цифровом объекте) и инфраструктуре. Например, принцип F4 определяет, что и метаданные, и данные регистрируются или индексируются в системе с поисковыми возможностями (часть инфраструктуры).
{{oq|en|
The principles refer to three types of entities: data (or any digital object), metadata (information about that digital object), and infrastructure. For instance, principle F4 defines that both metadata and data are registered or indexed in a searchable resource (the infrastructure component).
}}
{{Конец цитаты}}
 
== Принятие и внедрение принципов FAIR-данных ==
Одна из первых статей, в которой обсуждались аналогичные идеи, была опубликована ещё в 2007 году.<ref>Sandra Collins; Françoise Genova; Natalie Harrower; Simon Hodson; Sarah Jones; Leif Laaksonen; Daniel Mietchen; Rūta Petrauskaité; Peter Wittenburg (7 June 2018), "«Turning FAIR data into reality: interim report from the European Commission Expert Group on FAIR data"», Zenodo, doi:10.5281/ZENODO.1285272</ref>
 
На [[Саммит G-20 в Ханчжоу (2016)|саммите]] G20 [[Большая двадцатка|в Ханчжоу в 2016 году]] году лидеры [[Большая двадцатка|Большой двадцатки]] выступили с заявлением, в котором одобрили применение FAIR-принципов в исследованиях.<ref>{{Cite web|lang=en|url=http://europa.eu/rapid/press-release_STATEMENT-16-2967_en.htm|title=G20 Leaders' Communique Hangzhou Summit|author=G20 leaders|website=europa.eu|date=5 September 2016|publisher=European Commission}}</ref><ref>{{Cite web|url=https://www.dtls.nl/2016/04/20/european-commission-allocates-e2-billion-to-make-research-data-fair/|title=European Commission embraces the FAIR principles – Dutch Techcentre for Life Sciences|website=Dutch Techcentre for Life Sciences|date=20 April 2016}}</ref>
 
В 2016 году группа австралийских организаций разработала Заявление о FAIR-доступе к результатамРезультатам исследований Австралии (Australia's Research Outputs), которое расширяло использование принципов на результаты исследований.<ref>{{Cite web|url=https://www.fair-access.net.au/fair-statement|title=Australian FAIR Access Working Group|website=www.fair-access.net.au|access-date=2020-04-03}}</ref>
 
В 2017 году Германия, Нидерланды и Франция договорились о создании<ref>{{Cite web|lang=nl-NL|url=https://www.government.nl/latest/news/2017/12/01/progress-towards-the-european-open-science-cloud|title=Progress towards the European Open Science Cloud – GO FAIR – News item – Government.nl|author=Ministerie van Onderwijs|first=Cultuur en Wetenschap|website=www.government.nl|date=2017-12-01|archive-url=|archive-date=|access-date=2020-02-15|url-status=live}}</ref> международного офиса поддержки FAIR-инициативы – [https://www.go-fair.org/go-fair-initiative/go-fair-offices/ офиса поддержки FAIR-инициативы, GO FAIR International Support and Coordination Office].
 
Другие международные организации, действующие в экосистеме исследовательских данных, такие как [[Комитет по данным для науки и техники|CODATA]] или Альянс исследовательских данных (RDA), также поддерживают внедрение FAIR своими членами. Оценка реализации FAIR-принципов изучаетсяпроводится Рабочей группой по модели зрелости FAIR-данных в составе RDA<ref>{{Cite web|lang=en|url=https://www.rd-alliance.org/groups/fair-data-maturity-model-wg|title=FAIR Data Maturity Model WG|website=RDA|date=2018-09-23|access-date=2020-02-16}}</ref>. Стратегическая десятилетняя программа CODATA "«Данные для планеты: использование данных для решения междоменных задач"»<ref>{{Cite web|url=http://www.codata.org/strategic-initiatives/decadal-programme|title=Decadal Programme – CODATA|website=www.codata.org|access-date=2020-02-16}}</ref> упоминает принципы FAIR-данных как фундаментальное свойство основанных на данных наук.
[[Файл:Implementing_FAIR_Data_Principles_-_The_Role_of_Libraries.pdf|справа|мини|Руководство "«Внедрение принципов FAIR-данных — роль библиотек"»]]
Ассоциация Европейских исследовательских библиотек рекомендует использовать FAIR-принципы.<ref>{{Cite web|url=https://libereurope.eu/blog/2018/07/13/fairdataconsultation/|title=Open Consultation on FAIR Data Action Plan – LIBER|author=Association of European Research Libraries|website=LIBER|date=13 July 2018}}</ref>
 
В документе 2017 года, подготовленном сторонниками FAIR-данных, сообщалось, чтоо осведомленностьросте осведомленности о FAIR-концепции растет среди различных исследователей и институтов, но нотакже наотмечалось, рядучто спринцимы этим понятие размываетсяразмываются, разные люди применяют к ней своимногие собственныеимеют различныесвоё точкиособое зрениявидение.<ref>{{Cite journal|author=Mons|first=Barend|title=Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud|journal=Information Services & Use|date=7 March 2017|volume=37|issue=1|pages=49–56|doi=10.3233/ISU-170824}}</ref>
 
В руководствах по внедрению FAIR-методов обработки данных говорится, что стоимость плана управления данными в соответствии с FAIR-практиками должна составлять 5% от общего бюджета исследований.<ref>{{Cite web|url=https://www.scienceeurope.org/wp-content/uploads/2016/05/SE-KE_Briefing_Paper_Funding_RDM.pdf|title=Funding research data management and related infrastructures|author=Science Europe|date=May 2016}}</ref>
 
В 2019 году Глобальный альянс данных коренных народов (Global Indigenous Data Alliance - — GIDA) опубликовал дополнение в виде CARE-принципов.<ref>{{Cite web|lang=en-US|url=https://www.gida-global.org/care|title=CARE Principles of Indigenous Data Governance|website=Global Indigenous Data Alliance|access-date=2019-09-30}}</ref> Принципы CARE ("«заботы"») расширяют принципы FAIR, добавляя к ним Collective benefit (общую выгоду), Authority to control (полномочия по контролю), Responsibility (ответственность), Ethics (этику), чтобы обеспечить учёт исторического контекста и различий в полномочияхвозможностях.
 
ОтсутствиеОтмечается, что отсутствие информации о том, какпрактическом применятьприменении руководящиеруководящих принципыпринципов, привело к их непоследовательному толкованию.<ref>{{Cite journal|author=Jacobsen|first=Annika|title=FAIR Principles: Interpretations and Implementation Considerations|journal=Data Intelligence|date=January 2020|volume=2|issue=1–2|pages=10–29|doi=10.1162/dint_r_00024}}</ref>
 
В январе 2020 года представители девяти групп университетов по всему миру подготовили ''Сорбоннскую декларацию о правах на исследовательские данные ''<ref>[https://sorbonnedatadeclaration.eu/ Sorbonne Declaration on Research Data Rights], Jan 27 2020</ref>, которая включалавключила обязательство предоставлять FAIR-данные и призывалапризвала правительства оказать поддержку для её реализации.<ref>[https://www.timeshighereducation.com/news/open-data-tougher-open-access-and-needs-mindset-change Open data ‘tougher’ than open access and needs ‘mindset change’], [[Times Higher Education]], January 31 2020</ref>
 
== См. также ==
 
* [[Управление данными]]
* [[Культура ремиксов]]
* [[Открытый доступ]]
* [[Открытые данные]] — наборы данных и базы данных, имеющие явную [[Свободная лицензия|открытую лицензию]]
* [[Открытая наука]]
 
== Примечания ==
{{примечания}}
 
 
== Ссылки ==
 
* [http://wilkinsonlab.info/node/FAIR FAIR Data and Semantic Publishing], заявление из лаборатории первого автора оригинальной статьи
* [https://www.dtls.nl/fair-data/ Guide to FAIR Data] Голландского Техцентра наук о жизни