FAIR
¿Para qué se utilizan los datos?
Según la American National Standards Institute ANSI ”Standards Management: A Handbook for Profit”, se entiende por dato:
- Datos que se utilizan como fuentes primarias para respaldar preguntas técnicas o científicas, investigaciones, o actividades académicas y artísticas.
- Datos que se utilizan como evidencia en el proceso de investigación y son comúnmente aceptados en la comunidad de investigadores como necesarios para validar los hallazgos y resultados de la investigación.
- Todos los demás contenidos digitales y no digitales tienen el potencial de convertirse en datos de investigación.
¿Qué es un dato de investigación abierto? Principios FAIR
Es un dato de acceso gratuito que podrá ser:
No tienen restricciones para su reutilización + redistribución. Cuentan con licencias de uso que amparan esta utilización abierta. Tendremos presente las excepciones referentes a:
- la protección de la identidad de sujetos.
- la posibilidad de incluir restricciones de acceso especiales o limitadas.
Datos Fair: tan abierto como sea posible, tan cerrado como sea necesario
FAIR es el acrónimo de: Findable (localizables), Accessible (accesibles), Interoperable (interoperables) and Reusable (reutilizables).
Los propios datos (u objetos digitales) y sus metadatos (información sobre ese objeto digital) deben ser FAIR.
Nos centraremos en las cuatro características:
Generar o trabajar con datos FAIR implica un ejercicio relacionado con la ciencia de datos y administración de datos.
El investigador se adentra en una nueva forma de abordar la investigación. La ciencia de datos promueve el procesamiento + análisis de datos permitiendo extraer nuevos conocimientos. Por otro lado, la administración de datos tiene como objetivo la gestión, la investigación colaborativa y conservación de los datos a largo plazo.
Las habilidades y destrezas que implican la gestión del dato abierto se presentan como un nuevo reto para la comunidad científica. Todo proceso de investigación aborda la gestión de datos, por lo que generar datos FAIR implica que el equipo de investigación cuente con habilidades básicas para un uso adecuado de los datos utilizando una tecnología acorde con esta finalidad. Las políticas nacionales e internacionales relacionadas con la producción científica respaldan el uso y producción de datos abiertos para promover la colaboración entre investigaciones, ahorro de tiempo/costes (subvenciones estatales) sin dejar atrás la protección adecuada de los resultados – datos generados resultante de estos proyectos de investigación. Estos principios ya se han incorporación en los proyectos del Programa Horizonte 2020 de Investigación e Innovación de la Unión Europea. Se aplica el Open Research Data por defecto.
La guía Turning FAIR into reality también es un documento que refleja la gestión de los datos como un requisito en cualquier investigación.
En los proyectos financiados dentro de Horizonte 2020 uno de los requisitos es la elaboración de un Plan de Gestión de Datos - PGD que sigue la plantilla de las directrices H2020. La primera versión se presenta durante los 6 primeros meses y debe actualizarse a mitad/final del proyecto para ajustarlo a los datos generados. Guía Horizonte 2020. Tendremos en cuenta que los principios FAIR proporcionan una guía para la gestión de datos científicos con indicaciones específicas focalizando en:
- productores de datos.
- editores de datos para promover el uso máximo de los datos de investigación.
Para contextualizar la importancia de los datos abiertos, contamos con una fecha clave: 15 de marzo de 2016. Este día se publicó el artículo: “Principios FAIR para el manejo y administración de datos científicos” en la revista Scientific Data de Nature.
Los principios FAIR se relacionan directamente con la elaboración de un Plan General de Datos – PGD exigido en las convocatorias públicas de proyectos de investigación. Mencionaremos los campos que deben cumplimentarse para mostrar la importancia del uso de datos abiertos siguiendo los principios FAIR que se adjuntan en las convocatorias de proyectos científicos en territorio nacional e internacional.
Campos de información de un Plan General de Datos:
- Información administrativa: identificador del centro, financiador, número de identificación de la financiación, nombre del proyecto, descripción, IP, identificador Orcid del IP, fecha de la primera versión, etc.
- Descripción de los datos: tipología, volumen, formatos, estructura de los archivos y gestión de las versiones
- Documentación y metadatos que acompañarán a los datos
- Requisitos legales y éticos: consentimiento de las personas implicadas, protección de la identidad, tratamiento de los datos sensibles y gestión de derechos de propiedad intelectual
- Almacenamiento y copias de seguridad: control de acceso a los colaboradores y gestión de las copias de seguridad
- Selección y preservación: qué datos y cómo serán conservados, dónde se preservarán y restricciones en el intercambio de datos
- Compartir los datos: bajo qué condiciones se compartirán, cómo encontrarán los usuarios los datos, cuándo estarán disponibles, obtendrán un identificador persistente, etc.
- Responsabilidades y recursos: asignación de responsabilidades, costes asociados al acceso abierto de los datos, ya que son elegibles para su reembolso durante el periodo del proyecto
Herramientas de uso imprescindible para que nuestros datos respondan a los principios FAIR
Son herramientas para evaluar los requisitos FAIR de conjuntos de datos antes de cargarlos en un repositorio:
Licencias de uso para los datos FAIR
Las licencias dependerán de:
- tipo de datos.
- legislación.
- usos permitidos o restricciones aplicables.
OpenAIRE recomienda utilizar:
- Creative Commons CCO
- CC-BY licence for opne Access to data.
El Documento OpenAIRE (2020) Guides for Researchers. How do I know if my research data is protected? es de gran ayuda para proteger los datos de investigación sin dejar de ser abiertos.
Señalaremos la importancia del tratamiento de los datos según su naturaleza, siguiendo el Reglamento General de Protección de Datos (RGPD):
- 5.1 2016/679 / UE -> datos con fines de investigación, si se trata de "aspectos de interés público, investigación científica o histórica con fines estadísticos. "Utilizar un acuerdo de transferencia de datos o Data Transfer Agreement que aseguren que se cumple con todos los requisitos legales.
- Utilizar un acuerdo de transferencia de datos o Data Transfer Agreement que aseguren que se cumple con todos los requisitos legales.
Repositorios – principios FAIR