Principios del Open Data
Derechos y condiciones universales en las que los datos abiertos deben estar disponibles para las instituciones, empresas y ciudadanía
Los Principios del Open Data sirven de guía a las instituciones, empresas, ciudadanía y otros publicadores de datos para cumplir los objetivos universales de los datos abiertos y conocer los derechos y las condiciones en las que los datos abiertos deben estar disponibles. 'Principios del Open Data' es el primer artículo de una serie que incluirá conceptos teóricos, modelos, documentación, bibliografía de referencia y estándares sobre los datos abiertos y su gestión, modelado y publicación y que se irán publicando con periodicidad en la sección de Actualidad del Portal de Datos Abiertos de la Junta de Andalucía.
Los 8 principios del OGD
Los principios básicos que se aplican a los datos abiertos están definidos desde que, en 2007, una treintena de defensores del gobierno abierto se reunieran en California (EEUU) para dejarlos recogidos en un documento que recoge Open Government Data. Así, los datos gubernamentales se considerarán abiertos si se hacen públicos de una manera que cumpla con estos 8 principios:
- Completa: todos los datos públicos están disponibles y no están sujetos a limitaciones válidas de privacidad, seguridad o privilegios.
- Primaria: los datos se recopilan en la fuente con el mayor nivel posible de desglose, sin formas agregadas o modificadas.
- Oportuno: los datos están disponibles tan rápido como sea necesario para preservar el valor de los mismos.
- Accesible: los datos están disponibles para la más amplia gama de usuarios y de propósitos.
- Procesables: los datos están razonablemente estructurados para permitir el procesamiento automatizado.
- No discriminatorio: los datos están disponibles para cualquier persona, sin necesidad de registro.
- No propietario: los datos están disponibles en un formato sobre el cual ninguna entidad tiene un control exclusivo.
- Sin licencia: los datos no están sujetos a ninguna regulación sobre derechos de autor, patentes, marcas registradas o secretos comerciales. Se pueden permitir restricciones razonables de privacidad, seguridad y privilegios.
Definición de abierto de la OKF
En este contexto, la Open Knowledge Foundation considera necesario precisar el significado de 'abierto' en los términos 'datos abiertos' y 'contenido abierto' para establecer los principios que definen la apertura en relación con dichos datos y su contenido. Así, la Open Definition del OKF garantiza con este matiz la calidad y la compatibilidad entre diferentes grupos de material abierto.
- Abierto: significa que cualquiera puede acceder, usar, modificar y compartir libremente para cualquier propósito (sujeto, como máximo, a requisitos que preserven la procedencia y la apertura). Es decir, “los datos abiertos y el contenido pueden ser usados, modificados y compartidos libremente por cualquier persona para cualquier propósito”, según matizan en la OKF que incluyen una definición abierta completa.
Los 6 principios del ODC
La Open Data Charter publica una 'Carta Internacional de Datos Abiertos' en la que define a los datos abiertos como “datos digitales que se ponen a disposición con las características técnicas y legales necesarias para que puedan ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, en cualquier momento y en cualquier lugar”.
En 2015 estableció los 6 principios de datos abiertos del ODC reproducidos a continuación:
- Abrir por defecto: esto representa un cambio real en la forma en que operan los gobiernos y cómo interactuan con los ciudadanos. Con el principio 'Open by default' ya no se obliga o no se tiene que pedir los datos a los funcionarios, se presuponen abiertos para su publicación y que los gobiernos deben justificar los que mantienen cerrados, por ejemplo, por razones de seguridad o protección de datos. Para que esto funcione, los ciudadanos también deben sentirse seguros de que los datos abiertos no comprometerán su derecho a la privacidad.
- Oportuno y completo: los datos abiertos solo son valiosos si siguen siendo relevantes. El objetivo de este principio es lograr que la información se publique de manera rápida y completa para su éxito potencial. En la medida de lo posible, los gobiernos deberían proporcionar datos en su forma original y sin modificar.
- Accesible y utilizable: garantizar que los datos sean legibles por una máquina y fáciles de encontrar hará que los datos lleguen más lejos. Los portales son una forma de lograr esto. Pero también es importante pensar en la experiencia de usuario de quienes acceden a los datos, incluidos los formatos de archivo en los que se proporciona la información. Los datos deben ser gratuitos, bajo una licencia abierta, por ejemplo, las desarrolladas por Creative Commons.
- Comparables e interoperables: los datos tienen un efecto multiplicador. Cuantos más conjuntos de datos de calidad tenga acceso y más fácil les resulte comunicarse entre sí, más valor potencial podrá obtener de ellos. Los estándares de datos comúnmente acordados juegan un papel crucial para que esto suceda.
- Mejorar la gobernanza y la participación ciudadana: los datos abiertos tienen la capacidad de permitir que los ciudadanos (y el personal que trabaja para el gobierno) tengan una mejor idea de lo que están haciendo los funcionarios y políticos. Esta transparencia puede mejorar los servicios públicos y ayudar a que los gobiernos rindan cuentas.
- Desarrollo inclusivo y la innovación: los datos abiertos pueden ayudar a impulsar el desarrollo económico inclusivo. Por ejemplo, un mayor acceso a los datos puede hacer que la agricultura sea más eficiente o puede usarse para abordar el cambio climático. Los datos abiertos no solo mejoran el desempeño del gobierno, multitud de empresas ganan dinero gracias a ellos también.
Los 4 principios FAIR para datos de alto valor
Los datos de alto valor deben depositarse en abierto siguiendo los principios FAIR (acrónimo de Findable, Accessible, Interoperable y Reusable) que describen cómo deben organizarse los resultados de una investigación para que los datos sean localizables, accesibles, interoperables y reutilizables.
En 2016, la revista Scientific Data publicó por primera vez los 'Principios rectores de FAIR para la gestión y administración de datos científicos' en un intento de proporcionar pautas para mejorar los activos digitales. Los principios enfatizan la capacidad de acción de los sistemas computacionales para encontrar, acceder, interoperar y reutilizar datos con una intervención humana mínima o nula) porque los humanos confían cada vez más en el soporte computacional para manejar los datos como resultado del aumento en el volumen, su complejidad y la velocidad de creación de los mismos.
Estos principios se deben aplicar a los datos de alto valor según el nuevo Reglamento UE, que ya se analizó en el artículo de Actualidad del Portal de Datos Abiertos de la Junta de Andalucía titulado 'La Unión Europea avanza en la apertura de datos de alto valor para 2024'.
Los principios se refieren a tres tipos de entidades: datos (o cualquier objeto digital), metadatos (información sobre ese objeto digital) e infraestructura.
F de Findable (localizable): el primer paso para (re)utilizar datos es encontrarlos. Los metadatos y los datos deben ser fáciles de encontrar tanto para humanos como para computadoras. Los metadatos legibles son esenciales para el descubrimiento automático de conjuntos de datos y servicios, por lo que este es un componente esencial del proceso de FAIRificación.
- F1: A los metadatos se les asigna un identificador global único y persistente.
- F2: Los datos se describen con metadatos enriquecidos (definidos por R1).
- F3: Los metadatos incluyen de forma clara y explícita el identificador de los datos que describen.
- F4: Los metadatos se registran o indexan en un recurso de búsqueda.
A de Accesible: Una vez que el usuario encuentra los datos requeridos, necesita saber cómo puede acceder a ellos, posiblemente incluyendo autenticación y autorización.
- A1: Los metadatos son recuperables por su identificador utilizando un protocolo de comunicaciones estandarizado.
- A1.1: El protocolo es abierto, gratuito y universalmente implementable.
- A1.2: El protocolo permite un procedimiento de autenticación y autorización, cuando sea necesario.
- A2: Los metadatos son accesibles, incluso cuando los datos ya no están disponibles.
I de Interoperable: los datos normalmente necesitan integrarse con otros datos. Además, los datos deben interoperar con aplicaciones o flujos de trabajo para su análisis, almacenamiento y procesamiento.
- I1: Los metadatos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento.
- I2: Los metadatos usan vocabularios que siguen los principios FAIR.
- I3: Los metadatos incluyen referencias cualificadas a otros metadatos.
R de Reutilizable: El objetivo final de FAIR es optimizar la reutilización de los datos. Para lograr esto, los metadatos y los datos deben estar bien descritos para que puedan replicarse y/o combinarse en diferentes entornos.
- R1: Los metadatos se describen detalladamente con una pluralidad de atributos precisos y relevantes.
- R1.1: Los metadatos se publican con una licencia de uso de datos clara y accesible.
- R1.2: Los metadatos están asociados con la procedencia detallada.
- R1.3: Los metadatos cumplen con los estándares comunitarios relevantes para el dominio.
Se puede descargar esta descripción general de los principios FAIR como archivo pdf y en formato descargable en FAIR-nanopubs en GitHub.
Más información
- Principios Open Government Data
- Principios ODC
- Principios FAIR
- Apertura de datos en el Reglamento de la UE