Informe de madurez de los datos abiertos 2024
El portal oficial de datos europeos, data.europa.eu, ha publicado el Informe de madurez de los datos abiertos correspondiente al año 2024. Se ha medido el progreso de los países europeos en la puesta a disposición de la información del sector público y el estímulo de su reutilización, de conformidad con la Directiva (UE) 2019/1024 de 20 de junio de 2019 relativa a los datos abiertos y la reutilización de la información del sector público.
En esta décima evaluación anual consecutiva han participado un total de 34 países, incluidos los 27 Estados miembros de la UE, 3 países de la Asociación Europea de Libre Comercio (AELC) (Islandia, Noruega y Suiza) y 4 países candidatos (Bosnia y Herzegovina, Albania, Serbia y Ucrania). Se pone, además, el foco en los conjuntos de datos de alto valor (asunto tratado en nuestro anterior artículo), aseverando que los Estados miembros están avanzando en la aplicación del Reglamento de Ejecución sobre los datos de alto valor (pdf), que entró en vigor en junio de 2024, especialmente mediante la elaboración de inventarios de conjuntos de datos y la preparación de conjuntos estadísticos, geoespaciales y meteorológicos.
El informe tiene como objetivo ayudar a comprender mejor el nivel de madurez de los datos abiertos de los países participantes, identificar áreas de mejora y permitir que los países aprendan unos de otros. Al tratarse de un informe anual, también refleja el progreso realizado por los países a lo largo del tiempo, además de ofrecer una visión general de las mejores prácticas implementadas en Europa y que podrían transferirse a otros contextos nacionales y locales.
La metodología de evaluación define la madurez de los datos abiertos (ODM, por sus siglas en inglés) utilizando cuatro dimensiones:
- Política: Investiga las políticas y estrategias de datos abiertos en vigor en los países participantes, los modelos de gobernanza nacional para la gestión de datos abiertos y las medidas aplicadas para implementar políticas y estrategias
- Portal: Analiza la funcionalidad de los portales nacionales de datos abiertos, el grado en que se examinan las necesidades y el comportamiento de los usuarios para mejorar el portal, la disponibilidad de datos abiertos en diferentes dominios y el enfoque para garantizar la sostenibilidad del portal
- Calidad: Evalúa las medidas adoptadas por los administradores del portal para garantizar la recolección sistemática de metadatos, el seguimiento de la calidad de los metadatos y el cumplimiento de la norma de metadatos DCAT-AP, y la calidad de la distribución de los datos publicados en el portal nacional
- Impacto: Estudia la voluntad, preparación y capacidad de los países para medir tanto la reutilización de datos abiertos como el impacto provocado a través de esta reutilización.
Conclusiones del informe
Aunque parezca contradictorio, empecemos por el final, por las conclusiones del Informe. Los países de Europa, a pesar de una actualización de la metodología de evaluación de madurez de los datos abiertos que ha establecido requisitos más estrictos para varias preguntas, se mantienen estables. La actualización mencionada tiene como intención de estimular sistemáticamente la ODM en Europa y mantenerse al día con los avances tecnológicos y de políticas, al tiempo que asegurar la coherencia y la comparabilidad con evaluaciones de ODM anteriores.
Se ha hecho mención ya a las cuatro dimensiones de evaluación del informe, así que empezaremos por la dimensión 'política'. Ésta sigue siendo la que mejores números presenta, con una mejora interanual continua. El indicador subyacente de 'implementación de datos abiertos' ha sido el que más aumentó su puntuación, lo que apuntala el hecho de que los Estados miembros de la UE siguen aplicando sus políticas de datos abiertos a través de medidas y actividades específicas y cuentan con sistemas para ayudar a los titulares de datos y abordar los permanentes desafíos. Todos los países informan, también, de que están trabajando para aplicar el Reglamento de Ejecución. Los mayores avances respecto a 2023 en este ámbito están en las categorías de datos estadísticos, geoespaciales y meteorológicos, y en algunas tareas, como la identificación de los defectos de transmisión y la eliminación de las barreras jurídicas.
La dimensión 'portal' registra la mayor disminución interanual promedio en la puntuación entre las cuatro dimensiones. En particular, el indicador de 'características del portal' experimenta la mayor disminución. Unos datos que podrían tener que ver con la actualización de la metodología usada para la elaboración de este informe y con los nuevos requisitos introducidos sobre cómo los administradores de portales utilizan los datos que recopilan de y sobre los usuarios para mejorar el portal.
La dimensión 'impacto' volvió a experimentar la mayor mejora interanual, una vez que los Estados miembros adoptaron nuevas medidas para documentar la reutilización de datos abiertos y recopilar y clasificar casos de reutilización, produciendo un mejor conocimiento de estos, especialmente en los ámbitos medioambiental y económico.
Finalmente, Las puntuaciones en la dimensión 'calidad' también disminuyeron en promedio en comparación con 2023, siendo por poco la dimensión en la que los países participantes obtuvieron la puntuación más baja. El análisis destaca varias áreas en las que aún se puede mejorar la calidad de los metadatos.
Cifras globales
Las figuras 1 y 2 que aparecen a continuación muestran las puntuaciones de madurez de los 34 países participantes en el Informe elaborado en este 2024. Entre los resultados, destacan los siguientes:
- Un total de 18 países aumentaron su puntuación de madurez de los datos abiertos interanual; 1 país obtuvo la misma puntuación general que en 2023; y 15 países experimentaron una disminución en su puntuación de madurez (para 11 países, la disminución fue inferior a 5 puntos porcentuales -pp-)
- Las puntuaciones de madurez siguen concentrándose en el extremo superior del espectro, y la mayoría de los países (26 de 34; 76 %) tienen una puntuación de madurez superior al 73%
- Los Estados miembros mantuvieron su puntuación media de madurez al mismo nivel que en 2023, en el 83%
- Los Estados miembros más maduros son Francia (100 %), Polonia (98 %) y Eslovaquia (96%). El país de la AELC más maduro es Noruega (89%). El país candidato más maduro es Ucrania (97 %)
- Los países que más suben son Letonia (+10 pp), Croacia (+9 pp), Serbia (+9 pp) y Chequia (+6 pp)
La dimensión 'política' sigue siendo (como lo ha sido desde 2015) la más madura en promedio (91%), con un aumento de 2 puntos porcentuales desde 2023. Este crecimiento refleja las mejoras continuas en el marco de las políticas de datos abiertos y la implementación de iniciativas en este ámbito. En comparación con 2023, más países informan de que sus estructuras de gobernanza garantizan que las iniciativas locales y regionales de datos abiertos se faciliten y respalden a nivel nacional (de 20 a 23 Estados miembros). También de que su estrategia nacional describe medidas para incentivar la publicación y el acceso a los datos generados por los ciudadanos (de 11 a 14).
La dimensión 'portal' sigue siendo la segunda categoría más madura, aunque la puntuación media ha caído en comparación con 2023. Esta disminución se debe en parte a la introducción de nuevas preguntas que establecen estándares más altos para los países. En general, aunque la disponibilidad de datos sigue mejorando, los avances en las características del portal no han seguido el ritmo de las
expectativas creadas. Este año, 17 Estados miembros (62%) dicen que permiten la publicación de datos no oficiales en su portal. Esto representa un marcado aumento con respecto a 2023, cuando solo lo hicieron 12. Un total de 24 Estados miembros (88%; 2 más que en 2023) supervisan las características de los datos publicados en el portal, como la distribución entre categorías, los datos estáticos frente a los datos en tiempo real y cómo estos cambian con el tiempo; mientras que 20 promueven activamente los datos no oficiales en sus portales nacionales.
La dimensión 'calidad' es la menos madura (79%), y aunque la puntuación media ha disminuido desde 2023, sigue siendo superior a la de 2022. En 2024 se obtiene de forma automática en los portales nacionales, en lugar de editarse a mano, una mayor proporción de metadatos (18 frente a 13 en 2023); y más países (17 frente a 14) informan de que más del 90% de sus conjuntos de datos se proporcionan en un formato abierto y legible por máquina.
La dimensión 'impacto' se clasificó como tercera categoría con mejor desempeño este año. Superó a 'calidad' por primera vez y logró la mayor mejora interanual por segundo año consecutivo. Casi todos los Estados miembros (96%) aseguran que tienen una definición nacional de reutilización de datos abiertos; y un porcentaje también muy alto (92%), que cuentan con una definición de impacto de estos. En comparación con 2023, más Estados miembros tienen una metodología para medir el impacto de los datos abiertos en su país.
Los datos de España
España ocupa el 6 puesto en la clasificación global de madurez de los datos abiertos de 2024, quinto entre los países de la Unión Europea, alcanzando una puntuación global de 94,8%, un 0.1% más que en la edición anterior (aunque en aquella ocasión ocupaba la quinta posición del ránking - cuarta entre los países de la UE), lo que la coloca entre el grupo de los creadores de tendencias (trendsetters, en inglés). En esta edición, se posicionan por encima de nuestro país Francia, que ocupa el primer puesto, Polonia, Ucrania, Eslovaquia e Irlanda.
De las cuatro dimensiones analizadas, España destaca especialmente en la dimensión 'Impacto', donde logra la máxima puntuación y lidera la lista de países participantes. En todas las dimensiones registra una puntuación por encima de la media de los países de la UE: 96% frente al 91% en 'Política'; 96% frente a 82% en 'Portal'; 100% frente a 80% en 'Impacto', y 88% frente al 79% en 'Calidad'.
Como parte de sus iniciativas nacionales y regionales de datos abiertos, se ha adoptado un enfoque innovador para concienciar sobre el valor de los datos abiertos a las generaciones más jóvenes con el uso de las redes sociales para difundir estos contenidos, poniendo el foco de manera especial en audiencias de entre 16 y 35 años. Esta estrategia amplía el alcance de los datos abiertos y fomenta una mayor participación de los ciudadanos más jóvenes, promoviendo el valor de los datos como un bien público. Además, se está aprovechando el poder de los podcasts mediante el desarrollo de entrevistas con expertos en datos abiertos. Este enfoque multifacético posiciona a nuestro país como líder en la modernización de la comunicación de datos abiertos, combinando la educación y la divulgación.
En lo que se refiere a los incentivos para la publicación y el acceso a los datos, algunos países utilizan una infraestructura de datos abiertos, como los portales de datos abiertos, para incentivar la publicación y el acceso a diversos tipos de datos. España, junto a Luxemburgo y a Finlandia, destaca las medidas para mejorar la interoperabilidad (semántica) de los datos dinámicos en sus portales.
Para garantizar la publicación y reutilización efectiva de datos abiertos en todo un país, la gobernanza debe establecerse no sólo a nivel nacional sino también subnacional. Esto implica que los gobiernos nacionales creen un entorno propicio para que las entidades de rango inferior prosperen en sus iniciativas de datos abiertos. Si bien pueden existir limitaciones estructurales y legales, los gobiernos nacionales a menudo brindan apoyo técnico y de asesoramiento a las administraciones locales para sus iniciativas de datos abiertos. España, además de Estonia, Irlanda, Grecia y Francia, asegura que proporciona soporte y asesoramiento a los gobiernos regionales y locales desde sus gobiernos nacionales.
Los portales nacionales se centran principalmente en los datos proporcionados por fuentes a nivel nacional. Sin embargo, los conjuntos de datos regionales y locales pueden ofrecer información detallada y específica del contexto sobre una variedad de temas. Hacer que estos conjuntos de datos regionales y locales sean accesibles a través de portales nacionales puede promover su descubrimiento y una reutilización más amplia. En muchos casos, los conjuntos de datos de portales regionales y locales más pequeños se recopilan automáticamente. Por ejemplo, en España en 2024:
- 20 iniciativas regionales aportaron el 42% del total de datos del catálogo nacional, y el 99% de estos conjuntos de datos se recopilaron de modo automático
- 102 iniciativas locales aportaron el 17% del total de datos, y también el 99% de los conjuntos de datos se recopilaron de manera automática
La calidad de los datos se refiere al estado general del conjunto de datos. La preparación de datos de alta calidad incluye la gestión de los valores faltantes y otros elementos imprecisos, la armonización de las estructuras de datos y la puesta a disposición de los datos en formatos accesibles. La calidad de los datos también depende de la calidad de su difusión en los portales nacionales, que puede evaluarse examinando el uso de aspectos como las licencias de datos abiertos, los formatos de datos legibles por máquina, los identificadores únicos de recursos y un enfoque de datos vinculados. El método de recolección automatizada en España admite distintos formatos de datos (por ejemplo, valores separados por comas (CSV) y notación geográfica de objetos JavaScript (GeoJSON) y tipos de metadatos.
En España, un porcentaje significativo (90-99 %) de los metadatos del portal nacional se obtienen de forma automático de la fuente en lugar de editarse manualmente, circunstancia que se facilita mediante un flujo de trabajo bien estructurado gestionado por el back office del portal. El proceso, que se aplica a todos los tipos de datos publicados en catálogos fuente descritos mediante RDF, lo que garantiza que los metadatos del portal nacional se mantengan coherentes y actualizados y requieran una intervención manual mínima, se lleva a cabo de la siguiente manera:
- Definición del identificador uniforme de recursos (URI) de la fuente. Los editores comienzan por definir el URI del archivo del marco de descripción de recursos (RDF)/lenguaje de marcado extensible (XML) que contiene el catálogo de datos abiertos de la fuente, lo que garantiza que el catálogo nacional pueda recuperar los metadatos con precisión
- Ajuste de la frecuencia de recolección. Los editores pueden establecer la frecuencia de recolección de metadatos en función de sus necesidades, con opciones que incluyen actualizaciones manuales o actualizaciones automáticas de forma diaria, semanal, quincenal o mensual
- Análisis y actualización automáticos. Una vez configurada la URI y la frecuencia, el catálogo nacional analiza automáticamente el archivo RDF/XML y actualiza los conjuntos de datos pertinentes en el portal
Otro de los aspectos destacados de España es su modelo integral de calidad de datos. En nuestro país se usa un enfoque integral para garantizar la calidad de la distribución de datos abiertos aprovechando tanto el modelo de datos abiertos de 5 estrellas como los principios FAIR. El modelo de datos abiertos de 5 estrellas se utiliza para clasificar las distribuciones de conjuntos de datos en función de su formato de publicación. Además, la Oficina de Datos del Gobierno de España utiliza los principios FAIR como base para definir los principios rectores de los datos y sus infraestructuras y facilitar su reutilización. El portal nacional promueve la publicación de datos abiertos que alcancen al menos el nivel de 3 estrellas en la escala.
Foco en los datos de alto valor
Los Estados miembros están avanzando de manera apreciable en la aplicación del reglamento de ejecución sobre los datos de alto valor, especialmente mediante la elaboración de inventarios de conjuntos de datos y la preparación de conjuntos estadísticos, geoespaciales y meteorológicos.
De media, los Estados miembros son los que más avances están haciendo en los conjuntos de datos estadísticos (80%), geoespaciales (77%) y meteorológicos (75%). De los requisitos técnicos y jurídicos subyacentes, la identificación e inventario de los datos de alto valor (83%), la eliminación de las barreras jurídicas (77%) y el establecimiento de nuevas funciones y flujos de trabajo (77%) son los más avanzados.
En general, los requisitos relacionados con el progreso técnico, como la calidad de los metadatos (71%), los formatos legibles por máquina a través de interfaces de programación de aplicaciones (69%) y la descarga masiva (66%) son menos avanzados. No obstante, se trata de aumentos significativos en comparación con 2023.
En 2024, un total de 20 Estados miembros (70%) informaron de que promovían de manera activa los HVD en sus portales nacionales con el uso de herramientas editoriales como etiquetas o rótulos para promover su visibilidad y fomentar la reutilización al permitir a los usuarios seleccionarlos de manera específica. Los enfoques habituales para promover los HVD en los portales nacionales incluyen la incorporación de opciones de filtrado para ayudar a los usuarios a localizar fácilmente estos conjuntos de datos y profundizar en una de las seis categorías de HVD.
Varios países también han creado secciones específicas dentro de sus portales para permitir a los usuarios desplazarse por todos los conjuntos de datos HVD disponibles e informarles sobre los HVD, su importancia y los últimos avances en este campo. Además, 17 Estados miembros (63%) informan de que han aplicado la especificación de metadatos DCAT-AP HVD en sus portales de datos abiertos. Finalmente, 21 Estados miembros (78%) informan de que han aplicado otras medidas para garantizar que los HVD sean interoperables con conjuntos de datos de otros países; y 19 de que han aplicado procesos estructurados para supervisar la reutilización de los datos de los HVD.
Objetivos de la evaluación
El principal punto de acceso a nivel de la UE a la información del sector público publicada en toda Europa es, desde su lanzamiento en 2015, data.europa.eu. Un portal que tiene como objetivo mejorar el acceso y la reutilización de los datos abiertos, así como fomentar la publicación de datos abiertos de alta calidad. Es en este marco donde se encuadra el análisis anual de la madurez de los datos abiertos en los países europeos, cuya participación es voluntaria.
El objetivo, por tanto, es evaluar el desarrollo de los países en la puesta a disposición de la información del sector público y el fomento de su reutilización, ofreciendo una herramienta de evaluación comparativa y un aprendizaje para su uso tanto a nivel nacional como europeo. Los resultados de la evaluación ayudan a los países a comprender mejor su nivel relativo de madurez en comparación con otros países, además de recoger los avances año tras año y ayudar a identificar áreas de mejora.
La evaluación de la ODM se basa en las políticas de datos abiertos de la UE, principalmente la directiva sobre datos abiertos (Directiva (UE) 2019/1024) y el reglamento de ejecución sobre conjuntos de datos de alto valor (Reglamento de Ejecución (UE) 2023/138 de la Comisión). También incluye preguntas sobre los datos que no se pueden abrir, como los datos contemplados en la Ley de Gobernanza de Datos (Reglamento (UE) 2022/868) (pdf), ya que tener una visión general de dichos datos es útil a la hora de elaborar planes de publicación, y los portales de datos abiertos se pueden usar para ayudar a los posibles reutilizadores a encontrar información sobre qué datos protegidos se pueden reutilizar en condiciones específicas.
Metodología del Informe
Hemos comentado con anterioridad que la evaluación de la madurez de los datos abiertos evalúa el progreso y la eficacia de las iniciativas de datos abiertos en cuatro dimensiones temáticas que tienen como objetivo capturar la cadena de valor de extremo a extremo de los datos abiertos: política, portal, calidad e impacto.
- Política. Investiga las políticas y estrategias de datos abiertos en marcha en los países, los modelos nacionales de gobernanza para la gestión de datos abiertos y las medidas aplicadas para implementar esas políticas y estrategias. Para evaluar estos elementos, la dimensión comprende tres indicadores:
- marco de políticas
- gobernanza de los datos abiertos
- implementación de datos abiertos
- Portal. Investiga la funcionalidad de los portales nacionales de datos abiertos, en qué medida se examinan las necesidades y el comportamiento de los usuarios para mejorar el portal, la disponibilidad de datos abiertos en diferentes dominios y el enfoque para garantizar la sostenibilidad del portal. Para evaluar estos elementos, la dimensión comprende cuatro indicadores:
- características del portal
- uso del portal
- provisión de datos
- sostenibilidad del portal
- Calidad. Evalúa las medidas adoptadas por los administradores de portales para garantizar la recolección sistemática de metadatos, el seguimiento de la calidad de los metadatos y el cumplimiento de la norma de metadatos DCAT-AP, y la calidad de la distribución de los datos publicados en el portal nacional. Esta dimensión ofrece un incentivo general para que los administradores de portales y los responsables de las políticas garanticen que los datos abiertos del portal nacional tengan formatos adecuados y licencias correctas, sean legibles por máquina, tengan alta calidad y sean susceptibles de un enfoque de datos vinculados. Para evaluar estos elementos, la dimensión comprende cuatro indicadores:
- actualidad e integridad de los metadatos
- seguimiento y medidas
- cumplimiento de la norma DCAT-AP
- calidad de la distribución y datos vinculados
- Impacto: Analiza la voluntad, preparación y capacidad de los países para medir tanto la reutilización de datos abiertos como el impacto creado a través de dicha reutilización. Para evaluar estos elementos, la dimensión comprende tres indicadores:
- conciencia estratégica
- medición de la reutilización
- impacto creado
- Todos ellos dentro de las áreas de
- gobierno
- sociedad
- medio ambiente
- economía
- Todos ellos dentro de las áreas de