Aprende sobre Europa a través de los conjuntos de datos de alto valor

Algunos datos producidos por el sector público son particularmente interesantes para los creadores de servicios y aplicaciones de valor añadido. La Directiva sobre datos abiertos de la Union Europea define los datos de alto valor (HVD, por sus siglas en inglés) como "documentos en poder de un organismo del sector público, cuya reutilización está asociada a importantes beneficios para la sociedad, el medio ambiente y la economía" y establece seis categorías: geoespacial, observación de la Tierra y medio ambiente, meteorología, estadística, sociedades y propiedad de sociedades, y movilidad. Para analizar su importancia e impacto en Europa, data.europa.eu ha elaborado una nueva serie de 'data stories' con casos de estudio y visualizaciones a partir de esos datos de alto valor.

Andalucía, 13/12/2024
Imagen creada con IA en la que se ve una esfera del globo terráqueo flotando sobre una ciudad en un paisaje muy nublado y oscuro en el que está lloviendo

Esta serie de 'data stories' pretende poner el foco de atención sobre los conjuntos de datos de alto valor de la Unión Europea y poner de manifiesto cómo pueden utilizarse para conformar los debates  en la sociedad sobre cuestiones relevantes para la economía y el bienestar de la ciudadanía a través de una mejor prestación de los servicios públicos.

La primera de ellas tiene como protagonista a España y analiza el riesgo de inundaciones (cuestión de sumo interés y actualidad después de lo ocurrido en los últimos días del mes de octubre de este 2024 en Valencia y otras zonas de nuestro país). Cada historia va acompañada de una nota de visualización, un artículo que introduce al lector en el lenguaje de la visualización de datos. Una 'data story' que abordaremos más adelante. Pero vayamos ahora con algunos conceptos generales sobre los HVD.

Los datos de alto valor

Para avanzar en la implementación del marco de conjuntos de datos de alto valor, la Comisión Europea, en colaboración con los Estados miembros, ha definido el estándar DCAT-AP (especificación europea para la descripción de catálogos de datos abiertos, siendo su referente el estándar Data Catalog Vocabulary (DCAT) de W3C, creado para facilitar la interoperabilidad entre catálogos de datos publicados en la web) para conjuntos de datos de alto valor para los metadatos de los conjuntos de datos de alto valor.

Y ha publicado, además, una lista de códigos para las categorías de HVD que no se recomienda utilizar fuera del contexto de la legislación sobre la reutilización de la información del sector público y que son mantenidas por la Dirección General de Redes de Comunicaciones, Contenido y Tecnologías y publicadas por la Oficina de Publicaciones de la Unión Europea en los Vocabularios de la UE.

En el Reglamento de Ejecución de la UE se recoge que cada Estado miembro debe presentar a la Comisión antes del próximo 9 de febrero de 2025, y con posterioridad, cada dos años, "un informe sobre las medidas que ha llevado a cabo para aplicar el presente Reglamento". Este expediente debe contener la siguiente información: una lista de conjuntos de datos de alto valor publicados a nivel de Estado miembro (y, cuando proceda, a nivel subnacional) con referencia en línea a los metadatos; un enlace permanente a las condiciones de concesión de licencias aplicables; y un enlace permanente a las API que garantizan el acceso a los conjuntos de datos de alto valor. Y, si procede, también deben informar sobre otros aspectos, como documentos de orientación o evaluaciones de impacto de la protección de datos.

Recopilación e identificación de HVD

En lo referente a la recopilación por parte de data.europa.eu, basándose en los puntos finales comunicados por los Estados miembros a través de una encuesta de la UE (que data de septiembre de 2024, con una actualización a finales de 2024), data.europa.eu recopilará los conjuntos de datos anotados como HVD en los portales nacionales de datos abiertos y geoportales y sus metadatos se actualizarán automáticamente para incluir las propiedades de HVD según los procesos de recopilación automática establecidos. En esta infografía de la web datos.gob.es se recogen los 8 pasos sugeridos por la UE para el cumplimiento del reglamento de implementación de HVD:

Con el fin de elegir los conjuntos de datos específicos en cada una de las seis categorías, la Comisión consultó a una amplia gama de partes interesadas que representaban tanto a los titulares de datos como a los usuarios. Las entrevistas con las partes interesadas permitieron esbozar una 'lista de deseos' preliminar de conjuntos de datos considerados de alto valor (desde una perspectiva económica, social y de reutilización).

El estudio de apoyo a la evaluación de impacto cartografió, de manera paralela, toda la legislación pertinente a escala europea con el fin de identificar los ámbitos de datos ya cubiertos por las normas de la UE. A continuación, el estudio evaluó el grado en que cada conjunto de datos podía considerarse de «alto valor», en consonancia con los criterios de evaluación enumerados en el artículo 14, apartado 2, de la Directiva sobre datos abiertos.

Impacto de los HVD sobre la ciudadanía

Los HVD reducirán significativamente las barreras de entrada al mercado europeo basado en datos y aumentarán el volumen de conjuntos de datos reutilizados. Esto, a su vez, estimulará la generación de nuevos servicios digitales y la mejora de los servicios o procesos de negocio existentes. Una mejor disponibilidad de diversos conjuntos de datos estadísticos (mercado laboral, demografía, producción industrial) facilitará la previsión del impacto de las posibles medidas políticas.

 

Además, una mayor disponibilidad de información sobre las empresas tiene claros beneficios sociales para ámbitos como la lucha contra la delincuencia (incluido el delito financiero), el aumento de la participación pública y la transparencia de las transacciones económicas.

Los datos de alto valor se diseñaron en beneficio de las pymes y de las empresas emergentes, que a menudo permanecen excluidas del mercado al no disponer de suficientes recursos humanos y financieros para adquirir y mejorar la calidad de los datos del sector público.

Se considera que el aumento de la oferta de datos impulsará el espíritu empresarial y dará lugar a la creación de nuevas empresas. Los HVD pueden convertirse también en un importante facilitador para que las empresas de nueva creación certifiquen sus oportunidades de negocio y atraigan inversores.

Los datos abiertos además pueden empoderar a las pymes, para las que las soluciones de software de datos que utilizan datos del sector público pueden convertirse en su principal producto o servicio.

Por último, la libre disponibilidad de datos ayudará a reequilibrar la posición de las pymes en relación con las empresas Big Tech, para las que el precio de la adquisición de datos no es una barrera significativa.

En este objetivo, el sector público asumirá los costes relacionados con la necesaria actualización técnica de la publicación de datos (a través de API) y tendrá que dejar de cobrar tasas por la reutilización de los HVD.

La Comisión apoya a los organismos del sector público con acciones concretas en el marco del Programa Europa Digital, una vez que la lista de HVD se elaboró en colaboración con los Estados miembros y se elaboró tras una evaluación de impacto exhaustiva.

Como tal, solo contiene datos cuya reutilización generará beneficios que superan en gran medida los costes relacionados con su libre prestación.

'Data story' Lo que el agua nos puede arrebatar

Hemos comentado al comienzo de este artículo que España es protagonista de la primera 'data story' publicada en data.europea.eu como caso de uso o aplicación de los HVD en escenarios reales. Esta historia sobre el riesgo de inundaciones en nuestro país es la primera de una serie que ilustra el poder de los conjuntos de datos de alto valor para informar debates sobre temas de interés público. Cada historia va acompañada de una nota de visualización, un artículo que introduce al lector en el lenguaje de la visualización de datos.

El estudio parte de la premisa de que el cambio climático y la subida del nivel del mar están aumentando el riesgo y la frecuencia de las inundaciones provocadas por el desbordamiento de ríos y el aumento del nivel del mar para millones de personas en todo el mundo. Solo en España, según un estudio realizado en 2019, unas 200.000 personas pueden correr el riesgo de sufrir inundaciones costeras en las próximas décadas.

Como ya hemos apuntado con anterioridad, en los últimos días de octubre de 2024, la DANA que azotó el este y sur de España provocando fuertes aguaceros, especialmente en la región de Valencia, produjo el desbordamiento de algunos ríos y provocó catastróficas inundaciones repentinas que causaron un gran número de víctimas mortales y de importantísimos daños materiales.

Varios conjuntos de datos de alto valor identifican partes de España que pueden estar expuestas a inundaciones en el futuro y los posibles daños que pueden sufrir. Muchas de estas regiones están densamente pobladas o tienen una gran relevancia histórica, económica o medioambiental.

Esta historia utiliza nuestro país como ejemplo de cómo combinar diferentes conjuntos de datos relacionados con el riesgo de inundaciones para construir una historia que sirva de base al debate público sobre cómo afrontar este reto. Además, está conformada por datos que podrían aplicarse de manera sencilla en cualquier otro Estado miembro de la UE que genere conjuntos de datos similares.

Para la elaboración de esta historia, datos.europa.eu ha usado mapas (ilustración superior) para mostrar áreas en España que pueden estar en riesgo de inundaciones fluviales o costeras en los próximos años o décadas. Mapas que representan datos y que son parte de una práctica llamada visualización de datos.

El objetivo con esta serie de historias que ahora arranca no es sólo crear bonitos gráficos basados en conjuntos de datos de alto valor, sino también demostrar que la visualización es una herramienta poderosa para revelar patrones y tendencias en los datos, y enseñar cómo usarla a aquellas personas interesadas. Por ello, cada una de las 'data stories' llevará aparejada un artículo estinado a presentarte el maravilloso universo de la visualización de datos.

La 'story' en datos. Andalucía como ejemplo

Algunas partes de España serán más propensas a inundaciones que otras. Está, por ejemplo, la cuenca del río Guadalquivir, una gran parte de ella es una llanura aluvial de baja altitud llamada Depresión Bética, y varias ciudades, como Córdoba y Sevilla, se encuentran en ella.

 

La cuenca del río Guadalquivir puede estar en riesgo no sólo de inundaciones fluviales, sino también de inundaciones costeras en un futuro no muy lejano, teniendo en cuenta que el cambio climático y el aumento del nivel del mar pueden aumentar este riesgo.

Al aproximarnos aún más, llegamos a la a desembocadura del río Guadalquivir donde se encuentra con el océano Atlántico en la ciudad de Sanlúcar de Barrameda. Las Marismas del Guadalquivir, de las que procede gran parte de la producción arrocera de España, se encuentran en esta zona. La economía de municipios como Isla Mayor depende en gran medida del arroz.

También encontramos ahí el Parque Nacional de Doñana, uno de los humedales más grandes que quedan en Europa y que alberga varias especies de mamíferos y aves en peligro de extinción. Este espacio, Patrimonio Mundial de la UNESCO desde 1994 por su biodiversidad y relevancia ambiental, también se verá afectado negativamente en el futuro.

Las propiedades cercanas a la parte del río Guadalquivir que se encuentran en el entorno de La Puebla del Río, el Poblado de Alfonso XIII e Isla Mayor también pueden estar en riesgo de inundación en el futuro, al igual que las más de 6000 personas que viven en la zona. 

Los conjuntos de datos de alto valor nos ayudan a identificar puntos que pueden estar en riesgo de inundación en toda España. Estos pueden ser desde sitios de infraestructura pública hasta lugares de alto valor cultural, histórico o económico.

Conjuntos de datos de alto valor utilizados en esta historia:

¿Son accesibles los HVD en toda Europa?

Para responder a esta pregunta, se debe partir de la necesidad crítica de mejorar la capacidad de búsqueda y la accesibilidad a los metadatos de los conjuntos de datos de alto valor en los Estados miembros de la Unión Europea. Con este objetivo, en septiembre de 2024 se publicó el estudio 'High-value datasets: Cross-country findability and comparability of metada', realizado entre abril y mayo de 2024. En él se evalúa la disponibilidad y usabilidad de 24 conjuntos de datos de Dinamarca, Estonia, Letonia y Finlandia, centrándose en seis categorías temáticas: geoespacial, observación de la tierra y medio ambiente, meteorología, estadísticas, sociedades y propiedad de sociedades, y movilidad.

 

El estudio revela que, si bien la mayoría de los HVD son generalmente accesibles, existen inconsistencias significativas en la claridad de los metadatos y el lenguaje. Por ejemplo, 6 de los 24 conjuntos de datos se publicaron sólo en el idioma nacional, lo que dificultó la traducción para los usuarios internacionales. Además, ocho de los conjuntos de datos carecían de referencias a las regulaciones relevantes, lo que complicaba los esfuerzos para verificar el cumplimiento. A pesar de estos desafíos, el estudio concretó que 20 de los 24 conjuntos de datos estaban fácilmente disponibles (según Reglamento UE 2023/138).

Para abordar estas cuestiones, en el informe se recomiendan varias medidas a los Estados miembros, que incluyen hacer referencia a la regulación en los metadatos, utilizar títulos de conjuntos de datos estandarizados, enriquecer los metadatos con descripciones detalladas y cumplir con las directrices de DCAT-AP para metadatos estructurados. La aplicación de estas recomendaciones mejoraría significativamente la capacidad de localización y usabilidad de los HVD, facilitando un mejor intercambio y reutilización de datos en toda la UE.

Más información