Técnicas avanzadas de acceso a datos en data.europa.eu

Ejemplos de uso y herramientas del portal europeo que recopila datos de 36 países para sacar su potencial y utilizarlo de manera profesional

Andalucía, 31/03/2023
data europe eu

El portal data.europa.eu, gestionado por la Oficina de Publicaciones de la Unión Europea, recopila datos del sector público de 36 países. La Oficina de Publicaciones de la Unión Europea es el proveedor oficial de servicios de publicación para todas las instituciones, organismos y agencias de la UE y como tal, es un punto central de acceso a la legislación europea, publicaciones, datos abiertos, resultados de investigación, avisos de contratación y otra información oficial. Su misión es apoyar las políticas de la UE y garantizar que esta amplia gama de información esté disponible para el público como datos accesibles y reutilizables para facilitar la transparencia, la actividad económica y la difusión del conocimiento.
Sus cifras son ya más que relevantes en el panorama internacional de datos abiertos:

  • Conjunto de datos: 1.605.782
  • Catálogos: 176
  • Países: 36
  • Noticias: 1.367
  • Historias de datos: 191
  • Cursos: 11

Aunque la plataforma contiene datos públicos de la UE y de sus estados miembros, también recoge conjuntos de datos de ámbito internacional, regional o de entidades locales; e incluso desde portales de dominio específico (sectoriales) y geoportales. 

En este artículo se mostrarán algunos ejemplos para conocer en profundidad data.europa.eu, aprovechando que cuenta con un servicio de traducción automática eTranslation de la Comisión Europea, y mostrar todo su potencial para utilizar el portal como un profesional.

El portal data.europa.eu invita a la ciudadanía a aportar nuevas funcionalidades, a compartir información de los usuarios sobre cómo utilizar los datos abiertos e insiste en que todos los datos están disponibles gratuitamente y pueden utilizarse para la creación de empresas. 

Si se administra un portal o un sitio web que contiene información del sector público y se desea que el portal data.europa.eu la recopile, se deberá completar un formulario de contacto detallando la información que solicita sobre el mismo. 

Preguntas frecuentes FAQ

Como punto de partida, algunas de las preguntas frecuentes recogidas en las FAQ de data.europa.eu/es orientan sobre cuestiones básicas:  

  • ¿En qué formato puedo descargar los datos? Los conjuntos de datos pueden exportarse a WMS, WFS, KML, HTML, Excel, PDF, XML, JSON, RSS, GML, SVG, SHP, PNG, JPEG, GIF, RDF-XML, RDF-Turtle, RDF-N3, OCTET STREAM, JSON-LD y Atom. 
  • ¿Por qué el portal recopila conjuntos de datos publicados en formatos de archivo no protegidos? El portal recoge todos los conjuntos de datos de los portales que recopila, sin excluir ningún formato. Los datos se recopilan en el formato de archivo proporcionado por la fuente. 
  • ¿Qué es una licencia? Una licencia es una declaración explícita y jurídicamente vinculante de los derechos, restricciones y obligaciones de los destinatarios en relación con un conjunto de datos específico. Normalmente, se expresa a través de un contrato escrito o mediante una declaración unilateral del titular o titulares de los derechos, pero también puede expresarse a través de la legislación u otras iniciativas reguladoras.
  • ¿Por qué recoge el portal conjuntos de datos publicados bajo licencia no comercial? data.europa.eu recoge todos los conjuntos de datos de los portales que recopila, sin excluir los conjuntos de datos bajo licencias no comerciales.  
  • ¿Qué analiza la herramienta de Garantía de Calidad de los Metadatos? Los conjuntos de datos almacenados en el portal deben tener una calidad adecuada en cuanto a:
    • Asignación de metadatos conforme a DCAT-AP
    • Distribuciones disponibles
    • Uso de formatos de distribución legibles por máquina
    • Uso de licencias de código abierto conocidas
  • ¿Cómo puedo encontrar un conjunto de datos que contenga coordenadas geográficas? La búsqueda en el mapa permite a los usuarios encontrar conjuntos de datos que contengan información geográfica de una región específica. Debe escribir la región o dibujar un cuadro delimitador en el mapa.

Catálogo de datos abiertos y herramientas

El portal data.europa.eu es en sí un catálogo de metadatos que se puede explorar a través de un motor de búsqueda (Datos), a través de un mapa para datos geoespaciales, mediante el uso de un punto final SPARQL o consumiendo las APIs REST de consulta y gestión. 

Entre las opciones avanzadas de la plataforma, desde el buscador de 'Datos' se accede al Catálogo de datos, que dispone de un menú lateral (izquierda) con los apartados de metadata (entidades), formatos, catálogos, categorías, palabras clave, alcance de los datos, servicios de datos, calidad y licencias que guían al usuario en la búsqueda de los datos. Pero además, ofrece herramientas avanzadas que permiten la consulta y descarga de información fácilmente, como:

Junta de Andalucía en data.europa.eu

En el apartado de Conjunto de Datos, si se clica en el buscador de palabras claves 'Andalucía', devolverá los 457 conjuntos de datos que están vinculados en el portal a la Junta de Andalucía y avalados por datos.gob.es. 

data europe andalucia

APIs de data.europa.eu 

Para saber qué APIs (Application Programming Interfaces: Interfaces de Programación de Aplicaciones) están disponibles y dónde se puede encontrar su documentación, se puede consultar la sección de FAQs del portal, destacando entre ellas algunas de gran utilidad:

  1. Search:  API de sólo-lectura para búsqueda y consulta de conjuntos de datos en el portal, se puede acceder al catálogo de forma abierta y automatizada sin autenticar.
  2. SPARQL: es un acrónimo del inglés SPARQL Protocol and RDF Query Language. Se trata de un lenguaje estandarizado para la consulta de grafos RDF, normalizado por el RDF Data Access Working Group (DAWG) del World Wide Web Consortium (W3C), una tecnología clave en el desarrollo de la web semántica. 
  3. Registry:  Para proveedores de datos, API autenticada
  4. Use cases (csv) 
  5. MQA: Herramienta desarrollada para estudiar la calidad de los metadatos recolectados por data.europa.eu. Ayuda a los proveedores de datos y portales de datos a comprobar la calidad de sus metadatos y recibir sugerencias de mejoras. Los resultados se presentan a través del MQA y también están disponibles como descarga. Accede a su metodología. 
  6. SHACL: un componente software, diseñado en Java (usando la librería Apache Jena) y disponible bajo licencia abierta, para chequear condiciones SHACL mediante llamadas a un API software.                                                

Ejemplos de uso de la API de búsqueda de datos 


Como ya se ha tratado en artículos anteriores, como el dedicado a las APIs para el acceso a datos abiertos, las APIs son una tecnología que permiten la comunicación entre aplicaciones y facilitan el acceso automatizado a datos a través de un método sencillo como es, en el caso de las populares APIs tipo REST, realizando una petición mediante el acceso a una dirección de internet o URL (Uniform Resource Locator en inglés o localizador de recursos uniforme), configurada con una serie de parámetros. Las peticiones a la API devolverán los datos encontrados en un formato estándar legible por máquinas como, por ejemplo, JSON.

En el portal data.europa.eu está disponible la página de API Search que proporciona documentación detallada de todas las funciones de la API: métodos o endpoints disponibles, modo de uso, parámetros, ejemplos de llamada y respuestas posibles, entre otros. De esta forma, se permite la consulta y descarga de todos los metadatos almacenados en la plataforma, como la información de conjuntos de datos o catálogos registrados.

Desde la aplicación, se puede identificar qué recursos son de interés, obtener su URL de consulta y conocer los parámetros que permiten paginar y filtrar los resultados personalizando la búsqueda.

Ejemplo de búsqueda

Con esta información, se puede montar una petición personalizada para, por ejemplo, obtener los cinco primeros conjuntos de datos que satisfagan el término ‘andalucia’. Para ello, se forma la URL con la URL base del método (https://data.europa.eu/api/hub/search/search), seguida del carácter ‘?’ y se añade los parámetros como pares ‘parametro=valor’ separados por el signo ‘&’, de esta forma se obtiene una URL que se puede consultar mediante un navegador web, una aplicación para consumo de APIs o automatizar programáticamente la consulta dentro de una aplicación informática.

En el ejemplo citado, se usan los parámetros ‘page’ y ‘limit’ para obtener los cinco primeros resultados, indicar además que se desea obtener únicamente los recursos de tipo ‘dataset’ mediante el parámetro ‘filter’ y, por último, se especifica el término de búsqueda con el parámetro ‘q’, indicando aquellos que contengan el término ‘andalucía’. La URL de consulta, sintácticamente correcta, sería:

Una vez se ha generado la URL, se puede realizar la consulta por cualquiera de los medios indicados, en este caso, optando por una herramienta sencilla y online para enviar consultas a servicios REST como Reqbin. Para ello, se copia la URL construída y se introduce en el campo correspondiente, seleccionandoel método REST utilizado (en este caso ‘GET’, según indica la documentación de la API) y se pulsa ‘Send’.
api REST


El servidor devuelve el estado de la consulta (200 OK), su duración, el tamaño de los datos descargados y los contenidos con los resultados encontrados en formato JSON, que se pueden analizar, copiar y utilizar en el proyecto de datos personalizado.

Código API

Más información