¿Cómo crear un espacio de datos? Turismo en España, un ejemplo

Un informe de la Oficina del Dato y Gaia-X ofrece claves y metodología para que los profesionales del sector turístico trabajen en el primer 'dataspace' interoperable en Europa

Andalucía, 27/01/2023
Informe sobre creación de espacios de datos en Turismo

El Ministerio de Asuntos Económicos y Transformación Digital publicó a finales de diciembre de 2022 la 'Radiografía del Espacio de Datos de Turismo en España' que revelaba, entre otros aspectos, los retos, oportunidades y necesidades que tiene un sector cada vez más afianzado para que sus profesionales puedan trabajar en el primer 'dataspace' interoperable a nivel europeo.

El turismo es uno de los sectores que más ingresos genera en España y, por esta razón, cada vez son más las instituciones que ponen en abierto los datos turísticos con el fin de atraer un mayor número de visitantes. La lista de las instituciones que han sumado sus datos sobre turismo al Catálogo Nacional de datos Abiertos la recoge DatosGob: a nivel nacional, destacan el Instituto Nacional de Estadística (INE), la Agencia Estatal de Meteorología (AEMET) o el Instituto Geológico y Minero de España; y por comunidades, la Junta de Andalucía (con la Encuesta de coyuntura turística de Andalucía en CSV y HTML), País Vasco, Navarra, Canarias, Aragón y Cantabria, principalmente.

En FITUR, la gran feria internacional del turismo que se acaba de celebrar a mediados de enero de 2023 en Madrid, ha habido incluso un punto de encuentro global para profesionales del sector con sesiones como la Smart Talk titulada 'Los espacios de datos para el turismo'.

El informe que ha realizado la Oficina del Dato en colaboración público-privada con el grupo de trabajo de turismo del Hub español de Gaia-X, que ya ha realizado algún taller ('Casos de uso del espacio de datos del Turismo español'), es el punto de partida para que los profesionales sepan cómo elaborar un espacio de datos sobre el turismo en España.

Informe 'Radiografía del Espacio de Datos de Turismo en España'

El estudio parte de un enfoque basado en casos de uso sobre plataformas de datos comunes, en el que se analiza el valor de la utilización de los conjuntos abiertos de datos (open data); la necesidad de compartir información entre organizaciones privadas; la gobernanza de procesos y participantes parar fomentar la apertura de datos en diferentes ámbitos, con relevancia en el sector turístico; y los retos en la escalabilidad de estos modelos, sus principios y criterios de diseño y las diversas arquitecturas técnicas ya existentes.

Entre los aspectos más destacados, el informe detalla las siguientes directrices:

  • Es fundamental empezar a trabajar en definir las reglas del juego del espacio de datos de turismo. No partiendo desde cero, sino de iniciativas que ya se hayan puesto en marcha, evitando solapamientos y asegurando que se trabaje conjuntamente.
  • Dentro de dichas reglas del juego, conviene definir claramente los roles de los diferentes actores, así como la coordinación que será necesaria.
  • No hay que perder de vista el nivel de segmentación y fragmentación del sector turístico.
  • Es también importante definir el dato, el nivel del dato, y las condiciones de uso con el establecimiento de un modelo de recompensas.
  • Hay que aprender de casos de uso existentes y extraer de los mismos las lecciones pertinentes.
  • Siendo el modelo de negocio clave, así como las implicaciones legales, hay que tener en cuenta que la monetización tiene que consistir en el fin único, así como mejorar los servicios y su eficiencia.
  • La definición de la gobernanza y tecnología son fundamentales.
  • No olvidar la transversalidad del sector turístico y su fuerte vinculación a otros sectores de actividad.
  • El nivel de partida en la digitalización no es alto. Por ello, hay que dar una respuesta preventiva y buscar soluciones de bajo coste, teniendo en cuenta que la confianza al principio es baja.
  • Es conveniente determinar una estandarización muy alta dentro del espacio de datos y con otros espacios de datos, e implementar tecnologías que permitan la interoperabilidad.
  • Hay que ser pragmáticos y apostar por una dinámica práctica, para que el participante pueda elegir su modo de involucración y colaboración.
  • Hay que concienciar y convencer a las empresas del valor general latente en la cesión de datos.
  • Teniendo en cuenta que cada empresa tiene un lenguaje tecnológico diferente, se debería definir una ontología común.
  • El espacio de datos debería ser también un lugar desde el que crear oportunidades.
  • Palabras clave: consenso y unificación. Unificar de manera lógica, en base una federación de sistemas bajo una misión común.

En el pdf del Informe se incluye un Anexo final con la Metodología general para la construcción de espacios.

Gaia-X Hub Spain

Con el fin de promover un entorno propicio para la creación de espacios de datos sectoriales, se ha impulsado la creación del Hub español de Gaia-X (Gaia-X Hub Spain), una iniciativa europea que busca que los diferentes sectores de la economía creen comunidad en torno al dato. 

El grupo promotor de este proyecto, cuyo objetivo es la creación de una infraestructura de datos abierta y segura cumpliendo con los más altos estándares de soberanía digital y promover la innovación, ha seleccionado para liderar este gran proyecto europeo en España la candidatura presentada por el Gobierno de Castilla-La Mancha (ubicado en las instalaciones del Centro Regional de Innovación Digital en Talavera de la Reina). 

Gaia-X trabaja con empresas públicas y privadas y organizaciones para que los datos y servicios pueden estar disponibles, recopilados y compartidos en un entorno de confianza.

Gobernanza y compartición de datos

En los espacios de datos, la gobernanza de la compartición es una cuestión crucial, tanto en el acceso, como en la reutilización de los datos. Sólo creando un ecosistema confiable y seguro, las diferentes organizaciones del sector turístico se encontrarán dispuestas a ceder o compartir sus datos. Según el informe, los principales retos para la escalabilidad en la compartición de datos privados del turismo son:

  1. Los datos se encuentran dispersos entre los diferentes actores del sector turístico. Tiene una variedad de actores muy elevada, desde el sector público a todos los niveles (administración central, regiones y ayuntamientos) hasta el sector privado. En particular, en el ámbito privado se pueden encontrar tanto en pymes y micropymes (industria cultural, restauración, empresas de eventos...), como en grandes empresas en la industria hotelera, o en la digitalización del patrimonio cultural nacional, entre otras. 
  2. Además, el mundo del turismo está formado por organizaciones digitalizadas a diferentes niveles. Esto impacta tanto en los volúmenes de datos gestionados, como en los tipos de datos que se pueden compartir, y también en las estructuras de dichos conjuntos de datos y sus infraestructuras. Todo esto suponen dificultades para el acceso, razón por la que normalización y estandarización adquieren especial relevancia, por cuanto simplifican los procesos necesarios en torno a la compartición y explotación de datos. 
  3. La calidad de los datos no es óptima para los muchos usos que se les quiere dar. Éste no es un problema solamente del ámbito turístico, sino de la economía del dato en general. En este sentido, la segmentación de los mismos resulta de gran ayuda para optimizar el diseño metodológico.
  4. El respeto a la privacidad y la protección de los datos de los ciudadanos (de manera que no se vean vulnerados sus derechos) es uno de los grandes retos, y más en relación al turismo, ya que estos pueden contener datos de carácter personal.
  5. La cultura sobre compartición del dato es uno de los grandes retos de la economía del dato. Los actores turísticos se muestran reacios a compartir sus datos para evitar que afecte negativamente a sus ventajas competitivas o a sus secretos comerciales.
  6. La actualización de competencias en los trabajadores del sector. Se están desarrollando iniciativas de formación de perfiles directivos en materia de datos que, posteriormente, se posicionarán para la toma de decisiones estratégicas.

Interoperabilidad y reutilización: 'building blocks' para 'dataspaces'

El desarrollo del espacio de datos del turismo debe ser un proceso evolutivo, construido en base a diferentes casos de uso sectoriales que busquen maximizar la interoperabilidad y las funcionalidades comunes entre sí. De esta forma, se desplegan los llamados 'building blocks' (o bloques de construcción tecnológicos) según los criterios y requerimientos de cada caso de uso, dando forma a arquitecturas semiprefabricadas, con un alto porcentaje de componentes ya listos para su uso, que responden a los acuerdos de los participantes en el mismo.

Los 'building blocks' se desarrollan en torno a las siguientes características, según el informe:

Building clocks

Metodología general para la construcción de espacios de datos

El estudio apuesta por una metodología de trabajo colaborativo y una planificación del mismo, que debe ser abordado por diferentes grupos de interés sobre el que desplegar actuaciones concretas. Es preciso elaborar un análisis de partida del estado de madurez de sus organismos y su grado de implicación, así como una definición de un plan de acción para cada caso de uso en base a:

  • Los incentivos de participación y definición de factores de éxito.
  • El modelo colaborativo.
  • La gobernanza que se determine idónea.
  • El análisis arquitectónico de datos (incluyendo tecnologías y 'roadmaps' de desarrollo).
  • La identificación de grupos de interés y posibles partenariados estratégicos.
  • Monitorización y mejoras.

Una vez diseñados los casos de uso, dicha interoperabilidad y funcionalidad de negocio se empezará plasmar a través de un MVP (Minimum Value Product) del espacio de datos de turismo, incluyendo casos de uso prominentes, capturando particularidades del sector, tanto desde el punto de vista de creación de valor y de estandarización del consenso en la compartición, como de la diversidad de participantes involucrados.

Las especificaciones de requisitos para un caso de uso concreto, dentro de un espacio de datos, se pueden obtener a través de un cuestionario básico con los siguientes ítems:

  • Misión y visión de la compartición y explotación de datos: se define el propósito de tales estructuras y procesos, así como sus principios fundamentales y cómo darles visibilidad y capilaridad para que tengan una sostenibilidad a futuro.
  • Negocio: es el ámbito desde el que se caracteriza el valor a extraer por medio de la explotación de los datos e identificar derechos sobre el uso de los mismos. 
  • Normativa: se abordan temas como los principios contractuales que regulan los casos de uso del espacio de datos, incluyendo los derechos sobre datos, pero también las responsabilidades y los mecanismos de gobernanza de la compartición y explotación de los conjuntos de datos. 
  • Funcionalidades: agrupa todas las capacidades que deben existir en un espacio de datos para cumplir con las expectativas de sus participantes.
  • Ámbito de datos: es uno de los dos tecnológicos. En éste se abordan dinámicas y características propias de los conjuntos de datos a transformar y explotar en los casos de uso, e incluye políticas de gobierno y gestión del dato, de calidad de datos, modelos de datos, procesos y 'frameworks' de ciencia de datos y 'machine learning', y también aspectos de consumo de la información (reportes, cuadros de mandos), y su sostenibilidad y evaluación continua (DataOps).
  • Tecnología: es el ámbito de IT, donde se define la arquitectura de los sistemas, la infraestructura a emplear y las soluciones comunes, el posible desarrollo de módulos y sus respectivos 'roadmaps' y recursos, así como la administración y el soporte para cualquier tecnología que deba implementarse como parte del ciclo de vida de los datasets.
  • Operaciones: es el ámbito que da coherencia práctica al resto de dimensiones. Se incluye tanto el proceso operativo de certificación de componentes y participantes (según el modelo acordado) como la descripción de los Service Level Agreeements (SLAs: acuerdos de niveles de servicio) por parte de los proveedores, o la gestión de incidencias y de cambios en la operativa de los casos de uso.