Data Lake Sanitario: 11 repositorios de datos de acceso público sobre salud y bienestar
Dentro del Plan de recuperación, transformación y resiliencia trazado por el Gobierno de la nación, como hoja de ruta para la modernización y recuperación del crecimiento económico se presenta la creación de un nuevo data lake sanitario
Dentro del Plan de recuperación, transformación y resiliencia trazado por el Gobierno de la nación, como hoja de ruta para la modernización y recuperación del crecimiento económico se presenta la creación de un nuevo data lake sanitario que contará con gran cantidad de datos sin procesar que podrán estar a disposición de investigadores, administraciones y grupos interesados. La iniciativa nace como una prolongación de la comenzada por la Comisión Europea en la creación de un espacio europeo de datos sanitarios que estará disponible en los meses venideros.
Este hecho supone una oportunidad para investigadores y otros colectivos que permitirá implementar nuevas soluciones sanitarias basadas en la tecnología ya que, con el uso de estos datos de salud y bienestar, profesionales de todo el mundo podrán transformar el sistema sanitario, proponiendo mejoras para la salud y calidad de vida que podrían afectar a toda la comunidad europea.
Los recursos de referencia que debes conocer
En la actualidad puedes encontrar más de 16.000 conjuntos de datos en las categorías salud y bienestar. Sin embargo, y pese a que todas ellas cuentan con garantías de calidad informativa, así como del anonimato de los pacientes de los que surgen estos datos, recomendamos para esta publicación los 11 repositorios que consideramos más relevantes a nivel internacional para este sector.
CDC Wonder
Esta base de datos cuenta con información de investigación estadística publicados por iniciativa del Centro de Control y Prevención de Enfermedades de EE.UU. Estos datos cuentan también con materiales de referencia, informes y directrices sobre el sector salud y, en cuestiones más específicas, datos sobre epidemiología, mortalidad, natalidad, datos censales y enfermedades como el cáncer, la tuberculosis, VIH y SIDA, que podrás descargar en formato .XML a través de su API.
CMS.gob
Se trata de un buscador publicado por U.S. Centers for Medicare & Medicaid Services que provee datos relacionados con los servicios proporcionados por las instituciones que aceptan el programa de cobertura social Medicare.
Este programa acumula un amplio repositorio de datos sobre doctores/as, hospitales e instalaciones y los servicios que en estos ofrecen; así como facilita la atención médica a personas con algún tipo de discapacidad o enfermedad grave y a pacientes mayores de 65 años. Todos estos datos pueden descargarse a través de su API en formato .CSV.
Broad Institute
El Broad Institute ofrece en la actualidad herramientas open source con las que podrás consultar resultados sobre investigaciones científicas del sector salud en el ámbito de la biología humana y, en específico, se encuentra a disposición del público datos descargables sobre enfermedades como el cáncer o el epigenoma.
Global Health Data Exchange (GHDx)
Con esta base de datos, el Institute for Health Metrics and Evaluation (IHME), a través del portal GHDx, pone a disposición del público, para su posterior evaluación, mediciones sobre diferentes tipologías de problemas de salud.
Este portal permite tratar y difundir datos recabados de encuestas, censos, estadísticas o cualquier otro que sea aportado por sus usuarios sin ánimo de lucro, haciendo uso de una licencia Open Data Commons.
GDC Data Portal
Publicado por el National Cancer Institute, esta base de datos permite al usuario ver y analizar más de 600.000 archivos relacionados con el cáncer. Esta información se puede descargar en formato .JSON y .TSV o ser visualizada a través de varias herramientas o su API, con más de 85.000 casos disponibles que tratan temas sobre genes y mutaciones.
HealthData.gov
La base de datos promovida por el Gobierno de EE.UU. se suministra a través de las agencias del Departamento de Salud y Servicios Sociales de los Estados Unidos, además de centros y agencias especializadas.
Estos datos presentan una gran variedad de temas que van desde la atención médica, a la salud ambiental; pasando por dispositivos médicos, servicios sociales, consumo excesivo de sustancias y salud mental. Puedes visionar este contenido a través de su descarga en .CSV, .RDF o a través de consultas SoQL
NHS Digital
Como otra de las reconocidas bases de información del sector salud y bienestar, la UK National Health Services aporta a esta lista datos que incluyen tanto información del Reino Unido como alguna información reseñable a nivel mundial.
Tras registrarse, en sus cuadros de mando interactivos se encuentra información específica con base en Inglaterra sobre medicina general y salud mental. Se pueden encontrar otras temáticas generales sobre gastos, tiempos de espera, enfermedades y hábitos de vida, entre los que se incluye alcoholismo, drogas u obesidad.
Junta de Andalucía
Puedes consultar la base de datos abiertos publicada por la Junta de Andalucía para varios sectores y, entre ellos, el sector sanitario. Con esta iniciativa se propone un modelo más participativo con el objetivo de optimizar las soluciones dadas a las necesidades ciudadanas en materia de salud.
En ella, podrás datos trimestrales sobre COVID-19, mortalidad y sus causas, campañas de donación de sangre, entre otras cuestiones, que están disponibles para su descarga en formato .ODS, .CSV y .XLS.
OpenNeuro
Se trata de una plataforma con más de 600 datasets por la que cualquier investigador puede importar sus datos obtenidos. La temática principal versa sobre datos de resonancias magnéticas, magnetoencefalografía (MEG) y electroencefalogramas, entre otras.
Esta información de acceso público aparece en formato Brain Imaging Data Structure (BIDS) bajo una licencia Creative Commons CC0 con el objetivo de potenciar los fines investigadores para la mejora de los diagnósticos futuros. Cabe añadir que han sido integrados los datos de OpenfMRI en los datos de OpenNeuro.
Organización Mundial de la Salud
La OMS pretende mejorar el uso y tratamiento de datos sanitarios por parte de los Estados. Para ello, ofrece herramientas de recolección y análisis de datos como SCORE, un paquete de herramientas, recursos, metodologías e intervenciones armonizadas que incluye datos tanto de la población como institucionales disponibles para la población.
Entre sus datos más solicitados podemos encontrar la base de datos sobre coronavirus y tuberculosis. A lo anterior se suman temas como la seguridad alimentaria, mortalidad en el mundo y la propia labor de la OMS.
Physionet
Y, por último, el banco de datos ofrecido por Physionet ofrece tanto datos libres como restringidos que pueden ser descargados en .CSV. Esta información incluye más de 36.000 grabaciones de señales fisiológicas y series temporales anotadas y digitalizadas; así como una colección de programas informáticos de código abierto que permiten su visualización, análisis y modelización de señales fisiológicas y las series temporales.
Todas estas fuentes de datos sobre el sector salud facilitan la labor investigadora y la potenciación de soluciones tecnológicas nacidas a partir de su análisis. En síntesis, el espacio europeo de datos abiertos promovido Comisión Europea pretende servir como punto de inflexión para mejores soluciones sanitarias en el futuro surgidas por pr