Principios clave en la visualización de datos

Cinco mejores prácticas para visualizar datos en R, el popular lenguaje de programación en Estadística y Ciencia de Datos

Andalucía, 09/06/2022
Gráfico de barras

Cinco principios clave de visualización de datos explicados.

Una etapa fundamental en la explotación de los datos abiertos es la visualización, pues ayuda a familiarizarse con el dominio del problema, extraer y comunicar conocimiento básico de los datos y dirigir futuros análisis con técnicas más sofisticadas.

El proceso de visualización de datos puede resultar complicado, por lo que es necesario contar con ciertos principios básicos que hay que incorporar en la realización de las gráficas para que éstas sean objetivas, ilustrativas y comprensibles.

Las cinco mejores prácticas para visualizar datos en lenguaje de programación R, según el análisis publicado en mayo de 2022 por el CEO & Founder Deep Data Digital Dario Radečić, en R bloggers, bajo el título ‘Explicación de los 5 principios clave de visualización de datos: ejemplos en R’, son principios básicos de visualización de datos, independientemente del lenguaje de programación o entorno de trabajo que se utilice.

Estos son los cinco principios claves de visualización de datos que hay que conocer:

  1. No manipular los rangos en las escalas de los ejes. En el pasado, las empresas y particulares preferían exagerar diferencias insignificantes manipulando los rangos de los ejes, lo que podía llevar a equivocación por no mirar las marcas de los ejes.

     

    Gráficos de barras con eje Y  y eje X con formato manipulado
  2. Agregar siempre etiquetas de título y ejes. Un gráfico sin título y etiquetas de eje es prácticamente inútil. Si no tiene estos elementos, ¿cómo se puede saber lo que se está mirando? No hay forma de saberlo. Se podría describir el contenido en el párrafo anterior, pero eso es sólo un suplemento, en el mejor de los casos.
  3. Elegir paletas de colores apropiadas y atractivas. Para que los datos resulten atractivos, debemos usar una paleta de colores adecuada, un ejemplo de ello es Collors.co.
  4. No utilizar gráficos 3D: 2D es suficiente. La mayoría de los usuarios encuentran confusión en la tercera dimensión (3D) para la visualización de datos. Es fácil distorsionar los datos y cometer un error, pues es una cuestión de perspectiva. Dos dimensiones (2D) son suficientes en el 99,9% de los casos. Pero si se desea transmitir información adicional, se debe considerar cambiar el tamaño o el color de los elementos del gráfico para acomodar las variables adicionales. 
  5. Hacer que los gráficos sean interactivos. Probablemente, el principio y componente de visualización de datos clave más importante sea la interactividad. Aunque los gráficos estáticos son válidos, especialmente si se está iniciando en la visualización de datos, la interactividad lo diferencia de los demás.

Si se desea profundizar más en la aplicación de estos principios y en la visualización de datos con R, el popular lenguaje en Estadística y Ciencia de Datos, se pueden consultar las siguientes guías (en inglés):

Más información

Consultar la sección de Tutoriales del Portal de Datos Abiertos de la Junta de Andalucía.