¿Qué es la Visualización de Datos? Del Dato a la Visualización
Tanto si estás habituado como si no a trabajar con datos en el día a día, puede que te hayas encontrado con dificultades para comprender su significado. Creo que todos hemos sufrido las hojas de datos interminables en las que se hace imposible saber si un número es algo bueno, algo malo o simplemente tiene un valor que nos lleve a tomar una acción concreta.
¿Qué es la Visualización de Datos?
Según la definición que hace la **Wikipedia de la Visualización de Datos ** es “el proceso de búsqueda, interpretación, contraste y comparación de datos que permite un conocimiento en profundidad y detalle de los mismos de tal forma que se transformen en información comprensible para el usuario".
Si utilizamos un lenguaje cotidiano, podemos decir que la Visualización de Datos consiste en la comunicación de los datos de manera visual para que sean comprensibles, fácilmente interpretados y puedan realizarse análisis visualmente, para descubrir patrones como:
- Tendencias: crecimiento, decrecimiento o constancia
- Rankings: agrupaciones ordenadas que indiquen mayor o menor importancia
- Comparativas: entre dos periodos o cualquier otra dimensión de análisis
- Dispersión: capacidad para detectar comportamientos anómalos
Los datos a analizar
El primer paso para construir una Visualización de Datos con cualquier herramienta son precisamente, los datos. En la actualidad existen literalmente cientos de tipos diferentes de fuentes de datos, que se utilizan con mayor o menor asiduidad dependiendo del tipo de empresa y qué datos quieras analizar.
Estos son algunos de los tipos de fuentes de datos que una empresa puede usar:
- Bases de Datos, conteniendo información de diverso tipo según se trate de un ERP (Enterprise Resource System), un CRM (Customer Relationship Management) o cualquier otro tipo de aplicación (soporte, gestión documental, gestión de pagos, etc.). Suelen ser las fuentes de datos principales que usan las empresas y en las que cuentan con información actualizada cada día.
- Ficheros de diversos formatos: CSV, Excel, JSON, XML, etc. Este tipo de fuentes de datos son muy habituales, pues resulta sencillo exportar nuestros datos en cualquiera de estos formatos desde cualquier herramienta.
- Aplicaciones Cloud. Hay cientos de aplicaciones cloud que permiten el acceso a los datos gestionados de diversas formas. Ejemplos: una aplicación de facturación en la nube, o una red social que utilices en tu empresa.
- APIs. El mundo actual está (y estará aún más) hiperconectado. Cada vez más servicios, aplicaciones y transacciones permiten acceder a los datos mediante APIs de diverso tipo. Las más habituales son APIs REST, pero últimamente grandes servicios (y también Biuwer) han apostado por APIs GraphQL.
Preparando los datos
Acceder e interconectar con la fuente de datos depende de cada caso, pero es un requisito indispensable. Dependiendo del enfoque de gestión de datos que utilices en tu organización, puedes tener un sistema automatizado que integre todos los datos de interés para ser analizados en un Almacén de Datos (en inglés Data Warehouse - DWH) analítico.
Desde nuestra experiencia y siempre que es posible, recomendamos realizar un tratamiento y preparación de datos para ser almacenados en el Data Warehouse corporativo, por muchas razones, entre las que destacamos:
- La empresa es propietaria de sus datos y dispone de un repositorio de datos histórico específicamente diseñado para el análisis de datos.
- No se accede en tiempo real a las fuentes de datos transaccionales (ERPs, CRMs, APIs, etc.), por lo que no se afecta al funcionamiento de los mismos.
- Permite seleccionar de todos los datos disponibles, sólo aquellos que vayan a ser tratados y analizados.
- Puedes crear tantos KPIs (Key Performance Indicators - Indicadores Clave de Rendimiento), con las fórmulas y niveles de detalle que quieras, de forma previa.
- Permite tener un rendimiento de consultas de datos muy rápido, por lo que la experiencia de usuario en el análisis interactivo de datos es mucho mejor.
Si tu organización no dispone de un Data Warehouse, la herramienta de análisis de datos que utilices tiene conectores de datos que permiten acceder directamente a los datos en crudo. Puede que tarden más tus consultas de datos o que haya alguna limitación en los cálculos que quieras hacer, pero podrás crear tus Visualizaciones de Datos.
¿Qué hay que tener en cuenta para crear una Visualización de Datos efectiva?
Una Visualización de Datos es efectiva cuando cumple su propósito, es decir, permite a los usuarios interpretar de forma sencilla la información mostrada, haciendo más preguntas sobre la información mostrada que sobre cómo se muestra (por ejemplo, los colores elegidos).
En el camino que lleva desde los datos en crudo hasta verlos en una visualización hay que tener en cuenta:
- Nuestros ojos están preparados de forma natural para distinguir entre colores y patrones. Podemos diferenciar rápidamente el color rojo del azul, la forma cuadrada de la circular. Nuestra cultura es visual, incluyendo la imagen de marca con colores que la identifican, o la utilización de semáforos para discernir lo positivo de lo negativo.
- Debemos conocer los tipos de datos con que contamos, para elegir adecuadamente una forma de visualización u otra. Por ejemplo, las coordenadas que ubican una posición son valores numéricos, pero la visualización adecuada es un mapa, no un gráfico de barras.
- Debemos saber si contamos con una o múltiples variables a representar, porque dependiendo de esto hay distintos tipos de gráficos adecuados.
- Para que una visualización de datos sea efectiva debemos plantearnos qué preguntas pretendemos responder, para elegir adecuadamente las dimensiones de análisis y las métricas numéricas a utilizar.
Tipos de Visualización de Datos
Como en todos los ámbitos con cierta complejidad, existen multitud de tipos de gráficos y visualizaciones que se pueden construir.
A continuación te dejamos una lista de sitios muy interesantes que incluyen guías para elegir el tipo de visualización a utilizar desde varios puntos de vista:
- The Data Viz Project
- From data to Viz
- Catálogo de Visualizaciones de Datos
- Guía de Visualización de Datos de Material.io
Como puedes ver hay muchos tipos. Muchos se centran principalmente en gráficos, pero no debemos olvidar otros tipos de visualización. Destacamos los siguientes diez:
- Indicadores y KPIs. Sirven para destacar valores numéricos totalizados, con múltiples variantes (colores, iconos, comparaciones, etc.).
- Tablas. Principalmente tablas verticales y tablas cruzadas para un análisis más detallado y con grandes cantidades de datos.
- Gráficos de Barras. Tienen algunas variantes, barras simples, barras apiladas, barras agrupadas, en vertical, en horizontal, etc.
- Gráficos de Líneas. También hay algunas variantes, líneas simples, líneas en escalera, etc.
- Gráficos de Donut y Tarta. Sirven para destacar visualmente pocos valores, principalmente categorías. Deben usarse con precaución pues tienden a no ser útiles si el número de valores mostrados es muy grande o muy pequeño.
- Mapas de Árbol. Son muy útiles para dar sentido comparativo a las cantidades y para destacar a modo de ranking los valores de categoría de mayor a menor.
- Gráficos de Bala (Bullet charts). Permiten mostrar muy visualmente el grado de alcance de valores objetivo, a modo de termómetro. Habitualmente se pueden configurar con valores actuales, valores objetivo y un conjunto de colores semafóricos.
- Gráficos de Dispersión (Scatter plots). Permiten confrontar dos variables y visualizar correlaciones de forma sencilla. Se pueden completar con más variables para conseguir burbujas de distintos tamaños, colores y formas, consiguiendo mostrar en una única visualización una gran cantidad de información.
- Mapas geográficos. Cualquier dato que haga referencia a una ubicación geográfica tiene sentido mostrado sobre un mapa. Existen multitud de variantes, desde mapas de puntos, de áreas, de calor, etc.
- Gráficos radiales. Tienen importancia, pues permiten mostrar con áreas, líneas y otras formas, la correlación entre múltiples dimensiones de análisis. Por ejemplo, el grado de fortaleza de un elemento observado desde varios ejes de análisis.
Usos de las Visualizaciones de Datos
Existen múltiples usos, seguramente tantos como necesidades. Cada tipo de visualización de datos se puede usar de diferentes maneras, algunas de las más comunes son:
- Cambios en el tiempo: es quizás el uso más básico y común, pero posiblemente uno de los más valiosos. Es muy común porque la mayoría de los datos tienen un elemento de tiempo involucrado. Por lo tanto, el primer paso en muchos análisis de datos es ver cómo evolucionan los datos a lo largo del tiempo.
- Determinación de frecuencia: también es un uso bastante habitual porque se aplica a los datos que implican tiempo, al visualizar con qué frecuencia ocurren los eventos relevantes.
- Determinación de relaciones o correlaciones: este uso es extremadamente valioso pues es difícil determinar la relación entre dos variables sin una visualización y es algo que aporta mucho valor. Utilizar un gráfico de dispersión (scatter plot) permite enfrentar dos dimensiones y visualizar claramente cómo están correlacionadas.
- Análisis de valor y riesgo: empresarialmente hablando es útil visualizar con códigos de color las fórmulas que indican la cantidad de valor o la cantidad de riesgo que tiene un cliente, un proveedor o un proyecto.
Construyendo un ejemplo real
En una tienda online quieren saber cómo está evolucionando el importe medio de los productos que venden. La razón de hacer esta pregunta es si apostar por ventas masivas de productos de poco importe o al contrario, vender pocos productos de mayor precio.
Partiendo de una base de datos en Azure SQL Database, seguimos los siguientes pasos en Biuwer:
- Configuramos la conexión.
- Modelamos las tablas involucradas.
- Creamos la consulta de datos en crudo.
- Creamos una gráfica mixta de líneas y barras con múltiples ejes para visualizar las ventas totales, el número de pedidos totales y el importe de venta por cada pedido.
El resultado del punto 3 es una tabla de datos detallada, pero de la que no podemos extraer ningún conocimiento.
Sin embargo, tras construir la visualización de datos se ve claramente que el importe de ventas por cada pedido va decreciendo y decreciendo en el tiempo, con dos escalones principales, que deben coincidir con dos eventos internos en la empresa en la que se decide cambiar la política de productos y ventas.
Como puedes ver con este artículo, la visualización de datos es una disciplina tan amplia y versátil que ya son miles de especialistas los que se necesitan en todas las empresas para dar sentido a la ingente cantidad de datos que se generan cada día.