Entregables de Inteligencia (I) – Visualización
Autor: Marta Mallavibarrena
Resumen
Tras de todo el tiempo y esfuerzo empleados en una investigación, el último paso, el producto final, es determinante en el éxito o el fracaso del análisis de inteligencia. Por muy bueno que haya sido el trabajo realizado por los analistas, si la información no se transmite de forma correcta en el informe final, o cualquier otro tipo de entregable, no habrá servido de nada. Uno de los aspectos clave de esta tarea es la correcta visualización de información: qué datos se muestran y cómo se representan. El objetivo de este artículo es presentar algunas directrices generales en las que apoyarse para mejorar la visualización de datos en inteligencia.
Palabras clave: inteligencia, análisis de datos, visualización, informes.
Introducción
El profesor Hans Rosling, médico y director de la fundación Gapminder, decía que, de forma análoga al mundo musical, en estadística no sólo es necesario mostrar las notas, sino tocar la música. Para cumplir su función, la representación que hacemos de los datos que analizamos debe darles sentido, no únicamente exponerlos.
“Most of us need to listen to the music to understand how beautiful it is. But often that’s how we present statistics: we just show the notes, we don’t play the music.” – Hans Rosling. The Best Stats You Have Ever Seen – TED 2006
Las palabras de Rosling eran ciertas entonces y lo son más ahora. Con la cantidad de información a la que nos vemos expuestos constantemente, en el mundo del Big Data, necesitamos información clara, concisa y visual, que pueda comprenderse después de verla una única vez.
Tomando como ejemplo un artículo del Wall Street Journal (DeBold & Friedman, 2015) sobre enfermedades infecciosas en el siglo XX, no se necesitan conocimientos en inmunología para observar el impacto de la introducción de la vacuna contra el sarampión en Estados Unidos en 1963. Por supuesto, esta imagen llevaría acompañado un informe técnico que justifique la metodología y los resultados, pero de un solo vistazo es capaz de transmitir lo que 30 páginas de texto.
¿Qué gráficos incluyo?
En esta ocasión me permito citar de forma anónima a uno de mis profesores de análisis de datos de la carrera: “La estadística debe estar al servicio de los datos, y no al contrario”. Es decir, que son los propios datos los que deben indicarnos qué métodos usar y qué historia contar.
Es importante recordar que los gráficos de barras, líneas y sectores no son los únicos disponibles, sino que existe un catálogo inmenso de opciones. Plataformas como The Data Viz Catalogue o Data Viz Project pueden ser muy útiles para encontrar qué figuras se adaptan mejor a las necesidades de nuestros datos. Permiten hacer búsquedas y filtrar gráficos según su función, forma o incluso el formato de los datos de los que se alimenta.
¿Incluyo leyenda y etiquetas de datos?
Aplicando la expresión “menos es más” es posible que en ocasiones pensemos que introducir una leyenda o añadir etiquetas descriptivas a los datos puede no ser necesario, que sólo van a sobrecargar el documento. Si bien no existe una fórmula (ni mágica ni matemática) para decidir cuándo debemos incluir qué datos, sí hay una máxima que quizá pueda ayudarnos a tomar esta decisión, y es que cualquier figura incluida en un informe debe contener información suficiente para que pueda comprenderse fuera del mismo.
Si una tabla o una gráfica del entregable necesita de aclaraciones a lo largo del texto, si se la enseñásemos a alguien que desconociera del contexto y no pudiera entenderla, entonces significa que necesitamos incluir más información.
Los tres grandes bloques de datos que deberían incluirse siempre son el nombre y unidad de medida de los ejes (Tiempo en años, altura en cm, etc.) y una leyenda (significado de los diferentes colores, tamaño de las partes del gráfico, etc.)
Herramientas y recursos
El analista Severino Ribecca, desarrollador del anteriormente mencionado Data Viz Catalogue, recoge en su web una serie de herramientas, blogs, materiales de formación y otros recursos (algunos gratis, otros de pago) que pueden servir de apoyo para comenzar a conocer el mundo de la visualización de datos.
Ya que el propio Ribecca menciona algunos subreddits en dicha recopilación de recursos, yo querría compartir uno de mis favoritos, r/PeopleLiveInCities, que recoge aquellos casos en los que mapas creados para mostrar un concepto, terminan demostrando todos lo mismo: que la gente vive en las ciudades.
Igual de importante es mostrar los casos de éxito como aquellos en los que la visualización terminan mostrando una historia distinta a la que sus creadores pretendían contar.
Marta Mallavibarrena – Psicóloga y analista de inteligencia
Bibliografía
Andrienko, G., Andrienko, N., Drucker, S., Fekete, J. D., Fisher, D., Idreos, S., … & Sharaf, M. (2020, March). Big data visualization and analytics: Future research challenges and emerging applications. In BigVis 2020: Big Data Visual Exploration and Analytics.
Airinei, D., & Homocianu, D. (2010). Data visualization in business intelligence. 2010 Proceeding of WSEAS MCBEC2010-recent advances in mathematics and computers in business, economics, biology & chemistry.
DeBold, T., Friedman, D. (2015) Battling Infectious Diseases in the 20th Century: The Impact of Vaccines. Wall Street Journal
Few, S., & Edge, P. (2007). Data visualization: past, present, and future. IBM Cognos Innovation Center.
Friendly, M. (2008). A brief history of data visualization. In Handbook of data visualization (pp. 15-56). Springer, Berlin, Heidelberg.
Kelleher, C., & Wagener, T. (2011). Ten guidelines for effective data visualization in scientific publications. Environmental Modelling & Software, 26(6), 822-827.