OpenVis conf 2018

OPENVIS CONF es una conferencia de dos días centrada en la práctica de visualizar datos con herramientas de código abierto en la web. El programa de conferencias fusiona lo último en investigación, tecnología y práctica de visualización, construido mediante un proceso de open-call submission y revisión de comité. Partiendo desde Boston en 2013, OPENVIS CONF tuvo lugar en Europa por primera vez con un programa ampliado en Paris, Francia, presentado por el Instituto de I + D de datos de la escuela de negocios emlyon. 
La conferencia tuvo lugar los días 14 y 15 de mayo de 2018 en el hotel Novotel Paris Centre Eiffel Tower en París, Francia. Durante ésta se tocaron temas como el uso de la visualización como herramienta exploratoria en el análisis de datos, del cómo identificar, manipular, resumir y visualizar las características de datos de una forma eficiente, de lo último en lo que se refiere a análisis utilizando herramientas como D3 y R, técnicas de mapeo, el uso de machine learning en visualizaciones y cómo dar forma a los datos puede convertirse en un generador de empatía y emociones.

Keynotes

Encontré las dos Keynotes inspiradoras de diferentes maneras: sentí que la línea entre la visualización de datos y el arte se cruzó con un equilibrio entre ambos, lo cual es adecuado considerando París y su historia. 
El primer discurso de Moritz Stefaner fue una revelación para el uso de herramientas de Machine Learning para proyectos de visualización de datos. Siempre he pensado que el proceso de diseño para la visualización de datos implica un diseño cuidadoso de las imágenes (y formas, colores, etc.) en un lienzo en blanco, produciendo un resultado final después revisión y revisión. Usar un algoritmo como asistente para desplazar todas las imágenes en el lienzo es una técnica muy conveniente para simplificar parte del proceso de diseño con un resultado bastante exitoso. La segunda parte de la charla fue más "tradicional" donde se describió el proceso de un complejo proceso operacional de visualización de datos para la compañía ferroviaria alemana. El énfasis se puso en la idea de construir un dashboard interno para el estudio del uso del proyecto por parte del cliente para monitorear la "efectividad" de sus soluciones. 
La segunda keynote (por parte de Dataveyes) estuvo más orientada al estudio de los datos que nos rodean y la oportunidad de presentarla al público en general: ampliar el horizonte del mundo cuantificado del yo al "grupo cuantificado" como grupo social. En este caso, la segunda parte de la conferencia fue sobre el proceso de construcción de un proyecto de visualización de datos sobre el "white noise" o la contaminación acústica en las líneas públicas del metro en París. El resultado final fue realmente interesante con el transporte de los datos de sonido en una composición musical que transpone notas a la frecuencia del sonido.

 

Machine Learning

Machine Learning tuvo un papel importante en la conferencia. Se mencionó mucho el algoritmo t-SNE, que se puede usar para visualizar conjuntos de datos multidimensionales y complejos aprendidos y analizados por redes neuronales artificiales. Si bien escuché mucho sobre el aprendizaje automático como una forma de alejar al humano del circuito, fue muy interesante ver qué papel desempeña en las presentaciones aquí. 

Tanto en el Moritz Stefaner keynote ("Macarons and catacombs") como en la charla de Ian Johnson ("Aprendizaje automático para visualización de datos"), el algoritmo de agrupación ha jugado un papel importante como entrada al resultado final de la visualización: el algoritmo t-SNE llevó a patrones interesantes al elegir dónde colocar las imágenes en la visualización final. 

lol the macaron blend with death from @moritz_stefaner #openvisconf pic.twitter.com/gqvtl6dig1
— Lynn Cherny (@arnicas) May 14, 2018

La visualización de datos también puede hacer algunas cosas inesperadas, como hacer que los procesos de aprendizaje automático sean más fáciles de entender, como lo demostró brillantemente Shan Carter de Google en su presentación "Lessons from a Year Distilling Machine Learning Research", tomada de su proyecto distill.pub. Los algoritmos y la mecánica de redes neuronales pueden ser algo así como una caja negra, impenetrable para casi todos, pero Shan Carter mostró cómo las explicaciones visuales pueden ayudar a desmitificar estas poderosas herramientas para un público más amplio.

@shancarter draws a fantastic analogy between hidden layers and artistic movements. Cubism, surrealism, etc. were, in a sense, experimenting at a specific level of visual abstraction. #openvisconf pic.twitter.com/v3vZzy3Ki7
— Arvind Satyanarayan (@arvindsatya1) May 15, 2018

Shan Carter sostiene que la sabiduría convencional es que la Inteligencia Artificial cambiará la forma en que interactuamos con las computadoras. Desafortunadamente, muchos en la comunidad de AI subestiman en gran medida la profundidad del diseño de interfaz, a menudo considerándolo como un problema simple, sobre todo para hacer que las cosas sean bonitas o fáciles de usar. Desde este punto de vista, el diseño de la interfaz es un problema que se pasa a otros, mientras que el trabajo duro es capacitar a un sistema de machine learning 
Este punto de vista es incorrecto. El diseño de interfaz significa desarrollar las herramientas fundamentales con las que los seres humanos piensan y crean. Al crear mejores sistemas de AI se necesita generar tecnologías cognitivas más poderosas para poder internalizar mejor estas nuevas ideas y así aprender y pensar para crear mejores sistemas de AI.


A la vez, durante esta charla, se quiso enfatizar la inaccesibilidad de la academia, por lo que el Ecosistema de Distill es un intento de apoyar mejor el tipo de trabajo que utiliza herramientas de visualización de datos para apoyar y mejorar el entendimiento de temas complejos. En este momento, tiene tres partes:
  • The Distill Journal - Un lugar para dar validación tradicional a contribuciones no tradicionales. 
  • The Distill Prize - Un premio de $ 10,000 para reconocer las explicaciones sobresalientes de machine learning 
  • The Distill Infrastructure: herramientas para crear hermosos ensayos interactivos.

Ética y sesgo cognitivo

Esta pregunta surgió frecuentemente durante las charlas: aunque la visualización de datos a menudo puede parecer imparcial, no puede ser neutral. La forma en que algo está diseñado influye claramente en cómo se lee o se percibe. Para mantenerse alejado de las trampas éticas o cognitivas, el diseñador de datos debe pensar clara y exhaustivamente antes de configurar gráficos o dashboards. Heather Krause de Dataassist brindó una buena explicación de cómo "Proteger su trabajo de cuatro falacias ocultas cuando trabaja con datos". Ella describió cómo la forma en que las preguntas están redactadas, las variables utilizadas para presentar los datos y las suposiciones realizadas pueden dar nueva forma a la historia contada por los datos en gráficos. Todos deben ser conscientes de esto y tener en cuenta el conjunto emergente de mejores prácticas y principios en el mundo de los datos.


Para concluir

Muchas de las otras charlas y los otros temas tocados en ellas fueron muy interesantes, y varios son imposibles de resumir en este artículo por lo que OpenVis, manteniendo el espíritu del conocimiento libre, ha puestos los videos de las charlas acá.