Mostrando entradas con la etiqueta Gráficas. Mostrar todas las entradas
Mostrando entradas con la etiqueta Gráficas. Mostrar todas las entradas

domingo, 24 de enero de 2021

Otra mentira gráfica


Me encuentro por twitter con esta “gráfica”. Otra gráfica en medios de comunicación que presenta los datos de forma surrealista. Qué pereza ¿no? Un amigo que comparte estas inquietudes me dijo hace tiempo ya que lo había dejado, que solo se fijaba si había algún tipo de trampa especialmente curiosa. Esta es una brutalidad, sin más. Se pone cualquier barra para cualquier dato, aunque justo al lado del 200 en la escala aparezca un 455, o dos datos de 404 representados con barras diferentes. Quizá el último dato, el 400, está escrito más grande porque es el único que parece concordar con la escala.
A pesar de lo burdo, evidente y sangrante de la falsedad en la representación creo que sí merece un comentario. Aunque ese viejo adagio dice que no hay que atribuir a la maldad lo que se puede explicar por mera estupidez, me temo que esta “gráfica” sí es un ejemplo de maldad. Tomar cualquier trozo de la realidad y retorcerlo para sustentar un titular escrito con anterioridad es algo muy malo, le llamemos “fake news”, “hechos alternativos” o simplemente mal periodismo.

Sin duda hay un hecho en este final de enero que es incuestionable, la pandemia va para arriba en España, de forma muy acelerada, y se nota en casos, ocupación de hospitales y, tristemente, en número de personas muertas. Probablemente ese es el titular que tenían en la cabeza las personas de la Sexta que perpetraron la “gráfica”. Pero si quieres ilustrar esa idea has de buscar datos adecuados. Por ejemplo encuentro en el Diario.es esta representación (el rectángulo negó lo he puesto yo):

Pero lo que se representa no es el dato diario de muertes reportadas ese día, sino que a cada día se le asigna el promedio de los últimos siete. Eso hace que las fluctuaciones estadísticas insignificantes se suavicen, dejando más clara la tendencia. Además no se da el número absoluto de personas fallecidas, sino en proporción con la población (lo que permite comparar entre territorios con poblaciones muy diferentes). Quizá para personas muy anuméricas estos tratamientos de los datos se puedan ver “cocina”, algo que desvirtúa la información inicial al gusto del cocinero. Nada más lejos de la realidad, se trata precisamente de que se muestre la tendencia, que es la que realmente lleva al enunciado significativo que nos preocupa: “la pandemia va para arriba de forma clara”

Seguimos suponiendo: queremos ilustrar nuestro titular y los únicos datos que tenemos a mano (o que nos parecen importantes) son los de los últimos 5 días (del 18 al 22 de enero). Una representación directa de esos 5 números sería la siguiente (usando Excell, que aunque no me guste, no se trata ahora de estos refinamientos):


Vaya, no parece que esta gráfica muestre mucho crecimiento. Quizá si no empezamos en cero el eje vertical… Eso amplificará las diferencias que haya, eliminando el efecto común a todos los datos (hay que avisar siempre de que se hace). Pues queda algo como:


Pues tampoco aparece el crecimiento que necesitamos para ilustrar el titular. Claro, no aparece porque no está. En 5 días las principales variaciones que observamos son fluctuaciones estadísticas (lo que en la gráfica de El Diario.es se eliminaba representando promedios a 7 días). La cosa debería haber terminado aquí: yo tenía un titular y unos datos y he comprobado que los datos no ilustran el titular (no lo soportan, incluso lo desmienten). Si sigues confiando en tu titular habrías de buscar más datos, y si quieres comentar esos datos no hay más remedio que cambiar el titular. Y no ha más opciones honestas. Solo queda, por tanto, la deshonestidad, la deshonestidad rampante de inventar unos datos (los representados con barritas rojas) que sí transmiten la impresión que quieres y hacer creer que esos datos inventados son los reales poniendo el número encima de la barrita roja.

El problema de la “gráfica” no es la impericia en el manejo de números, es la creación de datos falsos. Así de crudo.

Seguro que hay razones para justificar ese proceder. Seguro que había poco personal y poco tiempo para generar la información, males endémicos del periodismo… pero da igual, para acabar mintiendo mejor no hacer nada. Debería ser una cuestión de deontología profesional. Por cierto, que este medio, la Sexta, es reincidente en este asunto, como comentaba con detalle Vary Ingweion hace unos días.

Aparte de la indignación por la cruda mentira, hay dos cosas más que me llaman la atención (y me entristecen enormemente): 

(1) las mentiras gráficas las aceptamos socialmente mejor que las léxicas y 

(2) El inmenso anumerismo (i.e. analfabetismo numérico básico) subyacente que pone de manifiesto este ejemplo.

Me estaré haciendo viejo, porque en vez de ver la gráfica y reírme pensando “qué cabrones” me enfado y acabo haciendo un llamamiento a la cultura científica y la deontología profesional.

lunes, 24 de junio de 2019

Gráficos de la infamia

En la historia de las manipulaciones con gráficos tenemos estos días uno espectacular, se estudiará en los libros de visualización... o en los de propaganda (o en ambos).

El domingo 23 ciudadanos lanza un hilo en tuiter en el que intenta mantener una teoría que no se sostiene con los datos. Para ello ponen muchos datos encima de la mesa, eso sí, mal representados y escondiendo lo fundamental. Cuentan también el caso en El Diaro.es.

En el momento de escribir esto ya han retocado todo y eliminado de su web los gráficos erróneos. Afortunadamente han quedado copias en muchos sitios. Especial antención merece el hilo de @Pedrodanielpg que se ha currado uno por uno los gráficos originales junto con la representación correcta correpondiente a los datos. Un ejemplo es la figura de la izquierda.

Ignoro qué podían pretender, dado que si "lo gris" fuera mayr que los colorines (la "infamia") no habrían conseguido la alcaldía... o es que la infamia está en que una minoría consiga vencer. Pero no se puede hacer tan mal en tantos casos si no es a propósito (sea con el propósito que sea). Peor resulta el hecho de esconder en un gris uniforme todo lo que no es el pacto vencedor. ¿Quienes hay ahí? ¿Siempre son los buenos esos?

A mi me ha llamado la atención el caso por los gráficos, pero en realidad eso es lo de menos, el análisis es trivial: los gráficos de tarta (o de semitarta) son una mala representación, especialmente para más de dos o tres categorías (como el caso de arriba), pero al menos hay que hacerlos bien, de forma que la correspondencia entre el área del sector y el dato numérico sea lineal. Más importante que eso es que los gráficos son representaciones visuales de datos para facilitar la percepción de relaciones entre los mismos. Pero si las relaciones que queremos mostrar no están realmente en los datos estamos mintiendo. Sin más. Mentir con palabras es tan habitual que ya apenas llama la atención, cada bando tolera bien las mentiras de los suyos y se revuelve un poco por las contrarias (poco, para poder seguir tragando las suyas). Por eso, a pesar del ridículo de la campaña no ha sido retirada, se han limitado a quitar los gráficos de la web y retocarlos en el hilo de tuiter. Manteniendo el titular y su falaz argumentación.

Infamia, según la RAE significa descrédito, deshonra, maldad o vileza en cualquier ámbito. Tras este análisis, lo que está claro es que infames son los gráficos y la campaña que pretende escandalizarse de los pactos ajenos cuando se está pactando con la extrema derecha. Porque ciudadanos está "no pactando" con la extrema derecha exactamente igual que Faemino está "no fumando" (recordáis el gag).

A mi esta negación de la evidencia en tu propia cara, lo que se ha dado en llamar posverdad y que, en efecto, va un poco más allá de la mentira, me da mucho miedo. Que la evidencia no sirva en la política (que es la gestión de lo público) es muy serio. Pero no vamos a acabar en tono dramático un suceso tan hilarante. Porque tuiter también ha generado una buena guasa con el tema. Para muestra estos ejemplos de @BOtRusO y de @HaigaTv





domingo, 7 de enero de 2018

La malignidad de las malas gráficas

Me encuentro con esta gráfica que tuiteó Cifuentes el día de reyes (ver), y se me empieza a hinchar la vena... ¿Es una manía mía o hay razones para enfadarse? Intento responder esta cuestión en lo que sigue, ya pasado el calentón inicial.


En primer lugar la gráfica está mal por motivos técnicos. El principal, discutido hasta la saciedad, es la trampa de no empezar el eje vertical en el cero. Ese truncamiento del eje da una impresión muy equivocada de los datos. Sólo está justificado hacerlo en situaciones muy concretas y siempre avisando muy claramente de que se está haciendo. Más abajo hay una gráfica con los mismos datos con el eje completo y se puede apreciar la diferencia. Además, pra saber cuanto de significativa es esa variación habría que saber el margen de error de los datos. Dado que estos se obtiene de una encuesta, un muestreo, algún márgen de error habrá, y si fuera el caso de que rondara el 5%, (lo que no es tan raro para encuestas), casi toda la diferencia estaría en el márgen de eeror. Pero eso no lo sé seguro y no lo voy a buscar ahora.

Podría uno pensar que la elección de los ejes ha sido desafortunada pero inocente (de hecho el omnipresente MS-Excell pone "por defecto" unos ejes muy parecidos si le pides representar esos datos).



Lo que seguro que no es inocente es no representar los datos que de verdad hay. Si representamos los datos reales, los que se dan con números ( 8,7 y 7,75) en la misma escala, vemos que la altura de las barras es distinta. Lo es en los dos casos en un 10% aproximadamente, solo que en sentidos distintos en cada caso, acentuando el "mensaje" que se pretende dar. Véase gráficamente en la siguiente figura:




Tras este pequeño análisis podemos concluir que la gráfica es muy mentirosa: se trucan los datos y se representan en un formato engañoso de forma que se acentúe la impresión que pretenden los autores mucho más allá de lo que los datos en sí mismos soportan.

Pero volviendo al principio, ¿tan terrible es que nos mientan con gráficas? Ya estamos acostumbrados a que los políticos nos cuenten mentiras y "verdades alternativas" en formato léxico. Tan acostumbrados que de alguna manera ya lo descontamos cuando les escuchamos (por supuesto con el correspondiente sesgo de confirmación que hace que veamos pequeñas las mentiras de "los nuestros" y agigantadas las de "los otros"). Pero si algo puede hacer que la gestión de lo público (la Política con mayúsculas) mejore es precisamente la incorporación de evidencia, de datos, comparativas, análisis cuantitativos. Así que torturar datos para que confiesen lo que quiere el político (aquí con minúscula) es especialmente terrible, es un torpedo en la línea de flotación del avance de la política basada en la evidencia. Es por eso que me resulta tan repulsiva esta práctica.

miércoles, 7 de junio de 2017

Lo bueno, lo malo y lo feo con gráficas

Me han invitado del Ateneo Navarro a dar una charla sobre el tema este de las gráficas, la idea era recoger gráficas "divertidas". Veremos que tal. Las imágenes preparadas para la ocasión estas:



Graficas ateneov4 from Joaquín Sevilla


La charla fue retransmitida en streaming y quedó grabado el vídeo, aquí. 

miércoles, 24 de mayo de 2017

Metáforas visuales (gráficas en 4 gráficos)

Las gráficas son artificios de representación de datos que utilizan metáforas visuales para que esos unos valores numéricos resulten directamente perceptibles por la vista, enfatizando además algunas de sus características. En algunos casos la simple presentación de los datos de una forma adecuada es ya la gráfica en si misma (algunos se han creado como chistes):

A partir de ahí, algunas representaciones muestran el objeto a representar un poco más estilizado, pero aún reconocible:


Estos perfiles de etapa ciclista muestra la carretera como una cinta gris vista en perspectiva, pero eliminando las curvas, se pone todo el trazado en una línea recta que se convierte en el eje x de una gráfica. Aunque si de verdad es una gráfica la representación artística tridimensional (en perspectiva) es una muy mala solución (dificulta la medida de los valores y transmite impresiones que no se corresponden con los datos). Seguramente esta "infografía" es algo a medio camino entre una representación artística de la carretera de verdad y una gráfica propiamente dicha. Como gráfica no es buena (por lo de la perspectiva), pero ayuda a entender las metáforas que están tras las representaciones gráficas de datos.

Luego ya, en función del mensaje que se quiere transmitir con la representación de los datos (y que debe de existir en los datos, claro, si no estas mintiendo con ellos) se puede elegir entre un buen montón de gráficas, metáforas visuales que en algunos casos ya nos son tan obvias como las que veíamos al comienzo.

La elección de la gráfica adecuada es muy importante. Si se ponen los datos disponibles en una representación cualquiera lo que se transmite no tiene por qué se lo que los datos realmente significan. En un ejemplo reciente se mostraban los datos de terremotos en Pamplona como si la tierra estuviera temblando desde 1902, una mala elección de la representación de esos datos. Metáfora incorrecta.



jueves, 15 de enero de 2015

"Perceptualización" de datos

Hay actividades que generan montones de datos, grandes cantidades de números que se suelen ordenar en tablas, hojas de cálculo, bases de datos. Pero en esas acumulaciones de números es muy difícil entresacar información, cosas que tengan sentido para las personas; tendiendo a imposible a medida que aumenta la cantidad de datos.

 Desde el siglo XVIII disponemos de representaciones gráficas de datos, transformaciones de los números en características de un dibujo que se perciben a través de la vista. Estas visualizaciones facilitan una percepción globalizada de muchos datos y la identificación de características informativamente valiosas: tendencias, discontinuidades, singularidades, valores medios...

En el siglo XX se creó la sonificación, una analogía con la visualización en la que la información se hace perceptible a través del oído. Esto resultaba especialmente importante para los ciegos, claro, y también para las personas que necesitan más información de la que pueden atender con la vista, como el caso de cirujanos en mitad de una operación. El sonido de los pajaritos coincidente con el semáforo rojo sería un ejemplo del primer caso, y paradigma del segundo el clásico pitido del electrocardiograma que hemos visto tantas veces en películas y series de televisión. Aparte de estos ejemplos más evidentes, hay proyectos de investigación intentando encontrar buenas metáforas auditivas que permitan explotar el canal perceptivo del oído al máximo. Porque no se puede obviar que la cantidad de datos que se pueden transmitir a través del oído, y las características que se pueden extraer de ellos son más escasas que en el caso de la visualización.

Hoy he descubierto (vía) una tercera forma de extracción automática de información humanamente relevante a partir de un gran volumen de datos; se trata de la creación de un informe, una narrativa. Es una especie de cuentacuentos que inventa el cuento basándose en los datos que hay. Se trata de la empresa Narrative Science, y parece que lo que hace es disponer de una serie de plantillas sobre tipos de información que pueden resultar útiles, y métricas con las que medir valores de esas informaciones. Con eso y un sistema de redacción se prepara un informe automático. Para muestra, el perfil que generan a partir de los datos de una cuenta de Twitter, que he probado con la mía y me ha dejado gratamente sorprendido (ver). Ahora solo falta que preparen plantillas para artículos científicos y que te escriban el artículo directamente a partir de los datos experimentales... que lo decía de broma, pero seguro que en alguna disciplina no estamos tan lejos.

Diferentes estrategias para facilitar la percepción de la información que está en los datos. Algo muy importante y que cada vez se hace mejor, más automáticamente y de formas más originales.

domingo, 6 de octubre de 2013

Mentiras gráficas, probablemente intencionadas

Hoy se ha hecho pública una encuesta de intención de voto que presenta unos datos en cierto modo sorprendentes, pero no es el análisis político el que me interesa, sino las impresionantes mentiras gráficas con las que nos han presentado los datos de la encuesta diferentes medios. A la izquierda una foto de la televisión, de Cuatro (Gracias a @Claragrima), a la derecha una captura de El País. Así a primera vista parecen unas gráficas inocentes. En ambos casos el eje x incorpora la misma trampa: el primer dato de la izquierda dista 22 meses del segundo, mientras que los otros tres distan un mes cada uno. Así, las pendientes más bruscas, las del primer tramo por la izquierda resultan incomparables con las demás. Pero bueno, esa es una trampa visual, dentro de lo que cabe menor.

Lo terrible viene cuando empiezas a mira las cosas con un poco más de detalle. Comencemos con la de Cuatro:
Podemos ver como un dato rotulado como 34,1 está a una altura mayor que uno que representa 34,7 (los he indicado con la etiqueta A en el gráfico de la izquierda). También podemos ver (etiqueta B) que 7,7 y 9,0 están representados a la misma altura. También que entre 11,6 y 11,5 (etiqueta C) hay la misma diferencia que entre 6,9 y 11,4...

En resumen, los puntos no están representados realmente, sino que están puestos prácticamente al azar, no respetando en absoluto las proporciones entre los números que representan. Estos tres ejemplos saltan a la vista sin necesidad de escuadra y cartabón, utilizando como guía visual las líneas de la retícula que proporciona el gráfico; pero no sería raro que afinando el análisis no encontráramos un solo punto en su sitio.

A continuación se presenta la otra gráfica, la de El País, con unas líneas añadidas (rotuladas como A y B).
Y es que lo primero que ocurre es que, al no disponer de una retícula, no podemos compara las alturas de una forma precisa. En la línea A vemos que 27,5 y 29,0 están prácticamente a la misma altura. Más exagerada es la enloquecida representación en la línea B, en la que vemos que 9,1 está por debajo de 9,0, a la misma altura que 7,7 por otra parte.

De nuevo, semejantes errores hacen dudar si alguno de los puntos está realmente en su sitio.

¿Cómo es posible que dos medios distintos representen tan mal los datos? Cualquier programa informático de presentación de datos no comete esos errores, ¿los habrán hecho con programas de dibujo? ¿Cómo es posible que profesionales de medios de comunicación de prestigio (del máximo prestigio que puedan tener, aunque sea poco) utilicen herramientas inadecuadas en su trabajo?

"No atribuyas a la mala fe lo que se puede explicar por pura estupidez" es una frase atribuida a Napoleón (y a muchas otras personas, de hecho no tengo claro su auténtico origen). En este caso, por alto que pueda estar el nivel de estupidez, es muy difícil pensar que no hay mala fe. Que tristeza.

ACTUALIZACIÓN (7 Oct 2013, 9:30): Me avisan de que en El País ahora está corregido y que la gráfica parece correcta VER.

martes, 24 de septiembre de 2013

Quitar para mejorar (pero no más)


Es magnífica esta imagen animada (gif animado que dicen los que saben lo que es un gif). A la vez que va dando indicaciones sobre como mejorar un gráfico, las va ejemplificando con un gráfico. Una forma visual, impactante y resumida de transmitir mucha información.

Procede de esta entrada en el blog de una empresa (Dark Horse Analytics) que se dedica, entre otras cosas, a la visualización de datos. Allí hay una versión en la que pasas las imágenes de una en una para apreciar mejor la evolución del gráfico.

Ya hace años, en 1983, Eduard Tufte, uno de los padres del análisis de la presentación visual de información cuantitativa, introducía el índice datos/tinta, como una medida de la cantidad de tinta utilizada en una representación un conjunto de datos. Una forma cuantitativa de comparar la calidad de representaciones de los mismos datos. Introdujo también otros índices, es un autor muy recomendable (además sus libros son muy bonitos, como no podría ser de otra forma).


A pesar de las alabanzas, me voy a permitir disentir un poco. Creo que el último paso es excesivo. Hay que quitar lo innecesario, pero no más, y para mi los ejes son necesarios. Las alturas de las barras, que es la información visual en la que se codifican los datos, alcanzan pleno sentido respecto de una referencia dada la escala. Si solo disponemos de la intercomparación entre ellas, que es lo que ocurre al eliminar el eje, empezamos a perder información en el "golpe de vista". Además la hacemos mucho más difícil de recuperar si queremos profundizar en el análisis. Así pues, con el criterio de maximizar la potencia comunicativa del gráfico, yo me quedaría con la versión de la figura adjunta.


Yo siempre pienso en la presentación visual de información cuantitativa en términos de "gráficas", y de maximizar su potencial comunicativo. Hay otras tendencias que las contemplan más como "visualizaciones" y añaden criterios centrados en la estética y el diseño que, en ocasiones, pueden interferir con el de maximizar la "comunicatividad" (valga el palabro). Supongo que la situación de uso del gráfico es la que debe dilucidar. Si se trata de un artículo científico no me apeo de mi criterio; ahora, si se trata de un periódico o una revista, dónde captar al lector es más importante que maximizar la información que se le comunica podría admitir visualizaciones menos óptimas.

Me llegó la info a través de @ptarra

lunes, 16 de septiembre de 2013

Gráficas malas y peores

La gráfica de la evolución de la inversión en I+D+i, la de arriba en la figura, nos ha dado ya para dos comentarios: sobre la inercia en investigación y sobre el nacimiento y declive del sistema español de I+D. Para terminar la serie, merece la pena comentar también sus aspectos formales. 

La verdad es que no es una gráfica muy buena. Por algún motivo que desconozco parece que dibujar de forma expresa el eje vertical se ha pasado de moda. Disfuncional moda si en efecto es así. Como sí se dan los valores de cada punto, se puede reconstruir el eje mentalmente, más o menos. No es fácil saber si el eje comienza en cero, aunque lo más probable es que si.

No hace mucho la televisión pública publicaba una gráfica que generó una intensa reacción (ver por ejemplo en The Functional Art), y no sin razón. Aquí no solo está desaparecida la escala vertical, la horizontal también. Como en el caso anterior hay datos como para reconstruirla mentalmente, pero entonces es cuando más "sorprendente" resulta, por decirlo de un modo suave. Tanto el eje x como el y son tramposos. Aquí parece obvio que la elusión no es una cuestión de moda, aunque se beneficie de ella), sino de falta de honestidad intelectual. La magnitud representada, el paro, tiene un componente estacional, con lo que lo lógico es presentar un año entero, de forma que se pueda apreciar dicha estacionalidad. Pues eso no ocurre: error en eje eje de tiempos, el x. Por otra parte, a partir de los dos números que se ofrecen podemos estimar por dónde andará el origen de coordenadas... algo por debajo del suelo si la imagen está proyectada en una televisión típica. Error en el eje de ordenadas. Estos errores no son inocentes: esta gráfica errónea da una impresión visual de bajada significativa, impresión que no se corresponde con la realidad de los datos. Si se toma un año entero (ver aquí) no solo no hay bajada, sino que hay subida, esos 4,69 millones de parados de agosto eran 4,58 un año antes. Por otro lado, en el otro eje, cuando se representa la bajada desde cero resulta imperceptible (ver por ejemplo aquí, o más exagerado aún). Los datos, por tanto, ni presentan una bajada en un periodo comparable, ni la bajada estacional es significativa. Luego la gráfica transmite un mensaje totalmente contrario al de los datos que se supone que representan. Es una tergiversación, una mentira. Y las mentiras en lenguaje gráfico son tan lamentables o más como en el léxico.

Las reglas son muy sencillas: colocar el eje vertical explícitamente e indicar claramente dónde se encuentra el cero de la variable. Con eso se evitan dificultades de interpretación y, más aún, interpretaciones torticeras.

Por cierto, una gráfica impecable para mi gusto con datos equivalentes al gasto en I+D es la primera del post antes citado (ver). Es verdad que da cierta pinta de antigua (y lo es, de hace 17 años concretamente), pero su calidad informativa es innegable, y en mi opinión ese es el valor supremo en las gráficas, y lo sigue siendo aunque les cambiamos de nombre y les llamamos infografías.

martes, 27 de noviembre de 2012

¿Gráficas como depósitos de agua?

Hace unos días veía esta gráfica en un congreso. De hacho es una fotografía de la proyección, por eso es tan mala la calidad, pero no me resisto a comentarla. Para centrarse en la visualización y no en el contenido, no citaré de dónde procede ni a qué correspondían realmente las categorías A y B.

Vemos una visualización de datos numéricos, una gráfica, en la que se dan dos datos y, aparentemente se pretende ponderar su auténtico valor con la visualización. Los números, que son porcentajes, están expresamente incluidos (¡bien!) y son 50,4% y 51,5%

La metáfora gráfica escogida es la de un depósito de agua. Un depósito con forma de elipsoide de revolución  que está mediolleno. Es de suponer que el nivel de llenado es la variable que se correlaciona con el número a representar, pero ¿cómo se hace esa correlación? Pues no lo sabemos, y además hay varias formas de hacerlo. Podríamos hacer que la altura de líquido fuera proporcional a la magnitud, o que el volumen de líquido fuera lo que es proporcional a la magnitud. Ambas cosas serían equivalentes en un depósito cilíndrico (visto de lado, preferentemente), pero no en uno esférico o elipsoidal. Para terminar de estropearlo, los estudios psicológicos demuestran que la magnitud cuya percepción más se parece a la cantidad real es el área. Vamos, que la metáfora del tanque lleno de líquido sería adecuada con tanques de paredes rectas, y cuanto más lateral la perspectiva mejor... Lo que no es el caso en la figura que nos ocupa.

Una visualización de datos debe ser fidedigna con los datos, es decir, debe transmitir una percepción acorde con ellos y, además, permitir la recuperación de los datos originales con operaciones sencillas. Los depósitos esféroidales no cumplen, aunque sean más bonitos que las clásicas barras, no funcionan.

Por cierto, es probable que no me hubiera fijado en todo esto si, al menos, la representación hubiera sido correcta, pero ¿de verdad el tanque de la derecha representa un 51,5%? He imprimido la figura y he estado un rato con la regla y la calculadora para obtener los siguientes datos:
- La altura de llenado es el 72% de la altura total
- El área azul es el 78% de la correspondiente al tanque lleno
- El volumen ocupado es el 84 % del total

Las mismas cuentas con el tanque de la izquierda me dan para las tres magnitudes cerca del 54%, lo que podría ser correcto dados los errores de medida y de cálculo, pero el de la derecha, se mire como se mire, sobreestima considerablemente el valor nominal del 51,5% que se da.

Como me decían por tuiter, "la estética por encima de la información, cuánto daño ha hecho la (mala) infografía"

martes, 6 de marzo de 2012

Buenas noticias y malas gráficas

En el Diario de Navarra de hoy (aquí en digital, aquí en papel) leo que los programas universitarios dedicados a personas mayores están teniendo mucho éxito últimamente.

Puede que este repunte tenga como origen en el desastre económico en el que vivimos últimamente, como pone de manifiesto el titular, que lo achaca al paro y las prejubilaciones. Pero sea como fuere, esas personas que se encuentran con tiempo desocupado (que no siempre es lo mismo que "libre") deciden dedicarlo a una actividad maravillosa. En vez de deprimirse o darse al alcohol o las drogas, se dedican a cultivar su cerebro (el segundo órgano favorito del cuerpo de Woody Allen). En un tiempo en el que hay que justificar muy bien para qué se necesita aprender tal o cual contenido o el interés práctico de tal o cual investigación, resulta refrescante un entorno en el que se va a aprender porque sí, por placer, sin obsesiones utilitaristas.

La buena noticia se ilustra con unas gráficas que, la verdad, podían ser mucho mejores. Ninguna de las escalas comienza en 0 (ni se hace referencia a ese hecho con un "eje roto" o algún otro indicativo), ni siquiera la de la UNED, en la que era evidente. Esto impide apreciar las significativas diferencias en el punto de partida de unos y otros. Lo mismo se puede decir del crecimiento, un aumento de 3 personas en Tudela ocupa la misma longitud que uno de 58 en la UNED. Con los ejes así escogidos se pierden totalmente las referencias. Tampoco entiendo la razón de sombrear una de las gráficas. Pero lo que ya resulta excesivo es contar las personas por mitades en Tudela; lo de rotular un eje referido a número de personas con un decimal e incluyendo las mitades es un poco fuerte.

Formalismos aparte, los datos de Tudela son los únicos que no muestran la tendencia creciente del titular, pero sobre la mala decisión de poner un Campus en esa ciudad no tocaba hablar hoy.

martes, 7 de febrero de 2012

Datos y gráficas que son lo mismo

Me llega una nueva imágen en la que la gráfica es lo mismo que los datos. Me he acordado de las otras dos que ya había recogido con anterioridad (en esta entrada y en esta otra). Reuno las tres en este post casi sin palabras (que llevo mucho "rollo" ultimamente)


Hay una que como gráfica me gusta bastante menos que las otras dos, pero es la más divertida... Por cierto ¿sabías que el plumerillo del fez se llamaba tassel? yo no

domingo, 15 de enero de 2012

¿Qué bebemos? Los datos son la gráfica

Desde hace unos meses ponemos las chapas de las botellas que abrimos en un bote. A mi hijo se le ocurrió ordenarlas de la forma que aparece en la foto (bueno, la cinta métrica de la izquierda fue un añadido posterior). La ordenación de las chapas constituye en si misma una gráfica de barras.

Como toda gráfica (buena) tienen diversos niveles de lectura, se pueden extraer diversos predicados de la magnitud representada: lo que bebemos. Algunos serían: 
- La cerveza es la inmensa mayoría de lo que se bebe
- Lo que no es cerveza es CocaCola, de dos tipos distintos (comercial y la del CocaCola World, de dónde procede también la chapita en miniatura)
- La cerveza lager es muy mayoritaria frente a la pale ale
- De entre la lager, Heineken es la marca dominante con diferencia (más del doble de la siguiente).
- Las siguientes lagers son Estela, Becks y Spaten (en este orden).

Un montón de información que estaba escondida en un montón de chapas y que hace patente cuando las ordenas adecuadamente. 
Queda claro que la gráfica de barras es una metáfora visual muy evidente, surge de manera natural. Por tanto una representación equivalente de datos más abstractos (literalmente menos tangibles que las chapas) se va a entender con facilidad, sin necesidad de explicaciones o entrenamiento. Lo mismo ocurre con la gráfica de tarta, véase si no este ejemplo en el que también la grafica está constituida por los propios datos que se muestran.


miércoles, 11 de enero de 2012

Una gráfica mala de maldad

Para representar tres datos que suman el 100% ¿que tipo de gráfica utilizarías? Es de cajón: una tarta es la respuesta típica, a pesar de que las tartas tienen sus riesgos y hay quien los lleva al extremo de considerar que nunca deben usarse.

Pero se puede hacer aún peor: véase el ejemplo adjunto. No sólo se ve un objeto en perspectiva, sino que los grosores de las "piezas" varían, la pieza total no es un círculo y las divisiones están hechas mediante líneas aleatorias. No puede haber más fuentes de distorsión entre al área percibida y el porcentaje real.

La gráfica aparece originalmente en esta página, y la recogen en Flowing Data para criticarla (y yo sé de ello por aquí). Para lo que me interesa analizar, no es importante lo que representan los tres porcentajes ni la otra gráfica menor (de arriba a la izquierda).

La representación de la figura está a medio camino entre una gráfica de tarta, de burbujas y de barras, pero sin ser ninguna de ellas y liándolo todo. En fin, creo que no merece la pena entrar en más detalles. La búsqueda de originalidad y estética lo que consigue en este caso es alejarse del verdadero sentido de una gráfica. La conclusión es que la metáfora visual utilizada para convertir los números en un dibujo es extremadamente mala.

viernes, 16 de diciembre de 2011

Mentiras descaradas (y sutiles) en gráficas

Gracias al tuiter de John Allen Paulos llego a una entrada de Media Matters en la que se analizan las falsedades en la representación gráfica que hace una cadena de televisión (la Fox, claro) para afearle a Obama los datos de desempleo, que en realidad han mejorado últimamente. Curiosamente, se le puede dar una vuelta más al argumento. Veamos las figuras:
Esta es la figura que presentaba el telediario Fox News el pasado lunes 12 de enero para ilustrar la evolución de la tasa de desempleo en el último año, siendo Obama presidente. Una cosa muy buena que tiene el gráfico es que da los valores numéricos, lo que permite trazar unas líneas y ...
Y comprobar que 8,6 es mayor que 8,8. De hecho el 8,6 de noviembre se representa con la misma altura que el 9 de abril. No hay "error informático" imaginable que pueda llevar a esa representación. La falsedad de la representación es impresionante. Dado que además el gráfico apoya la tesis de la cadena de que el actual presidente lo hace todo mal, lleva a dudar del famoso aforismo: no atribuyas a la maldad lo que se pueda explicar por simple estupidez. En este caso va a ser trampa malvada.

Y para dejar clara la verdadera apariencia de los datos, en la entrada se incluye la siguiente gráfica:
Es muy llamativa la caída del último mes, pero es que desde junio la tendencia es a disminuir... pero si nos fijamos, este gráfico representa un trozo muy pequeño de los datos, sólo dónde hay variación. ¿Es esa de verdad una representación "sincera"? Para comprobarlo he representado los datos (no iba a ser solo cosa de copiar) de tal forma que aparezca el origen de la escala, el cero:
Sobre la larga sombra del 9% visto en toda su longitud, la "enrme variación" del gráfico anterior apenas se aprecia.

La primera mentira, la de la Fox, lo es sin paliativos, una manipulación de la información (información en formato gráfico pero información a fin de cuentas) verdaderamente escandalosa. En el segundo caso, la gráfica no enfatiza "toda la verdad" (como en el juramento de las películas: la verdad, toda la verdad y nada más que la verdad). Pero no esconde nada, el eje de los porcentajes está perfectamente rotulado y uno debe leerlo para interpretar fielmente el gráfico. Estamos dentro del límite de una representación visual respetuosa con los datos que transmite un mensaje. En mi opinión es una gráfica decente.

lunes, 4 de abril de 2011

Reparto de seguidores entre usuarios de Twitter

Me encuentro hoy con esta gráfica en la que se ve una aplicación más de la "ley universal del reparto", en este cas. Como ya veíamos hace unas entradas, a la hora de repartir, de distribuir, una magnitud es unversal que el reparto consista en que "muchos se llevan un poco y unos pocos se llevan mucho". Esta ley ha sido redescubierta en múltiples disciplinas, y en cada una lleva el nombre de su descubridor. El que probablemente ha alcanzado más relevancia es Pareto, que la estableción de una forma empírica, con un caracter bastante general y además de una forma particularmente fácil de entender (la regla del 80% frente al 20%). Que la forma de la curva tenía que ser esa era inevitable, siendo la aportación del trabajo los valores concretos. Si se intentaba con ello resolver la pregunta sobre ¿cuanta influencia tiene Twitter en la sociedad? la respuesta es clara: para pocos muchísima y para muchísimos muy poca.

Por cierto, la intensidad de los terremotos sigue también este tipo de distribución, de la que se deduce que los muy intensos son muy pocos, y los muy muy intensos, muy muy pocos... y así sucesivamente, sin posibilidad de acotar por arriba. Aunque cada vez más sea más improbable, no se puede descartar ninguno, por grande que sea.

martes, 14 de diciembre de 2010

Las gráficas llevan los ejes identificados!

Sin comentarios

La imagen es de aquí, del maravilloso blog xkcd.

domingo, 5 de septiembre de 2010

Visualización de datos

Los datos son como petroleo petróleo. Los datos son como el suelo, fértil y capaz de dar una inmensa producción. En inglés el enlace entre ambas metáforas es mucho más bonito: oil soil. La importancia de los datos para generar una imagen coherente de los problemas, la necesidad de poner esos datos en relación para que seamos capaces de comprenderlos con propiedad. La importancia de la percepción visual como mecanismo de acceso a grandes cantidades de datos contextualizados. Si estas cuestiones te interesan suficientemente, te recomiendo emplear 18 minutos en escuchar la charla TED de David McCandless.

Aunque el tema esté tratado en la charla de una forma general, desde una perspectiva periodística, al observarlo desde el punto de vista científico hay dos cuestiones inexcusables: (1) los datos son la materia prima de todo y (2) su visualización revela las relaciones entre ellos. A la vista de esto hacer ciencia se puede prácticamente resumir en obtener datos y representarlos (en una aproximación excesivamente minimalista, pero sugerente).

Sin más preámbulos, aquí dejo el vídeo:



Si te ha interesado no te puedes perder a Hans Rosling y su Gapminder

jueves, 8 de abril de 2010

Visualización: Pitágoras

Dos cuadrados del mismo tamaño. En el primero hay cuatro triángulos (rectángulos) iguales, y el espacio restante es un cuadrado cuyo lado es la hipotenusa del triángulo.

En el segundo cuadrado los mismos cuatro triángulos están colocados de otra forma, emparejados dos a dos. El espacio restante lo ocupan dos cuadrados, y cada uno tiene como lado uno de los catetos.

Como los dos cuadrados grandes son iguales, y en ambos hay cuatro triángulos iguales, el espacio restante (cuadrado menos cuatro triángulos) ha de ser igual en las dos figuras, luego el cuadrado rosa es igual a la suma de los cuadrados azules, que es el enunciado del teorema de Pitágoras, qed.

Una más de esas visualizaciones matemáticas espléndidas que recopilamos estos días, como lo del seno más el coseno cuadrado o el binomio al cuadrado. Ésta la he visto recientemente en el muy recomendable libro "Ciencia para Nicolás" de Carlos Chordá. (Y la figura es una elaboración propia algo más currada que la del binomio).

lunes, 29 de marzo de 2010

Visualización, binomio cuadrado

A propósito de la gráfica que mostraba tan visualmente la relación fundamental entre las funciones trigonométricas, quedé en ir buscando otras. La fórmula del cuadrado del binomio se visualiza de forma muy evidente y bonita.

Cuando ya había hecho mi chapuza y la estaba escaneando he probado a poner en google imágenes "binomio cuadrado" y, lógicamente, sale unas cuantas veces mejor dibujado, incluso construido en madera, o la generalización al cubo. A pesar de todo he preferido no cambiarla.





Necesito ideas para ir enterrando la entrada anterior (que se adentra en la fealdad de las relaciones laborales) en cosas bonitas e interesantes. De momento sólo se me ha ocurrido esto.