Matemàticas para Periodistas deshonestos: Gráficos

Numbers

Inspirado por la reciente lectura de How To Lie With Statistics he recopilado una serie de trucos para manipular datos que he ido aprendiendo con el paso de los años gracias a los titulares de la prensa gratuita.

Las premisas son sencillas:

1.- Se trata de manipular datos que ya tenemos, no de pensar maneras de generarlos de manera que salgan a nuestro favor (que es algo mucho más fácil).

2.- No se puede mentir, simplemente diremos las cosas de una manera u otra para que parezca una cosa u otra según nos convenga.

3.- Vamos a ser lo más exagerados y amarillistas que podamos sin que cante demasiado.

Gráficas

  • Recorta que algo queda

Grafica Barras 1050 - 1075 - 110 El equivalente gráfico del ya famoso Numeros grandes = diferencias absolutas es recortar los gráficos de manera que se enfaticen las diferencias absolutas allí donde las relativas nos dejarían indiferentes.

En las gráficas de la derecha se pueden observar los mismos datos representados mediante el mismo tipo de gráfica: 1050, 1075 y 1100 sobre una gráfica de barras.

La única diferencia entre las dos gráficas es que en la primera se ha recortado la parte de abajo. Este recorte es útil para apreciar la diferencia real entre los datos, cual es el mayor, cual es el menor, etc… Al fin y al cabo, si todos los valores están por encima del 1020… ¿Para qué vamos a mostrar la parte de abajo?

Pues muy sencillo, para ganar perspectiva. Me da igual que la empresa haya ganado 50 unidades más que hace 10 años si eso sólo supone un 4% de los beneficios. En la segunda gráfica veo claramente que la empresa de la competencia ha sido regular estos años mientras que con la primera tengo la impresión de que la cosa va viento en popa a toda vela cuando la realidad es que los beneficios se mantienen en un rango prácticamente constante.

  • Longitud vs Área

A la hora de representar gráficamente dos cantidades podemos elegir dónde las aplicaremos. ¿Haremos que la anchura de la imagen sea proporcional a las cantidades? ¿Mejor usar el área? ¿Quizá el volumen?

En cualquier caso hay que ser consistente y no se puede elegir a la ligera. En la imagen inferior tenemos dos barras que representan las cantidades 1 y 2. Como es lógico, una es el doble de larga que la otra pero ambas tienen el mismo grosor.

Por otro lado si queremos representar as mismas cantidades (1 y 2) con círculos deberemos tener en cuenta que no podemos doblar la altura y la anchura del círculo pequeño para obtener el grande porque eso daría como resultado circunferencias de area 1 y 4 respectivamente. Lo correcto es que la circunferencia grande sea 1,4142 veces más alta y más ancha que la pequeña de manera que su área sea el doble.

¿Quién no ha visto infografías en los periódicos llenas de coches de diferentes tamaños para representar las ventas anuales de Ford y compañía? ¿Cuántos de esos dibujos creen que estaban bien hechos?

Dejo como ejercicio para el lector extrapolar la idea a objetos con volumen.

Longitud vs Area

  • Cambia de escala

Escalas Este también apareció en el otro post. La mayoría de gente es incapaz de leer un gráfico en escala logarítmica aunque lo especifiques. Así que… ¡Manos a la obra!

De nuevo, los tres gráficos de la imagen representan la misma información (1, 2, 3 y 4) y son del mismo tipo (splines) pero en cada uno de ellos he usado una escala vertical diferente.

En el central he usado la escala lineal, que es la más habitual y práctica en el rango de datos en el que nos movemos. Por cada unidad que aumentan los datos, aumentamos una unidad la escala.

En el gráfico superior he intentado que los resultados tengan peor pinta y por eso he usado la escala logarítmica que es la que se usa cuando el rango de datos es muy, pero que muy amplio (como por ejemplo para medir la intensidad del sonido o la fuerza de un terremoto). Así, por cada vez que se doblan nuestros datos aumentamos una unidad la escala.

Por último, el tercer gráfico usa una escala exponencial para que parezca que los datos suben muchísimo. Esta escala se usa cuando los datos varían muy despacio y consiste en doblar las unidades de la escala cuando nuestros datos aumentan en una unidad.

En cualquier caso la idea es que hay que fijarse siempre en la escala y las unidades en las que nos presentan la información y desconfiar mucho de todo gráfico que no las incorpore.

Resumiendo, los datos se pueden representar gráficamente de muchas maneras y no siempre es sencillo encontrar la más adecuada. Frecuentemente, por descuido o interés se escoge la incorrecta y la percepción de los datos representados resulta alterada gravemente.

BOLAEXTRA Si te ha gustado este post no te pierdas el anterior.

Escrito en 14/11/08 09:04 por Carlos Luna en las categorías:

Comentarios

Gravatar.com se ha roto

Durante años, «la ciencia de las gráficas» no tuvo el reconocimiento merecido por culpa de estas… estrategias. Parecía que el uso de gráficos para representar cantidades tenía por único propósito engañar. Esto ya pasó, por suerte, pero las artimañas siguen a la orden del día.

Hace tiempo “desenmascaré” un anuncio de Movistar que hacía un uso descarado del «longitud-vs-volumen» .

P.S. Si te interesa el tema, tienes que hacerte con una copia del libro de Tufte

Kiko Llaneras | 14/11/08 19:21 | #
Gravatar.com se ha roto

@Kiko: Recuerdo haber leído tu artículo hace tiempo. Más tarde también leí cosas interesantes respecto a la desproporción x² – x³ en un libro llamado La Física de los Superhéroes. En cualquier caso gracias por traerlo a colación y por la recomendación, procuraré echarle un vistazo así que pueda.

PD: Por lo que veo Tufte ha publicado diversos libros con buena pinta sobre el tema. ¿Me recomiendas alguno en especial?

Carlos Luna | 14/11/08 19:39 | #
Gravatar.com se ha roto

El clásico es «the second edition of The Visual Display of Quantitative Information».

Tiene artículos muy buenos también.

Kiko Llaneras | 15/11/08 12:26 | #

Deja un Comentario

Quizás quieras usar textile para dar formato a tu comentario.

"linktext":http://       _em_       *strong*       -strike-       ^sup^       ~sub~
bq. Blockquote       # Lista numerada       * Lista no-numerada       ==html crudo, sin textile==

(no será mostrado) (http://...)