De cómo las Matemáticas evitan engaños

Si manejas bien las sumas y las restas evitarás que la cajera del supermercado te engañe con el cambio. Si además sabes multiplicar y dividir es probable que no seas el que más pagará cuando tus amigos repartan la cuenta de la cena. Y si, además de todo lo anterior, tienes un poco de agilidad con los porcentajes es casi seguro que no te timarán en las rebajas del Corte Inglés.

No es necesario que hagas de memoria todas esas aburridas operaciones. Simplemente necesitas saber cómo hacerlas y para qué sirven.

El post de hoy va de engaños, manipulación de cifras y pucherazos varios. Tener espíritu crítico es necesario para evitarlos. Y las Matemáticas son la mejor herramienta del espíritu crítico.

La ley de Benford y hacienda

Ley de Benford La Ley de Benford dice que la primera cifra de ciertas secuencias de números es, en un 30% de los casos un 1, en un 17,6% un 2, en un 12,5 un 3, y así hasta llegar a la cifra menos probable, el 9, que tan sólo aparece en primera posición en un 4,6% de los casos.

Más en general, la probabilidad de que un número empiece por n es de:

log(n+1) − log(n)

Donde los logaritmos se toman en base 10 y n puede tener más de una cifra.

Esta propiedad, pese a ser algo contraintuitiva, se presenta fundamentalmente en series de números de la vida cotidiana como los implicados en facturas, direcciones de calles, precios de acciones, número de habitantes, longitud de los ríos, etc…

Más allá de lo interesante que resulta la Ley de Benford está su utilidad práctica: Hacienda lleva años examinando grandes cantidades de números que deberían seguir (aproximadamente) la Ley de Benford. Cuando detectan que los datos de una empresa de desvían demasiado de dicha norma saben que alguien está manipulando los datos y lo investigan.

La recta de regresión y los pucherazos

Ya he hablado alguna vez de un concepto especialmente útil: La Correlación y en particular del Coeficiente de Correlación Lineal.

Dicho coeficiente nos indicaba si un conjunto de pares de datos se situaba sobre una recta. Es decir, si un conjunto de datos X y otro conjunto de datos Y cumplen (aproximadamente) que Xi = k·Yi para algún valor de k y todos los valores de i.

Si el coeficiente de correlación estaba cerca de 1 o -1 podemos asegurar que los datos están correlacionados linealmente, si, por el contrario el coeficiente de correlación es 0 tenemos unos datos entre los que no hay demasiada relación lineal.

En la últimas elecciones de Iran, los datos sobre el recuento parcial de los votos obtenidos por el presidente saliente Ahmadinezhad y Moosavi, que era el candidato con mayores opciones, llamaron la atención de todo el mundo. En un país como Iran, con fuertes diferencias étnicas y culturales a lo largo y ancho de su territorio es muy difícil que en cada recuento Ahmadinezhad obtenga (casi) exactamente el doble de votos que Moosavi.

Elecciones Iran 2009 En el gráfico que acompaña a este post puede verse hasta que punto los votos obtenidos por ambos candidatos están correlacionados. De hecho el Coeficiente de Correlación Lineal es de 0,9995 que es algo totalmente anormal. Y es, precisamente, el tipo de anormalidad que uno espera encontrarse en unos datos burdamente manipulados. Como decía el bueno de Rinze: La gráfica grita fraude.

Obviamente esto no prueba nada, pero resulta sospechoso y acumula evidencias a favor de la hipótesis del pucherazo electoral.

BOLAEXTRA: Acabamos de ver dos ejemplos sobre cómo alejarse de un modelo matemático o acercarse demasiado a él puede despertar sospechas. ¿Se os ocurren más ejemplos?

Escrito en 19/06/09 10:07 por Carlos Luna en las categorías:

Comentarios

Gravatar.com se ha roto

Un ejemplo clásico es pedirle a alguien que escriba una secuencia aleatoria de 20 números (por ejemplo). A la vez, se obtiene una con un ordenador y se pone en un papel.

Normalmente es muy fácil reconocer la secuencia que ha creado una persona por una cosa… es demasiado variante, hasta ser anormalmente variante.

P.S. Nunca lo he probado, pero alguien debería hacerlo en un aula :-)

Kiko Llaneras | 19/06/09 20:37 | #
Gravatar.com se ha roto

Tongo! No coneixia el gràfic de les eleccions… sembla força evident…

per cert, has vist l’xkcd? :)

Meldor | 20/06/09 10:55 | #
Gravatar.com se ha roto

Y no sólo eso.

Ahmadinezhad, ganó incluso en las ciudades natales de los candidatos por unas mayorías del copón, así como ganó en los barrios más reformistas.

Ahmadinezhad, seguramente ganaría con una segunda vuelta o con un 52% como mucho. Lo que ha pasado, que el encargado de meter los votos, quiso ser más papista que el papa.

andresrguez | 20/06/09 12:20 | #
Gravatar.com se ha roto

@Kiko Llaneras, solemos confundir distribución uniforme con distribución aleatoria.

Brigo | 20/06/09 13:16 | #
Gravatar.com se ha roto

Este ejemplo sirve?

Tamy | 20/06/09 14:13 | #
Gravatar.com se ha roto

Una demostracion de la diferencia entre un matematico y un ingeniero, para un matematico el segundo caso es un indicio que no prueba nada, para un ingeniero el segundo caso es una prueba irrefutable :)

Avalon | 20/06/09 15:44 | #
Gravatar.com se ha roto

Avalon, como ingeniero te digo que tienes toda la razón.
La rigurosa ciencia Matemática, y sus muchas aplicaciones.

Sotijoe | 20/06/09 16:27 | #
Gravatar.com se ha roto

En México sucedió lo mismo que en Irán en la última elección presidencial del 6 de julio de 2006 y a pesar de existir la evidencia comprobada matemáticamente, de nada sirvió, al final impusieron a un pelele. Así que las matemáticas podrán evitar engaños pero el hombre ya se las apaña.

Burdo | 20/06/09 19:36 | #
Gravatar.com se ha roto

- perdon, sin acentos por teclado ajeno –

La grafica de iran, cada punto es una localidad? Puedes explicarla mejor?
Recuerdo un amigo que tenia una cafeteria. Contrato a alguien y esta persona acabo haciendose cargo de la caja del bar. Las cuentas siempre cuadraban perfectamente, no sobraba ni faltaba nada. Lo despidio rapidamente, muy sospechoso.

joselito | 20/06/09 21:40 | #
Gravatar.com se ha roto

por que sorprende que ganase Ahmadinezhad en las ciudadades donde nacieron los candidatos opositores?
es un poco absurdo eso, que ocurre que la gente vota segun el nacimiento?
Lo de los votos en barrios reformistas ya es otra cosa, pero que sorprenda que ganaron donde nacieron los reformistas es algo absurdo.

ina | 21/06/09 00:15 | #
Gravatar.com se ha roto

creo que la gráfica que has mostrado es una patata. Vi un mapa de los votos por provincias en Irán y en algunas ganaba Musavi y en las que perdía no siempre era con el mismo porcentaje de votos. La gráfica solo tiene 6 datos, y los demás que pasa, ¿no se ajustaban a la recta?. No digo que no se hayan manipulado las elecciones, pero si alguien las ha manipulado es alguien con capacidad y recursos. No va a pegarse el curre de hacer la farsa y luego inventarse los votos para que exactamente cumplan una regla. Ni de coña vamos

REAL | 21/06/09 16:27 | #
Gravatar.com se ha roto

@joselito: En la gráfica cada punto representa uno de los datos de recuento parcial que se publicaron por parte del comité electoral. Hubo 6 recuentos parciales y es muy difícil que en todos ellos la proporción de votos de ambos candidatos sea siempre la misma. Como bien has dicho, si todo cuadra a la perfección siempre es que pasa algo raro.

@ina: No se trata de que la gente vote al candidato que ha nacido en su provincia sino que el hecho de nacer en una provincia te hace pertenecer a un grupo social determinado y defender unas ciertas políticas. En consecuencia los que están de acuerdo con esas políticas que, en gran parte viven en la misma provincia, te acabarán votando. En Irán hay mucha segmentación territorial en este sentido.

@REAL: Antes de acusarme de manipular los datos espera a que responda a tus dudas porque es más fácil hablar de patatas que plantarlas. Hay 6 datos en la gráfica porque sólo se hicieron públicos 6 recuentos parciales. Los datos son de recuentos parciales sobre todo el territorio y no sobre cada provincia. Y yo no sería tan optimista respecto a la capacidad de los que han manipulado las últimas elecciones de Irán.

Carlos Luna | 24/06/09 20:09 | #

Deja un Comentario

Quizás quieras usar textile para dar formato a tu comentario.

"linktext":http://       _em_       *strong*       -strike-       ^sup^       ~sub~
bq. Blockquote       # Lista numerada       * Lista no-numerada       ==html crudo, sin textile==

(no será mostrado) (http://...)