De cómo las Matemáticas evitan engaños
Si manejas bien las sumas y las restas evitarás que la cajera del supermercado te engañe con el cambio. Si además sabes multiplicar y dividir es probable que no seas el que más pagará cuando tus amigos repartan la cuenta de la cena. Y si, además de todo lo anterior, tienes un poco de agilidad con los porcentajes es casi seguro que no te timarán en las rebajas del Corte Inglés.
No es necesario que hagas de memoria todas esas aburridas operaciones. Simplemente necesitas saber cómo hacerlas y para qué sirven.
El post de hoy va de engaños, manipulación de cifras y pucherazos varios. Tener espíritu crítico es necesario para evitarlos. Y las Matemáticas son la mejor herramienta del espíritu crítico.
La ley de Benford y hacienda
La Ley de Benford dice que la primera cifra de ciertas secuencias de números es, en un 30% de los casos un 1, en un 17,6% un 2, en un 12,5 un 3, y así hasta llegar a la cifra menos probable, el 9, que tan sólo aparece en primera posición en un 4,6% de los casos.
Más en general, la probabilidad de que un número empiece por n es de:
log(n+1) − log(n)
Donde los logaritmos se toman en base 10 y n puede tener más de una cifra.
Esta propiedad, pese a ser algo contraintuitiva, se presenta fundamentalmente en series de números de la vida cotidiana como los implicados en facturas, direcciones de calles, precios de acciones, número de habitantes, longitud de los ríos, etc…
Más allá de lo interesante que resulta la Ley de Benford está su utilidad práctica: Hacienda lleva años examinando grandes cantidades de números que deberían seguir (aproximadamente) la Ley de Benford. Cuando detectan que los datos de una empresa de desvían demasiado de dicha norma saben que alguien está manipulando los datos y lo investigan.
La recta de regresión y los pucherazos
Ya he hablado alguna vez de un concepto especialmente útil: La Correlación y en particular del Coeficiente de Correlación Lineal.
Dicho coeficiente nos indicaba si un conjunto de pares de datos se situaba sobre una recta. Es decir, si un conjunto de datos X y otro conjunto de datos Y cumplen (aproximadamente) que Xi = k·Yi para algún valor de k y todos los valores de i.
Si el coeficiente de correlación estaba cerca de 1 o -1 podemos asegurar que los datos están correlacionados linealmente, si, por el contrario el coeficiente de correlación es 0 tenemos unos datos entre los que no hay demasiada relación lineal.
En la últimas elecciones de Iran, los datos sobre el recuento parcial de los votos obtenidos por el presidente saliente Ahmadinezhad y Moosavi, que era el candidato con mayores opciones, llamaron la atención de todo el mundo. En un país como Iran, con fuertes diferencias étnicas y culturales a lo largo y ancho de su territorio es muy difícil que en cada recuento Ahmadinezhad obtenga (casi) exactamente el doble de votos que Moosavi.
En el gráfico que acompaña a este post puede verse hasta que punto los votos obtenidos por ambos candidatos están correlacionados. De hecho el Coeficiente de Correlación Lineal es de 0,9995 que es algo totalmente anormal. Y es, precisamente, el tipo de anormalidad que uno espera encontrarse en unos datos burdamente manipulados. Como decía el bueno de Rinze: La gráfica grita fraude.
Obviamente esto no prueba nada, pero resulta sospechoso y acumula evidencias a favor de la hipótesis del pucherazo electoral.
BOLAEXTRA: Acabamos de ver dos ejemplos sobre cómo alejarse de un modelo matemático o acercarse demasiado a él puede despertar sospechas. ¿Se os ocurren más ejemplos?
Comentarios
Un ejemplo clásico es pedirle a alguien que escriba una secuencia aleatoria de 20 números (por ejemplo). A la vez, se obtiene una con un ordenador y se pone en un papel.
Normalmente es muy fácil reconocer la secuencia que ha creado una persona por una cosa… es demasiado variante, hasta ser anormalmente variante.
P.S. Nunca lo he probado, pero alguien debería hacerlo en un aula :-)
Kiko Llaneras | 19/06/09 20:37 | #Y no sólo eso.
Ahmadinezhad, ganó incluso en las ciudades natales de los candidatos por unas mayorías del copón, así como ganó en los barrios más reformistas.
Ahmadinezhad, seguramente ganaría con una segunda vuelta o con un 52% como mucho. Lo que ha pasado, que el encargado de meter los votos, quiso ser más papista que el papa.
andresrguez | 20/06/09 12:20 | #En México sucedió lo mismo que en Irán en la última elección presidencial del 6 de julio de 2006 y a pesar de existir la evidencia comprobada matemáticamente, de nada sirvió, al final impusieron a un pelele. Así que las matemáticas podrán evitar engaños pero el hombre ya se las apaña.
Burdo | 20/06/09 19:36 | #- perdon, sin acentos por teclado ajeno –
La grafica de iran, cada punto es una localidad? Puedes explicarla mejor?
Recuerdo un amigo que tenia una cafeteria. Contrato a alguien y esta persona acabo haciendose cargo de la caja del bar. Las cuentas siempre cuadraban perfectamente, no sobraba ni faltaba nada. Lo despidio rapidamente, muy sospechoso.
por que sorprende que ganase Ahmadinezhad en las ciudadades donde nacieron los candidatos opositores?
es un poco absurdo eso, que ocurre que la gente vota segun el nacimiento?
Lo de los votos en barrios reformistas ya es otra cosa, pero que sorprenda que ganaron donde nacieron los reformistas es algo absurdo.
creo que la gráfica que has mostrado es una patata. Vi un mapa de los votos por provincias en Irán y en algunas ganaba Musavi y en las que perdía no siempre era con el mismo porcentaje de votos. La gráfica solo tiene 6 datos, y los demás que pasa, ¿no se ajustaban a la recta?. No digo que no se hayan manipulado las elecciones, pero si alguien las ha manipulado es alguien con capacidad y recursos. No va a pegarse el curre de hacer la farsa y luego inventarse los votos para que exactamente cumplan una regla. Ni de coña vamos
REAL | 21/06/09 16:27 | #@joselito: En la gráfica cada punto representa uno de los datos de recuento parcial que se publicaron por parte del comité electoral. Hubo 6 recuentos parciales y es muy difícil que en todos ellos la proporción de votos de ambos candidatos sea siempre la misma. Como bien has dicho, si todo cuadra a la perfección siempre es que pasa algo raro.
@ina: No se trata de que la gente vote al candidato que ha nacido en su provincia sino que el hecho de nacer en una provincia te hace pertenecer a un grupo social determinado y defender unas ciertas políticas. En consecuencia los que están de acuerdo con esas políticas que, en gran parte viven en la misma provincia, te acabarán votando. En Irán hay mucha segmentación territorial en este sentido.
@REAL: Antes de acusarme de manipular los datos espera a que responda a tus dudas porque es más fácil hablar de patatas que plantarlas. Hay 6 datos en la gráfica porque sólo se hicieron públicos 6 recuentos parciales. Los datos son de recuentos parciales sobre todo el territorio y no sobre cada provincia. Y yo no sería tan optimista respecto a la capacidad de los que han manipulado las últimas elecciones de Irán.
Carlos Luna | 24/06/09 20:09 | #
Pseudolog.com