Lo Normal y Lo Extraordinario

download Lo Normal y Lo Extraordinario

of 10

Transcript of Lo Normal y Lo Extraordinario

  • 7/25/2019 Lo Normal y Lo Extraordinario

    1/10

    1

    II

    Lo normal y lo extraordinario

    Toda persona normal es, de hecho, solo normal en promedio

    Sigmund Freud1

    Qu significa ser normal? Tiene sentido decir que alguien con sndrome de Down notiene inteligencia normal, o que los gays no son normales, o que un dgito es una

    inflacin normal o que se puede ser un suegro normal como dijo el Kun Agero de

    Diego Maradona? El uso cotidiano de la palabra normal persona normal,comportamiento normal, altura normal tiene un origen ligado a las estadsticas y al azar2y a un cambio de pensamiento social que ocurre a principios del siglo diecinueve. Por

    esos aos se produce una avalancha de registros estadsticos, sobre todo con propsitosimpositivos y militares. Lo interesante es que estos datos revelaban ciertas regularidades

    dentro de lo que se supona meramente azaroso, como si hubiera un orden escondido

    dentro del azar. De eso se trata este captulo.

    Soldados escoseses y astronoma

    En un libro publicado en 1846, el matemtico belga Adolphe Quetelet muestra que los

    datos de crmenes en distintas zonas de Blgica, Francia y Holanda tenan un asombroso

    patrn de regularidad. Uno de los registros llamativos es de la corte francesa, entre 1825y 1830: el nmero anual de acusados estaba siempre alrededor de 7.100 y el nmero de

    condenados alrededor de 4.400. Algo as como que haba una probabilidad del 62% de

    que un acusado fuera condenado.3

    Otro de los datos famosos de Quetelet es la lista, tomada de una revista mdica4, de

    permetros de pecho de 5.378 soldados escoceses. Quetelet los cont y encontr que al

    graficar los datos apareca algo como lo de la figura de la izquierda:

    1En Analysis Terminable and Interminable Yale Univ. Press, 1987, p.22.

    2Y a una tentacin frecuente de tomar ideas matemticas que se aplican con precisin en cierta regin delconocimiento y exportarlas hacia territorios de incierta aplicabilidad. La tentacin se origina en el hecho

    de que la descripcin matemtica de las probabilidades permite descifrar regularidades dentro del azar, ver

    orden dentro de lo que a primera vista percibimos como catico.

    3Adolphe Quetelet, Sur lhomme et le dveloppement de ses facults, ou Essai de physique sociale. Paris,

    1835, vol. 2. pg 29. Notar que el libro dice Ensayo de fsica social!

    4Satement of the sizes of Men in different countries of Scotland, taken from the Local Militia Edinburgh

    medical and surgical journal,Volumen 13, pgina 260 (1817). Disponible gratis en google Books.

  • 7/25/2019 Lo Normal y Lo Extraordinario

    2/10

    2

    Lo que el grfico representa es el nmero de soldados que tienen un cierto permetro depecho (redondeado a un nmero entero de pulgadas). Por ejemplo, slo 3 soldados tenan

    33 pulgadas de permetro, pero haba 1073 soldados con 39 y 658 soldados con 42. Ahora

    bien Por qu es tan famoso este resultado? Porque este tipo de curvas ya habanaparecido en las teoras matemticas del azar y en mediciones astronmicas. Pero esta era

    la primera vez que aparecan en datos humanos.

    En 1818, el astrnomo Frederick Bessel, que tena los instrumentos de medicin ms

    precisos de la poca publicFundamenta Astronomiae,un libro con un montn de datos

    de posiciones de estrellas en el cielo. Ahora bien, cada vez que uno apunta el telescopio

    al cielo para medir la posicin de una determinada estrella mide un ngulo ligeramente

    distinto a los anteriores, del mismo modo que cada vez que uno se mide el permetro depecho puede obtener un dato distinto a los anteriores. La diferencia entre los distintos

    resultados es el error de medicin: a veces el telescopio est inclinado un poquito paraaqu, otras un poquito para all, a veces la Tierra misma est ubicada un poquito para

    aqu y otro para all. Lo que Bessel hizo es medir muchas veces la posicin misma

    estrella y obtuvo los datos que muestro el grfico de la derecha de la figura de arriba. Lacurva indica, por ejemplo que 114 mediciones dan alrededor del promedio del ngulo,

    pero 53 mediciones difieren entre 0.2 y 0.3 grados del promedio5.

    Lo llamativo de los dos resultados es que las dos curvas no slo tienen la misma forma

    acampanada sino que tambin son muy parecidas a una curva que ya haba aparecido en

    el tratamiento matemtico de los errores azarosos de medicin.

    5Agradezco a Sthephen Stiegler, de la Universidad de Chicago, autor de The History of Statistics, The

    Measurement of Uncertainty before 1900 (Harvard University Press, 1986), por referirme a la tabla de los

    datos de Bessel, y a los empleados de la seccin Special Collections de la biblioteca de la Universidad de

    Michigan por dejarme fotocopiar las pginas deFundamenta Astronomiaedonde estn los datos. Si miran

    con cuidado la curva de Bessel (la de la derecha) van a ver que es ms simtrica que la de Quetelet.

    Lamentablemente Bessel nos da los datos de las desviaciones absolutas, esto es, el promedio de las

    desviaciones hacia ambos lados del promedio. Grafiqu la curva completa para mejor ilustracin.

  • 7/25/2019 Lo Normal y Lo Extraordinario

    3/10

    3

    No existe un instrumento infinitamente preciso; todo aparato de medicin tiene un error

    y cada vez que medimos obtenemos un resultado distinto. La magia del tratamientomatemtico de los errores es poder aproximarnos, a partir de muchas mediciones, al valor

    real de lo que queremos medir. En el caso de Bessel es la posicin de su estrella. Pero

    mientras Bessel mide muchas veces la misma estrella, Quetelet muestra datos de distintossoldados, ah no hay un valor real de permetro de pecho. Y sin embargo las curvas son

    idnticas. La nica diferencia es que en cada caso la campana podra estar ms o menos

    estirada en la direccin horizontal: una campana ms o menos panzona6.

    Quetelet argumenta que medir el permetro de pecho de muchos soldados sera como

    medir muchas veces el permetro de pecho de un mismo soldado, el soldado normal.

    Digamos que mido con una cinta milimetrada el permetro de mi pecho, y repito la mismamedicin muchas veces (no miles, claro). Las mediciones van a dar resultados distintos:

    en cada medicin la inclinacin de la cinta es distinta, la presin que hago con la cinta

    sobre el pecho es tambin distinta etc. Pero la distribucin de los resultados (y los invito a

    que hagan el experimento para verificarlo o refutarlo) va a ser parecida a la de los milesde soldados: pocos resultados van a indicar un permetro grande o un permetro muy

    chico y muchos resultados van a dar un permetro alrededor del permetro real. Ms an,la forma acampanada de la curva es la misma. Por qu es as? Quetelet da un salto

    conceptual cuestionable y propone que la razn es que la naturaleza apunta a una especie

    de hombre promedio y que los que estn en los extremos de la campana son

    desviaciones azarosas de un cierto ideal. Lo de Quetelet es una novedad filosfica yaque en lugar de poner el ideal humano en el extremo de lo improbable (los ms cultos son

    los menos frecuentes, por ejemplo) lo pone en el medio, donde est el grueso de la

    poblacin. Pero las ideas de Quetelet son cuestionables. No hay una razn clara, oclaramente demostrable de que ciertos atributos sigan la distribucin acampanada que

    luego se llamara distribucin normal. Ms an, hay otras distribuciones posibles que

    bien pueden aparecer en grupos de personas y que sera errneo llamarlas anormales.7Sin embargo el trmino hombre promedio cautiv la imaginacin popular en 1825 con

    una intensidad que persiste hoy.

    Propongo entonces algunos experimentos caseros que conducen la famosa distribucinnormal.

    Monedas al aire

    Tiro una moneda cuatro veces y cuento cuntas caras salieron. En cada tiro hay varios

    resultados posibles, que van desde cuatro caras a cuatro cruces, pasando por lasposibilidades intermedias. En notacin tucumana llamemos C a cara y S a cruz (en

    6Pero si dibujramos una de estas campanas en una tela elstica estirable (o comprimible) en toda

    direccin, podramos obtener cualquier otra campana estirando o comprimiendo el dibujo.

    7But it helped create a climate of public awareness of distribution that was to lead to a truly major advance

    in statistical methods over the period 1869 to 1925 (Stigler. Op cit, p.219)

  • 7/25/2019 Lo Normal y Lo Extraordinario

    4/10

    4

    Tucumn se dice sello y no cruz) y dibujemos un rbol de posibilidades que muestra

    que para cuatro tiros hay 16 resultados posibles:

    Ahora invento el siguiente juego: asigno el nmero +1 a cada cara que sale -1 a cada

    cruz y luego sumo los nmeros que resultan de cada tiro. Los resultados posibles de la

    suma son +4 (si sale CCCC) -4 (si sale SSSS), +2, -2 y 0. Los valores extremos (+4 y -4) son menos probables que los otros ya que cada uno corresponde a una sola de las

    posibles secuencias de monedas. En cambio hay cuatro secuencias que dan +2 y -2 yocho secuencias que dan 0. Como cada secuencia tiene la misma probabilidad (uno en

    16) podemos contabilizar fcilmente la probabilidad de que salga cada una de las sumas

    que van de -4 a 4. Y si graficamos el resultado obtenemos el siguiente grfico, una

    especie de embrin de la curva acampanada de Gauss, Quetelet y Bessel:

    Si tirramos ms monedas el nmero de resultados posibles de la suma va a aumentar y la

    curva va aproximndose a la famosa distribucin normal. Por ejemplo, para 18 tiros el

    resultado es algo as:

    Este experimento muestra que si todas las causas son homogneas, entonces esperamos

    una distribucin normal. El Queteletismo es pensar que esa homogeneidad ocurre en

    fenmenos sociales y exagerar el protagonismo de la distribucin normal.

  • 7/25/2019 Lo Normal y Lo Extraordinario

    5/10

    5

    La altura de los hijos de Yao Ming y de Diego Buonanotte

    Pregunta: los hijos de Yao van a ser ms altos que Yao? Y los hijos de Buonanotte,

    van a ser ms bajos que Buonanotte? El primero en hacerse este tipo de preguntas con el

    rigor de la estadstica es Francis , una especie de sucesor de Quetelet en lo que respecta ala aplicacin del azar en las ciencias sociales y en la vida cotidiana. A Galton le

    interesaba la herencia y, en particular, el carcter hereditario del talento. Por qu se

    preguntaba Galton- los hijos de los genios tienden a ser menos genios que sus padres? Sibien la genialidad no es muy cuantificable, es cierto que la historia registra familias

    enteras de talentos matemticos (como los Bernoullis) o musicales (como los Bachs) y es

    incuestionable que dentro de esas familias hay casos individuales que no vuelven a

    repetirse, como Jacobo Bernoulli o el gran Juan Sebastin. Pero para hacer la cosa mscuantificable, Galton se concentr en la relacin entre la estatura de los hijos y la de sus

    padres. Y encontr una interesante regularidad estadstica: los hijos de padres muy altos

    tienden a ser ms bajos que sus padres. Y los hijos de padres muy bajos tienden a ser ms

    altos que sus padres. La pregunta ahora es Por qu? Por un lado estn las complejidadesde la gentica y el hecho ms o menos obvio de que los hijos de padres altos van a ser

    altos y los de padres bajos van a ser bajos. Al menos en general. Pero el punto aqu no esese, sino el hecho de que los hijos de los muy altos van a ser en promedio mas bajos que

    sus padres. Y al revs con los muybajos. Y esto no tiene nada que ver con las causas

    genticas en s mismas, sino con un crudo efecto estadstico que da lugar a muchos

    malentendidos, y que lleva a atribuir la relaciones de causa y efecto donde solo hay unmudo balance probabilstico.

    Para ilustrar esta especie de espejismo lgico (llamado tcnicamente regreso alpromedio o regresin a la media) volvamos al experimento de las monedas al aire.

    Digamos que tiro 4 monedas muchas veces y voy anotando los resultados de la suma de

    cada tiro en una lista. Como ejemplo muestro una serie que gener con mi computadora:

    0,0,-2,-2,2,0,-2,-2 ,4,-2,4,2,0,0,2,2,0,-2,-2,-2,2,0,2,0,0,0,0,-2,-2,0,0,2,-2,0,2, 4,2,0,2

    Pocos casos tienen +4 y -4 ya que CCCC y SSSS son tiros improbables. La mayora delas sumas van a ser 0. Ahora miro la lista y busco un lugar donde sali el +4. Lo mas

    probable es que el nmero siguiente (y el anterior!) sean menores que +4. Por qu?

    Simplemente porque, en un tiro arbitrario, es muy probable que salga un nmero menorque el mximo. Y lo mismo si me concentro en el -4: es muy probable que tanto el

    nmero siguiente como el anterior sean mayores que -4 y cercanos al promedio. La

    confusin frecuente es que hay una relacin causal entre los dos eventos de este tipo

    cuando, en realidad, el as llamado regreso al promedio se da en eventos independientes,que no tienen relacin entre s. Claro que no todos los casos son tan transparentes como

    el tiro de las monedas y muchas veces hay que pensar la situacin con cuidado. Y de ah

    viene la confusin. Por ejemplo digamos que Fortunata estudia en una universidad en laque clasifican los exmenes con puntajes de 1 a 100. Fortunata es muy buena estudiante

    y siempre saca puntajes altos, casi nunca debajo de 95. Su promedio es 97.5. Un da le

    agarr un mareo horrible y se sac un 89. Lo ms probable es que en el examen siguientesaque una nota mayor que 89. Y si otro da se saca un 100, lo ms probable es que en el

  • 7/25/2019 Lo Normal y Lo Extraordinario

    6/10

    6

    examen siguiente se saque un puntaje menor. Por un lado esta la multitud de razones que

    determinan la nota (dificultad de la materia, estado de nimo de Fortunata el da del

    examen etc.). Por otro la simple regularidad estadstica: en un examen arbitrario lo msprobable es que Fortunata saque algo cercano a su promedio. Y si en el examen anterior

    sac 100 lo ms probable es que en el examen de hoy saque un puntaje ms bajo.

    Uno de los ejemplos famosos de falsa atribucin causal que en realidad tienen su origen

    en el regreso al promedio es el gafe de Sports Illustrated8: se dice que es mala suerte

    para un deportista salir en la tapa de la revista porque despus su rendimiento baja. Y escierto, en promedio su rendimiento baja, pero no porque el deportista sali en la tapa. La

    lgica es al revs: sali en la tapa porque tuvo un rendimiento excelente, mejor que su

    promedio y por es atrajo el inters periodstico. Lo ms probable es que su rendimiento

    posterior sea menor, haya o no haya salido en la tapa de la revista. Otro interesante escitado por Daniel Kahneman, ganador del premio Nobel de economa en 2002

    9: un

    instructor de cadetes aeronuticos argumenta que, cmo mtodo de entrenamiento, no es

    efectivo alentar al que hizo bien una acrobacia. En cambio, dice el instructor, es ms

    eficaz gritarle y amonestar al que hizo una mala maniobra. Su evidencia: prob elogiandoa cadetes despus una muy buena maniobra y cuando la repiten no les sale tan bien. Pero

    cuando le grita a cadetes que hicieron una mala maniobra, en la siguiente tiende a salirlesmejor. Por lo tanto, segn el instructor, conviene gritarles. Y de este razonamiento

    errneo, Kahneman comenta con lucidez: Como tendemos a recompensar a los que les

    va bien y a castigar a los que les va mal, y como hay regresin al promedio, parte de la

    condicin humana es que estamos, estadsticamente, castigados por recompensar a losotros y recompensados por castigarlos.

    En su anlisis de la regresin, Galton hace uno de los grandes experimentos mentalesde la historia de la ciencia

    10. En realidad parte de su experimento es mental y parte es

    real. La parte real y concreta es un aparato que que llam quincux11

    : un tablero con

    palitos colocados de manera regular y unas bolitas que se tiran por arriba. Las bolitasentran al tablero con direcciones variadas (por ms esmero que uno ponga hay una

    aleatoriedad en la direccin de cada) y al caer van rebotando de forma azarosa en los

    palitos. Luego son colectadas en la parte de abajo y la distribucin que resulta es

    aproximadamente la campana de la distribucin normal. En la figura muestro el escaneodel trabajo de Galton y un quincux casero hecho con alfileres gruesos, gomitas y

    mostacillas que caen.

    8Sports Illustrated es una revista deportiva de circulacin masiva EEUU.9Autobiografa de Daniel Kahneman.10Sthephen M. Stiegler,Regression to the mean, historically considered, Statistical Methods in Medical

    Research, 6, 103-114 (1997).11

    El nombre quincunx proviene de los sembrados regulares en los que un rbol est rodeado de cuatrorboles, como los cinco puntos de la cara de un dado en el que sali el cinco. Ver Kunert, J., Montag, A.,

    and Pohlmann, S. (2001). The quincunx: history and mathematics. Statistical Papers 42, 143-169. La figura

    original de Galton est en Galton, Francis (1889): Natural Inheritance. Macmillan, London. Este libro est

    disponible gratis en Gooble Books.

  • 7/25/2019 Lo Normal y Lo Extraordinario

    7/10

    7

    La curva que obtuve al tirar las mostacillas no es tan simtrica y homognea como la

    terica ya que us un nmero reducido de mostacillas. Adems, los alfileres no estnubicados en perfecta simetra y mi quincux no estaba perfectamente nivelado con el piso.Pero vale la pena el esfuerzo de fabricarse uno y ser testigo de cmo la campana de

    Gauss emerge, aproximadamente, en este aparto mecnico. Sumado a esto, Galton le hace

    decir ms cosas al quincux. Y aqu viene la parte mental (y sutil) del experimento. Galtonimagina un quinqux dividido en dos partes, con unas maderitas (en la parte A de la

    figura) que interrumpen el paso de las bolitas hacia la parte B.

    Si uno tira las bolitas igual que antes, es natural esperar que, en la parte A, las bolitas seacomoden de acuerdo a una distribucin normal, o una campana menos panzona que la

    que hubiera ido a la parte B en caso de no haber sido interrumpida. Ahora Daltonpropone sacar una sola de las maderitas de la parte A, digamos la que est marcada conuna flecha en la figura. Lo que va a pasar ahora es que las bolitas de esa columna van a

    caer a la parte B formando a su vez una distribucin normal, pero que ahora no est

  • 7/25/2019 Lo Normal y Lo Extraordinario

    8/10

    8

    centrada en la mitad: as como lo que represento con la parte gris en la figura. Si

    hubiramos sacado otra de las maderitas tambin tendramos una distribucin normal

    similar, pero centrada en otra parte del sector B. Y si sacramos todas las maderitastendramos la distribucin normal original! Lo que Galton ilustra en este experimento

    mental es que una suma de causas que no son del todo accidentales, tomadas en conjunto,

    puede dar lugar a una distribucin normal. Cuando digo no del todo accidental merefiero a que las bolitas que dan lugar a la parte gris estn hacia el costado derecho de B,

    no estn distribuidas alrededor de la mitad. Estas bolitas representaran, por ejemplo, las

    personas altas (o de gran permetro de pecho) de una poblacin. Y lo mismo con lasbajas. Y tomadas en conjunto, la distribucin de alturas y permetros es normal. Galton

    con su quincux reconcilia la teora de errores segn la cual una acumulacin de

    desviaciones accidentales de lugar a una distribucin normal con la herencia que, si bien

    contiene desviaciones accidentales tambin tiene obvias correlaciones ya que tendemos aparecernos a nuestros ancestros.

    Las baguettes de Poincar y una pequea comedia de errores (normales)

    En una nota de la revista Vogue de 1981, Garca Mrquez revela uno de sus secretos: siusted escribe que ha visto volar un elefante, nadie lo creer; pero si afirma haber visto

    volar cuatrocientos veinticinco, es probable que el pblico lo crea12

    . La verosimilitud,

    parecera decirnos Gabo, est en lo especfico. Quiz ese sea el origen de la confusin en

    historia que quiero contarles, y que empieza mientras recorra algunos libros recientessobre el azar. En uno de ellos

    13se menciona una ancdota protagonizada por el

    matemtico francs Henri Poincar. Segn la historia, Poincar compraba todas las

    maanas una baguette que, segn el panadero, pesaba un kilo. Poincar las pesaba en sucasa y comprob que los panes en general pesaban menos. Y no se detuvo ah sino que

    anot los pesos durante meses hasta comprobar que la distribucin de pesos de las

    baguettes era normal pero el centro de la campana, en lugar de estar en un kilo estaba en950 gramos: el panadero le estaba robando.

    12http://www.sololiteratura.com/ggm/marquezvogue.html13El excelente El andar del borracho de Leonard Mlodinov (Crtica, Barcelona, 2008). pp. 173-174.

  • 7/25/2019 Lo Normal y Lo Extraordinario

    9/10

    9

    Poincar se queja a las autoridades y de ah en adelante el panadero le entrega panes de

    un kilo (o ms). Pero el matemtico no detiene su balanza y al calcular la nueva

    distribucin de pesos de los panes encuentra que ya no es normal sino algo as:

    Casi no hay panes ms livianos que un kilo mientras que algunos pesan ms. Conclusin:el panadero sigue usando la misma receta, con pesos fraudulentos, pero le da a Poincar

    los panes ms pesados, seleccionados del costado izquierdo de la distribucin. Poincar

    vuelve a denunciar al panadero y las autoridades toman medidas.

    La historia me pareci una aplicacin tan maravillosa de las regularidades estadsticas en

    la vida cotidiana que quise leer el relato en su versin original, de la pluma del maestro.

    Proced como de costumbre: busqu la referencia en los libros y me di con que noconvergan a la fuente sino a otro libro

    14. Mand un email al autor consultndole. Me

    contest de inmediato: como buen acadmico responsable conservaba una caja con

    copias de las referencias citadas en su libro. Salvo la de Poincar. Se disculp condetallada cortesa y record vagamente que a la ancdota la haba visto en una muestra

    del museo de ciencias Boston. Mand un mail al museo y me contestaron que en la

    muestra titulada Mathematica tenan material sobre la distribucin normal y algunas

    citas de Poincar, pero nada sobre ambos. Sorprendido, llam por telfono y conversandocon la curadora Alana Parkes aclaramos la confusin. En efecto haba una muestra en

    exhibicin llamada El extrao caso de los panes anormales15

    , una historieta de veinte

    cuadros que transcurre en Alemania cuando, despus de la guerra (no dice cul) seracionaba el pan. Cada porcin deba pesar 1Kg, pero un profesor de matemticas

    descubre el problema y se queja ante Herr panadero aduciendo un error en la balanza.

    De ah en adelante la historia es la misma y concluye con el arresto del panadero. Esprobable que el relato sea inventado pero si bien un genrico profesor alemn es a un

    elefante volador como Poincar es a cuatrocientos veinticinco Dumbos merece ser

    verdadero.

    14What are the chances? de Bart K. Holland (John Hopkins University Press, 2002)15The strange case of the abnormal loaves

  • 7/25/2019 Lo Normal y Lo Extraordinario

    10/10

    10

    En el prximo captulo damos un paso ms dentro del jardn probabilstico y empiezo a

    delinear la estructura matemtica del clculo de probabilidades. En algunos lugares hay

    que ajustarse el cinturn y sacar papel y lpiz.