Didáctica de La Estadística - Carmen Batanero

download Didáctica de La Estadística - Carmen Batanero

of 219

Transcript of Didáctica de La Estadística - Carmen Batanero

  • Didctica de laEstadstica

    Carmen Batanero

    Departamento de Didctica de la Matemtica

    Universidad de Granada

  • Didctica de laEstadstica

    Carmen Batanero

    Departamento de Didctica de la MatemticaUniversidad de Granada

  • Carmen Batanero, 2001

    Todos los derechos reservados. Ninguna parte del libro puede ser reproducida,almacenada en forma que sea accesible o transmitida sin el permiso previo escrito de laautora.

    Depsito Legal: GR-150/ 2001

    ISBN: 84-699-4295-6

    Publica:Grupo de Investigacin en Educacin EstadsticaDepartamento de Didctica de la MatemticaUniversidad de Granada

    Imprime:Servicio de Reprografa de la Facultad de CienciasUniversidad de GranadaAvda. Fuentenueva s/n 18071 Granada

    Financiacin:Proyecto BSO2000-1507, DGES, Ministerio de Educacin y Ciencia.Grupo de Investigacin FQM-126. Consejera de Educacin. Junta de Andaluca.

  • NDICE

    Introduccin

    CAPTULO 1. SITUACIN ACTUAL Y PERSPECTIVAS FUTURAS DE LA DIDCTICA DE LAESTADSTICA

    1.1. Introduccin

    1

    31.2. Didctica de la estadstica dentro de la estadstica1.3. La perspectiva psicolgica: investigacin sobre el razonamiento estocstico

    34

    1.4. Especificidad de la estadstica dentro de la didctica de la matemtica1.5. Hacia donde va la educacin estadstica?

    67

    CAPTULO 2. FUNDAMENTOS EPISTEMOLGICOS2.1. Introduccin2.2. Estadstica

    Panorama actual2.3. Aleatoriedad

    99

    1011

    2.3.1. Aleatoriedad y causalidad2.3.2. Aleatoriedad y probabilidad

    Concecin clsica Concepcin frecuencial Concepcin subjetiva

    2.3.3. Procesos y secuencias aleatorias2.3.4. Formalizacin de la idea de aleatoriedad

    Enfoque de los algoritmos de seleccin Enfoque de la complejidad absoluta

    2.4. Ideas estocsticas fundamentales La probabilidad como normalizacin de nuestras creencias El espacio muestral Regla de adicin de probabilidades Independencia y regla del producto Equidistribucin y simetra Combinatoria Modelos de urnas y simulacin La variable aleatoria Las leyes de los grandes nmeros Muestreo

    2.5. Anlisis exploratorio de datos Anlisis exploratorio de datos Caractersticas educativas del AED

    2.6. Asociacin y correlacion2.6.1. Importancia en estadistica Regresin Asociacin y correlacin

    121313141415161617181920212122232424252626272829292930

  • Papel en los mtodos estadsticos2.6.2. Asociacion y causalidad Causalidad, desde un punto de vista estadstico Modelo determinista lineal Modelo aleatorio lineal Aislamiento

    2.7. Inferencia estadstica2.7.1. La justificacin del razonamiento inductivo2.7.2. Popper y la refutacin de hiptesis

    La bsqueda de una solucin probabilstica al problema de la induccin2.7.3. La lgica de los test estadsticos

    Los tests de significacin de Fisher El contraste de hiptesis como proceso de decisin (Neyman y Pearson) Inferencia bayesiana

    2.7.4. Los diferentes niveles de hiptesis en la investigacin2.7.5. Revisin de algunas crticas en contra de los test de hiptesis

    2.8. Analisis multivariante de datos2.8.1. Tcnicas de clasificacin2.8.2. Tcnicas de reduccin de la dimensin

    CAPTULO 3. INVESTIGACIONES SOBRE RAZONAMIENTO ESTADSTICO Y DIFICULTADESDE APRENDIZAJE

    3.1. Introduccion3.2. Investigaciones sobre desarrollo cognitivo de Piaget y Fischbein

    La intuicin del azar La estimacin de la frecuencia relativa Estimacin de posibilidades y nocin de probabilidad Distribucin y convergencia La distribucin normal

    3.3. Investigaciones psicolgicas: heursticas y sesgos3.4. Investigaciones didcticas: errores, obstculos y concepciones3.5. Significado y comprensin

    Elementos de significado Dimensiones institucional y personal del conocimiento Significado y comprensin

    3.6. Significado subjetivo de la aleatoriedad Generacin de resultados aleatorios Reconocimiento de resultados aleatorios El sesgo de equiprobabilidad Independencia Comprensin de la probabilidad desde un punto de vista frecuencial

    3.7. Comprensin de tablas y grficos estadstos3.8. Investigaciones sobre la comprensin de las medidas de posicin central

    Capacidad de clculo y comprensin de algoritmos Comprensin de propiedades Identificacin de campos de problemas

    30313232323335363738394042434547505152

    555658606062636466677071737375767777787983848587

  • Comprensin de representaciones y capacidad de argumentacin3.9. Otros resmenes estadsticos

    Caractersticas de dispersin Puntuaciones tipificadas Estadsticos de orden

    3.10. Asociacin estadstica Tablas de contingencia Campos de problemas en el estudio de la asociacin Algunas dificultades en el estudio de la asociacin Influencia de los entornos informticos en el aprendizaje Diseo experimental

    3.11. Introduccin a la inferencia Distribucin normal y teorema central del lmite Muestreo La heurstica de la representatividad Insensibilidad al tamao de la muestra Intuiciones errneas sobre la probabilidad de experimentos compuestos La heurstica de la disponibilidad

    3.12. Contraste de hiptesis Errores comunes en la interpretacin del nivel de significacin Factores psicolgicos que contribuyen a estos errores Enseanza y aprendizaje de conceptos de inferencia

    CAPTULO 4. EL CURRCULO DE ESTADSTICA4.1. Introduccin

    Razones y fines de la educacin estadstica4.2. Fenomenologa estocstica

    El mundo biolgico El mundo fsico El mundo social El mundo poltico

    4.3. La naturaleza de las matemticas Matemticas: construccin o descubrimiento? Tres caractersticas de las matemticas

    4.4. Algunas teoras educativas Constructivismo Resolucin de problemas El papel de las herramientas semiticas La teora de situaciones didcticas

    4.5. Factores que condicionan el currculo Diferentes sentidos del trmino currculo Dimensiones del currculo

    4.6. Estadstica en los curriculos oficiales de educacin secundaria4.7. La evaluacion del aprendizaje

    Significados del trmino Componentes de la evaluacin

    8890909191939395969899

    100100101102104104105106106111113

    117117118118118120120120120121122122122122122124124125126129129130

  • Instrumentos de evaluacin4.8. Materiales y recursos didcticos

    Material manipulativo Simulacin Calculadoras grficas Juegos

    4.9. Ordenadores y enseanza de la estadstica Clculo y representacin grfica Trabajo con datos reales Ficheros de datos y proyectos Simulacin

    4.10. Recursos en Internet Cursos y materiales didcticos Revistas electrnicas Conjuntos de datos Grupos de discusin o trabajo Centros de recursos Software

    CAPTULO 5. EJEMPLOS DE PROYECTOS PARA LA CLASE DE ESTADSTICA5.1. Introduccin5.2. Estructura de los proyectos y anlisis de su contenido5.3. Proyecto 1. Comprueba tus intuiciones respecto al azar 5.3.1. Objetivos 5.3.2. Los datos 5.3.3. Preguntas, actividades y gestin de la clase 5.3.4. Actividades de ampliacin 5.3.5. Algunas dificultades y errores previsibles 5.3.6. Anlisis del contenido estadstico5.4. Proyecto 2. Cmo son los alumnos de la clase?5.4.1. Objetivos 5.4.2. Los datos 5.4.3. Preguntas, actividades y gestin de la clase 5.4.4. Actividades de ampliacin 5.4.5. Algunas dificultades y errores previsibles 5.4.6. Anlisis del contenido estadstico5.5. Proyecto 3. Estadsticas de la pobreza y desigualdad 5.5.1. Objetivos 5.5.1. Los datos 5.5.3. Preguntas, actividades y gestin de la clase 5.5.4. Actividades de ampliacin 5.5.5. Algunas dificultades y errores previsibles 5.5.6. Anlisis del contenido estadstico5.6. Proyecto 4. Las matemticas de la catadora de te 5.6.1. Objetivos 5.6.2. Los datos

    132133134136136137139139140141142142142143144144144144

    147147153153154154158159160161161161161168169170171171171173179180181182182182

  • 5.6.3. Preguntas, actividades y gestin de la clase 5.6.4. Actividades de ampliacin 5.6.5. Algunas dificultades y errores previsibles 5.6.6. Anlisis del contenido estadstico5.7. Proyecto 5. La estadstica como herramienta de clasificacin 5.6.1. Objetivos 5.6.2. Los datos 5.6.3. Preguntas, actividades y gestin de la clase 5.6.4. Actividades de ampliacin 5.6.5. Algunas dificultades y errores previsibles 5.6.6. Anlisis del contenido estadstico5.8. Ideas para nuevos proyectos 5.8.1. Actitudes hacia la estadstica 5.8.2. Discriminacin laboral hacia la nujer 5.8.3. Espaa en la Comunidad Europea 5.8.4. Intencin de voto en las elecciones al consejo escolar 5.8.5. Tiene ventaja el equipo que juega en su propio campo? 5.8.6. Entrenamiento deportivo, se mejora con la prctica? 5.8.7. Cuntas lentejas tiene un kilo de lentejas?

    Referencias

    182187188189190190190191195196197197197198198198199199200

    201

  • 1INTRODUCCIN

    Este libro est pensado para mis alumnos del curso "Didctica de la Estadstica",que se ha venido ofreciendo como asignatura optativa dentro del Plan de Estudios de laLicenciatura en Ciencias y Tcnicas Estadsticas de la Universidad de Granada, desde elcomienzo de dicho plan de estudios. Incluye tambin parte del material que a lo largo dedoce aos he venido elaborando, como parte de mi trabajo en diversos grupos deinvestigacin en educacin estadstica. Finalmente, el libro trata de reflejar las diversasfacetas de la estadstica: como ciencia, como herramienta de investigacin en reasdiversas, como campo de investigacin didctica, tanto para la formacin de nios,como de profesionales, investigadores y profesores.

    Al tratar de reflexionar sobre la formacin didctica que sera necesario impartira estadsticos o a matemticos, quienes tienen una formacin suficientemente slida yactualizadas en los mtodos y tcnicas de esta materia, surge la necesidad de concretarlo que, en el lenguaje didctico, conocemos como conocimiento del contenido didctico.Cul es este conocimiento, una vez que se dominan las tcnicas matemticas? Cmoresumirlo y hacerlo til e interesante para los futuros profesores? Qu tipo desituaciones didcticas podemos usar para la enseanza del contenido didctico, siqueremos ser consecuentes con los principios constructivistas del aprendizaje, con laimportancia de la interaccin social y del trabajo en grupo del alumno?

    El material que presenta este libro trata de dar respuesta a estas preguntas en unrea particular de las matemticas -la estadstica- en la que existen pocos - o ningn-precedente de textos dedicados a la formacin didctica de los profesores. Est dirigidoa los profesores de educacin secundaria, tanto estadsticos, como matemticos, quienessuponemos tienen ya una base slida de los conceptos estadsticos elementales. Podraser tambin til a los profesores de estadstica en los cursos introductorios en launiversidad en reas como humanidades, ciencias sociales, ciencias de la actividad fsicay deporte, educacin y psicologa, y otras especialidades en las que los alumnos nosiempre han cursado un Bachillerato cientfico.

    En primer lugar, presentamos una breve panormica del estado actual de laeducacin estadstica, que proviene de diversas reas de conocimiento y no slo de laeducacin matemtica, y que en los ltimos aos, con la creacin de la IASE (SociedadInternacional de Educacin Estadstica) empieza a configurarse como una disciplina conentidad propia.

    El segundo captulo lo dedicamos a la reflexin epistemolgica. Mientras que losconceptos estadsticos son sencillos, desde un punto de vista matemtico, existennumerosas dificultades de tipo filosfico ligadas a la interpretacin de estos conceptos ysu aplicacin a situaciones prcticas. El profesor debe ser consciente de la pluralidad designificados atribuibles a conceptos como el de aleatoriedad o probabilidad y de lascontroversias existentes en torno a la inferencia estadstica, puesto que las dificultadesepistemolgicas se reproducen con frecuencia en el aprendizaje de los alumnos.

    La investigacin sobre comprensin y aprendizaje de los conceptos estadsticoselementales est an poco sistematizada y proviene de diversas reas de conocimiento

  • 2que han usado diferentes paradigmas de investigacin y marcos terico. En el captulo 3hemos tratado de hacer una sntesis personal de los resultados ms estables y que sonaceptados con generalidad por los investigadores en educacin estadstica.

    En el captulo 4 presentamos diversos elementos a tener en cuenta en el diseocurricular, incluyendo las disposiciones curriculares, reflexin sobre los fines de laeducacin estadstica, sus campos de aplicacin, el papel y mtodos de evaluacin y losmateriales didcticos, entre los cuales la tecnologa ocupa un papel importante.

    En estos cuatro captulos la informacin presentada se intercala con un conjuntode actividades que he venido utilizando en cursos de didctica de la estadstica: textosbreves o puntos para discutir, anlisis de tems usados en la evaluacin delrazonamiento estocstico, problemas paradjicos o con solucin contraintuitiva,bsqueda, recogida o anlisis de datos, anlisis de tareas o procedimientos, juegos, etc.

    Estas actividades estn pensadas como medio para contextualizar y provocar lareflexin y discusn sobre los diferentes conocimientos presentados, -seanepistemolgicos, psicolgicos, o didcticos- en cursos destinados a la formacindidctica de los profesores. Muchas de estas actividades pueden ser tambin usadas enlas clases de estadstica de secundaria, o en la universidad para hacer reflexionar a losalumnos sobre sus intuiciones incorrectas, para plantearles problemas originales yaumentar su motivacin.

    Finalmente, en el ltimo captulo presentamos algunos ejemplos de proyectosdesarrollados para trabajar en la clase de estadstica, junto con sugerencias de temas paraotros proyectos. La finalidad es contextualizar la enseanza de la estadstica, dentro delproceso ms general de investigacin y presentar un desarrollo de un curso deestadstica para secundaria o primeros cursos de universidad apoyado en el trabajo conproyectos.

  • 31

    SITUACIN ACTUAL Y PERSPECTIVAS FUTURAS DE LADIDCTICA DE LA ESTADSTICA

    1.1. IntroduccinAunque hace unos aos pocos investigadores se interesaban por los problemas

    de la enseanza y aprendizaje de la estadstica, en la actualidad asistimos a un aumentonotable de las publicaciones, diseos curriculares e investigacin relacionados con estetema. El propsito de este primer captulo es hacer un breve resumen histrico delorigen de la educacin estadstica y reflexionar sobre la situacin actual y perspectivasfuturas.

    Recientemente la estadstica se ha incorporado, en forma generalizada alcurrculo de matemticas de la enseanza primaria y secundaria y de las diferentesespecialidades universitarias en la mayora de pases desarrollados.

    Ello ha impulsado la investigacin y el desarrollo curricular en el campoespecifico de la estadstica. Ejemplos de proyectos curriculares desarrollados de acuerdoa estas ideas son, por ejemplo, los del Schools Council Project on Statistical Educationen el Reino Unido (1957-1981) y el Quantitative Literacy Project (1985-98) y DataDriven Mathematics (1996-2000) en Estados Unidos. Los materiales didcticos, elsoftware educativo, investigaciones, revistas, reuniones y congresos sobre la enseanzade la estadstica han crecido espectacularmente en los ltimos aos.

    Este inters, sin embargo, no es exclusivo de la comunidad de educacinmatemtica. La preocupacin por las cuestiones didcticas y por la formacin deprofesionales y usuarios de la estadstica ha sido una constante de los propiosestadsticos, y las investigaciones sobre el razonamiento estocstico han tenido un granauge en el campo de la psicologa. En lo que sigue analizamos los trabajos sobreeducacin estadstica llevados a cabo en estos tres campos.

    1.2. Didctica de la estadstica dentro de la estadsticaLa relacin entre el desarrollo de un pas y el grado en que su sistema estadstico

    produce estadsticas completas y fiables es clara, porque esta informacin es necesariapara la toma de decisiones acertadas de tipo econmico, social y poltico. La educacinestadstica, no slo de los tcnicos que producen estas estadsticas, sino de losprofesionales y ciudadanos que deben interpretarlas y tomar a su vez decisiones basadasen esta informacin, as como de los que deben colaborar en la obtencin de los datosrequeridos es, por tanto, un motor del desarrollo.

    La educacin estadstica ha asido una preocupacin crucial del InstitutoInternacional de Estadstica (ISI) desde su fundacin en 1885, y esta preocupacin seconcret oficialmente en 1948 en el establecimiento del Comit de Educacin,encargado de promover la formacin estadstica, colaborando, para este fin, con laUNESCO y otros organismos internacionales, en un momento histrico en que eraprioritario mejorar la informacin estadstica en los pases en vas de desarrollo, lo que

  • 4implicaba la necesidad de preparar suficiente numero de tcnicos estadsticos en estospases. Las responsabilidades del Comit de Educacin incluyeron el desarrollo dediplomaturas y licenciaturas en estadstica en los que se formaran los profesores ytcnicos estadsticos. Una de las primeras actividades de este comit fue la creacin delos Centros de Internacionales de Educacin Estadstica (ISEC) en Calcuta y Beirut,para atender las necesidades formativas de los pases de su respectivo entornogeogrfico. Este ao se han cumplido 50 aos de funcionamiento ininterrumpido delISEC de Calcuta que estuvo dirigido por estadsticos tan prestigiosos como Mahalanobisy Rao.

    Asimismo, el comit ha colaborado en la produccin y difusin de ayudas para laenseanza, por ejemplo, la preparacin de libros de texto universitarios, bibliografasespecficas y diccionarios de trminos estadsticos. Subcomits especiales se dedicaron aimpulsar la introduccin de la estadstica en las escuelas, el papel de la mujer en laestadstica, y la promocin de conferencias sobre la educacin estadstica, dando origen,en particular a los ICOTS (International Conference on Statistical Education) que seiniciaron en 1982 en la Universidad de Sheffield y han continuado cada cuatro aos.

    Otro tipo de conferencias iniciadas por el comit de educacin, como satlitesdel ICME (International Congress of Mathematics Education), son las Round TableConferences sobre temas especifico de educacin estadstica, que han sido lossiguientes: "Estadstica en la escuela" (Viena, 1973; Varsovia, 1975, Calcuta, 1977), "Laenseanza universitaria de la estadstica en los pases en vas de desarrollo (La Haya,1968), "Enseanza de la estadstica y ordenadores", (Oisterwijk, 1970; Camberra, 1984),y "Formacin de profesores" (Budapest, 1988).

    En 1991 el ISI decide crear una nueva seccin, a la que se transferiran lasresponsabilidades y objetivos que hasta entonces haba tenido el Comit de Educacin.Nace as IASE (International Association for Statistical Education), con igualdad dederechos y obligaciones que el resto de las secciones del Instituto, participando en laelaboracin de sus revistas y organizacin de sus Sesiones bianuales, contribuyendo a sufinanciacin y teniendo representacin en sus organismos directivos. El objetivoprincipal de IASE es el desarrollo y mejora de la educacin estadstica en el mbitointernacional. Sus miembros son personas interesadas en la enseanza de la estadsticaen cualquiera de los niveles educativos, el desarrollo de software estadstico, laenseanza de la estadstica en empresas o industria, preparacin de expertos estadsticospara las unidades estadsticas en el gobierno y el desarrollo curricular, libros de texto ymateriales didctico.

    Entre las responsabilidades asumidas, se encuentran la organizacin del ICOTS a(ICOTS IV, Marrakesh 1994; ICOTS V, Singapur, 1998) y de las Round TableConference asociadas al ICME, habiendo organizado hasta la fechas las dedicadas a"Enseanza del anlisis de datos" (Quebec, 1992), "Impacto de las nuevas tecnologasen la investigacin" (Granada, 1996) y "Formacin de los investigadores en el uso de laestadstica" (Tokio, 2000).

    1.3. La perspectiva psicolgica: investigacin sobre el razonamiento estocsticoLa influencia que, en la psicologa, han tenido las investigaciones sobre el

    razonamiento estocstico es tal que Prez Echeverra (1990) habla de "revolucinprobabilista" para referirse a este impacto, equiparndolo al que ha tenido la perspectiva

  • 5cognitiva. Esta importancia se debe al giro que estos estudios han implicado en lostrabajos sobre razonamiento humano, donde se ha pasado de un modelo de actuacinacorde a la lgica formal, a concebir un decisor que acta de acuerdo a un sistemaprobabilstico complejo, utilizando heursticas adquiridas en su relacin emprica con locotidiano. Trabajos como los recogidos en Kahneman y cols. (1982), que tocan entreotros puntos el razonamiento correlacional, la inferencia, la probabilidad condicional yregla de Bayes, han contribuido a este cambio de paradigma en los estudiospsicolgicos.

    Una heurstica es una estrategia inconsciente que reduce la complejidad de unproblema probabilstico, suprimiendo parte de la informacin. Aunque las heursticasayudan en muchos casos a obtener una solucin aproximada al problema, en otrosproducen sesgos en las conclusiones obtenidas, con las consiguientes implicaciones enlas decisiones tomadas. Consideremos, por ejemplo, el siguiente tem adaptado deKahneman y cols. (1982).

    Ejemplo 1.1 En un hospital maternal se lleva un registro del sexo de los recin nacidos. Culde los dos sucesos siguientes te parece que tiene ms probabilidad?A. Que entre los prximos 10 recin nacidos haya ms de un 70 % de nias.B. Que entre los prximos 100 recin nacidos haya ms de un 70 % de nias.C. Las dos cosas me parecen igual de probables.

    La respuesta correcta a este tem es la A, aunque la mayora de los sujetos suelenconsiderar correcta la respuesta C. Esto es debido a que slo tienen en cuenta que laproporcin de nias en las dos muestras es la misma, sin tener en cuenta el tamao delas muestras, ya que las muestras pequeas son ms variables que las grandes. Alsuprimir un dato (el tamao de la muestra) se ha reducido la complejidad del problema,pero se ha producido una solucin incorrecta. Razonamientos como el mostrado en elejemplo (la heurstica de la representatividad) han sido estudiados por los psiclogos, endiversos contextos de aplicacin, tales como diagnstico mdico o juicios legales.

    Por otro lado, y a partir de los estudios de Piaget e Inhelder (1951), laadquisicin de las ideas de aleatoriedad y probabilidad, del razonamiento combinatorio,de la intuicin de la frecuencia relativa, distribucin y convergencia, as como de lacapacidad de cuantificacin de probabilidades ha sido analizada en los nios desde susprimeros aos a la adolescencia, deteminndose, en consecuencia diferentes etapas en eldesarrollo del razonamiento probabilstico. Otros autores han estudiado tambin lainfluencia de creencias previas y concepciones animistas de los nios sobre su capacidadde percepcin de lo aleatorio. La importancia que estos trabajos tienen para losprofesores es que permiten seleccionar de una forma racional el tipo de tareasprobabilsticas que podemos proponer a nuestros alumnos en funcin de su edad. Losinstrumentos de evaluacin construidos en estas investigaciones son tambin tiles paravalorar los conocimientos y modos de razonamientos de nuestros alumnos.

    Mencin particular merecen los trabajos de Fischbein (1975) y posteriores, yaque constituyeron uno de los primeros puentes de unin entre la psicologa y laeducacin matemtica. Interesado no solo por la formacin de los conceptos formales,sino por la aparicin de intuiciones parciales sobre los conceptos estocsticos, sepreocup tambin del efecto de la instruccin. Sus investigaciones apoyan

  • 6decididamente la conveniencia de adelantar la educacin estocstica y tambin muestranque, sin instruccin, es difcil que se desarrolle un razonamiento estocstico adecuado,incluso una vez que se alcanza la etapa de las operaciones formales. Fischbein ha sidouno de los fundadores del grupo PME (Psychology of Mathematics Education) que en elao 2000 ha celebrado su 24 reunin anual y es, en la actualidad el principal foro deinvestigadores en educacin matemtica. En 1994 se crea un grupo de trabajo sobreestocstica dentro de PME.

    1.4. Especificidad de la estadstica dentro de la didctica de la matemticaEl inters por la enseanza de la estadstica, dentro de la educacin matemtica,

    viene ligado al rpido desarrollo de la estadstica como ciencia y como til en lainvestigacin, la tcnica y la vida profesional, impulsado por la difusin de losordenadores, el crecimiento de su potencia y rapidez de calculo y las posibilidades decomunicacin.

    Todo ello ha facilitado el uso de la estadstica a un numero creciente depersonas, provocando una gran demanda de formacin bsica en esta materia, que hasido encomendada, en los niveles no universitarios, a los profesores de matemticas.Los nuevos currculos de educacin primaria y secundaria incluyen en formageneralizada recomendaciones sobre la enseanza de la estadstica. Sin embargo, en laprctica son todava pocos los profesores que incluyen este tema y en otros casos se tratamuy brevemente o en forma excesivamente formalizada. Analizaremos, a continuacin,la problemtica que, para muchos profesores supone la enseanza de la estadstica.

    Una primera dificultad proviene de los cambios progresivos que la estadsticaest experimentando en nuestros das, tanto desde el punto de vista de su contenido,como del punto de vista de las demandas de formacin. Estamos caminando hacia unasociedad cada vez mas informatizada y una comprensin de las tcnicas bsicas deanlisis de datos y su interpretacin adecuada son cada da mas importantes. Esto noslleva a tener que ensear estadstica a alumnos con capacidades y actitudes variables, eincluso a los que siguen un bachillerato no cientfico, que no disponen de la misma basede conocimientos de clculo que sus compaeros.

    Al mismo tiempo, la estadstica como ciencia, atraviesa un periodo de notableexpansin, siendo cada vez mas numerosos los procedimientos disponibles, alejndosecada vez mas de la matemtica pura y convirtindose en una "ciencia de los datos", loque implica la dificultad de ensear un tema en continuo cambio y crecimiento. Porejemplo, todo profesor que ha tratado de incorporar las calculadoras grficas o elordenador en su clase de estadstica, conoce bien el trabajo aadido que supone lacontinua puesta el da en el manejo de estos recursos.

    Por otro lado, el numero de investigaciones sobre la didctica de la estadstica esaun muy escaso, en comparacin con las existentes en otras ramas de las matemticas.Por ello, no se conocen aun cuales son las principales dificultades de los alumnos enmuchos conceptos importantes. Sera tambin preciso experimentar y evaluar mtodosde enseanza adaptados a la naturaleza especifica de la estadstica, a la que no siemprese pueden transferir los principios generales de la enseanza de las matemticas. Lasinvestigaciones existentes no son muy conocidas por los profesores, ya que falta todavamucha labor de difusin, especialmente de trabajos realizados fuera de nuestro pas.Precisamente este libro pretende contribuir a llenar este hueco.

  • 7La misma naturaleza de la estadstica es muy diferente de la cultura deterministatradicional en clase de matemticas. Un indicador de ello es que aun hoy da prosiguenlas controversias filosficas sobre la interpretacin y aplicacin de conceptos tan bsicoscomo los de probabilidad, aleatoriedad, independencia o contraste de hiptesis, mientrasque estas controversias no existen en lgebra o geometra. Las dimensiones polticas yticas del uso y posible abuso de la estadstica y la informacin estadstica contribuyen,asimismo, a la especificidad del campo.

    La formacin especfica de los profesores en este mbito especifico esprcticamente inexistente. En Espaa slo muy recientemente se ha iniciado unaasignatura especifica de didctica de la estadstica en la Licenciatura en Ciencias yTcnicas estadsticas de la Universidad de Granada y creemos que este tipo deasignatura es prcticamente inexistente en otras universidades o licenciaturas.

    Por otro lado, aunque existen libros de texto excelentes, la investigacindidctica est comenzando a mostrar como algunos errores conceptuales y pedagogainadecuada se transmiten con una frecuencia mayor de lo que seria deseable en los librosde texto (Snchez-Cobo, 1996; Ortiz, 1999).

    Un ultimo punto es la naturaleza interdisciplinar del tema, que hace que losconceptos estadsticos aparezcan en otras materias, como ciencias sociales, biologa,geografa, etc., donde los profesores, a veces se ven obligados a ensear estadstica, loque puede ocasionar conflictos cuando las definiciones o propiedades presentadas de losconceptos no coinciden con las impartidas en la clase de matemticas.

    Parece, en consecuencia, necesaria una mejor preparacin previa y formacinpermanente del profesorado y un apoyo de los departamentos universitarios y grupos deinvestigacin implicados para lograrlo. El papel de las sociedades profesionales, comoIASE es tambin decisivo, especialmente a partir de la constitucin de grupos localesactivos que sirvan de intermediarios entre los profesores, estadsticos profesionales einvestigadores en educacin estadstica en sus distintas vertientes.

    1.5. Hacia donde va la educacin estadstica?En los apartados anteriores hemos descrito el panorama actual de la educacin

    estadstica. Es indiscutible que el siglo XX ha sido el siglo de la estadstica, que hapasado a considerarse una de las ciencias metodolgicas fundamentales y base delmtodo cientfico experimental. La enseanza de la estadstica, sin embargo, an seencuentra en sus comienzos, aunque como hemos descrito parece avanzar de una formaimparable. Ser el siglo XXI el siglo de la educacin estadstica? Analizaremos acontinuacin algunos indicadores que parecen dar una respuesta positiva a estapregunta, as como los cambios previsibles en nuestros mtodos de enseanza de estamateria.

    Un primer indicador de la expansin futura de la educacin estadstica son lostrabajos previstos por IASE, como el congreso ICOTS VI en el 2002 y las sesiones deeducacin en la Conferencia ISI de Corea en 2001. Oras sociedades de estadstica o deeducacin estn tambin organizando de secciones especificas de educacin estadstica,como, por ejemplo, la ASA (American Statistical Association) AERA (AmericanEducational Research Association, Royal Statistical Society, en Inglaterra, Sociedadestadstica Japonesa, la Sociedad Espaola de Investigacin en Educacin Matemtica,etc..

  • 8Las revistas orientadas a los profesores de estadstica sugieren una problemticadocente y un inters de los profesores por mejorar su accin docente. El mejorexponente lo tenemos en Teaching Statistics, que ha cumplido ya 22 aos de existenciadurante los cuales se ha ido desarrollando y adquiriendo una identidad y calidadinternacional reconocida. Otras revistas similares son Induzioni y Journal of StatisticalEducation, que es una revista de educacin estadstica a nivel universitario con unservicio de informacin asociado.

    Algunas de las asociaciones que hemos nombrado preparan boletines de noticiasque distribuyen por Internet con un sistema semejante al de las revistas electrnicas,como la Newsletter del Statistical Education Research Group. A nivel docente podemoscitar el boletn del Statistics Teacher Network, que es una asociacin de profesores deestadstica en los niveles de primaria y secundaria.

    A la vista de todas estas posibilidades, surge la pregunta de hacia donde va laeducacin estadstica y que tipo de enseanza tendr lugar en el futuro (Hawkins,1997). Es difcil dar una respuesta, aunque los libros de texto se empiezan a transformara ediciones electrnicas e incluso en formato accesibles a la consulta, modificacin ysugerencias a travs de Internet. Es tambin sencillo obtener datos de todo tipo para quelos estudiantes puedan realizar investigaciones sobre casi cualquier tema, incluso conpocos recursos disponibles. El profesor puede cargar estos conjuntos de datos desdeInternet e introducirlos en los ordenadores o las calculadoras grficas de los alumnosque tienen una difusin mucho mayor. De este modo los alumnos pueden trabajar conlos datos en casa o exportarlos a otros ordenadores o calculadoras. tambin puedencombinar diferentes conjuntos de datos en un mismo proyecto o "enviar" a la red suspropias colecciones de datos para que sean usadas por nuevos estudiantes en cualquierrincn del planeta.

    Las listas de discusin entre profesores o entre alumnos, la "tutora" de alumnosa distancia, cuando el trabajo del alumno no permite la comunicacin directa con elprofesor son ya hechos cada vez mas cercanos y ya estn siendo implementados enforma experimental en algunas escuelas y universidades, como, por ejemplo, laexperiencia australiana de formacin a distancia de profesores (Watson y Baxter, 1998).La rapidez del cambio tecnolgico hace previsible la extensin de estas nuevas formasde enseanza y aprendizaje en un plazo de tiempo no muy lejano.

  • 92

    FUNDAMENTOS EPISTEMOLGICOS

    2.1. IntroduccinUna vez situada la educacin estadstica, seguiremos con un estudio

    epistemolgico, que es bastante importante para la didctica. La estadstica, a pesar decontar con una axiomtica satisfactoria, es quizs la nica rama de las matemticasdonde prosiguen hoy da las discusiones sobre la interpretacin de conceptos bsicos.Esta controversia no es de tipo tcnico, ya que desde el punto de vista matemtico,cualquier concepto estadstico queda determinado por su definicin. Por ejemplo, laprobabilidad sera cualquier funcin medible normada de un algebra de sucesos en elintervalo [0, 1]. Los problemas filosficos que la axiomatizacin no ha resuelto serefieren a las posibilidades de aplicacin de los conceptos estadsticos y la interpretacinde los mismos en diferentes circunstancias.

    Si el profesor no es consciente de esta problemtica, difcilmente podrcomprender algunas dificultades de sus estudiantes, quienes necesitan materializar enejemplos concretos los conceptos y modelos matemticos. En el ejemplo dado, ladefinicin no resuelve el problema de asignar probabilidad a sucesos como maanallover o habr 3 ganadores mximos en la prxima quiniela.

    En lo que sigue discutiremos algunos conceptos bsicos, comenzando por lamisma nocin de estadstica, a partir de las reflexiones realizadas por estadsticos,filsofos, psiclogos e investigadores en Didctica de la Matemtica preocupados poreste problema.

    2.2. EstadsticaSon muchas las definiciones posibles de estadstica, y entre ellas hemos elegido la

    siguiente que refleja bien nuestra conceppcin del tema:"La estadstica estudia el comportamiento de los fenmenos llamados de colectivo. Estcaracterizada por una informacin acerca de un colectivo o universo, lo que constituyesu objeto material; un modo propio de razonamiento, el mtodo estadstico, lo queconstituye su objeto formal y unas previsiones de cara al futuro, lo que implica unambiente de incertidumbre, que constituyen su objeto o causa final." (Cabri, 1994).

    Los orgenes de la estadstica son muy antiguos, ya que se han encontrado pruebasde recogida de datos sobre poblacin, bienes y produccin en las civilizaciones china(aproximadamente 1000 aos a. c.), sumeria y egipcia. Incluso en la Biblia, en el librode Nmeros aparecen referencias al recuento de los israelitas en edad de servicio militar.No olvidemos que precisamente fu un censo lo que motiv del viaje de Jos y Mara aBeln, segn el Evangelio. Los censos propiamente dichos eran ya una institucin elsiglo IV a.C. en el imperio romano.

    Sin embargo slo muy recientemente la estadstica ha adquirido la categora deciencia. En el siglo XVII surge la aritmtica poltica, desde la escuela alemana de

  • 10

    Conring, quien imparte un curso son este ttulo en la universidad de Helmsted.Posteriormente su discpulo Achenwall orienta su trabajo a la recogida y anlisis dedatos numricos, con fines especficos y en base a los cuales se hacen estimaciones yconjeturas, es decir se observa ya los elementos bsicos del mtodo estadstico. Para losaritmticos polticos de los siglos XVII y XVIII la estadstica era el arte de gobernar; sufuncin era la de servir de ojos y odos al gobierno.

    La proliferacin de tablas numricas permiti observar la frecuencia de distintossucesos y el descubrimiento de leyes estadsticas. Son ejemplos notables los estudios deGraunt sobre tablas de mortalidad y esperanza de vida a partir de los registrosestadsticos de Londres desde 1592 a 1603 o los de Halley entre 1687 y 1691, pararesolver el problema de las rentas vitalicias en las compaas de seguros. En el sigloXIX aparecen las leyes de los grandes nmeros con Bernouilli y Poisson.

    Otro problema que recibe gran inters por parte de los matemticos de su tiempo,como Euler, Simpson, Lagrange, Laplace, Legendre y Gauss es el del ajuste de curvas alos datos. La estadstica logra con estos descubrimientos una relevancia cientficacreciente, siendo reconocida por la British Association for the Advancement of Science,como una seccin en 1834, naciendo as la Royal Statistical Society. En el momento desu fundacin se defini la estadstica como "conjunto de hechos, en relacin con elhombre, susceptibles de ser expresados en nmeros, y lo suficiente numerosos para serrepresentados por leyes".

    Se crearon poco a poco sociedades estadsticas y oficinas estadsticas paraorganizar la recogida de datos estadsticos; la primera de ellas en Francia en 1800.Como consecuencia, fue posible comparar las estadsticas de cada pas en relacin conlos dems, para determinar los factores determinantes del crecimiento econmico ycomenzaron los congresos internacionales, con el fin de homogeneizar los mtodosusados. El primero de ellos fue organizado por Quetelet en Bruselas en 1853.Posteriormente, se decidi crear una sociedad estadstica internacional, naciendo en1885 el Instituto Internacional de Estadstica (ISI) que, desde entonces celebrareuniones bianuales. Su finalidad especifica es conseguir uniformidad en los mtodos derecopilacin y abstraccin de resultados e invitar a los gobiernos al uso correcto de laestadstica en la solucin de los problemas polticos y sociales. En la actualidad el ISIcuenta con 5 secciones, una de las cuales, la IASE, fundada en 1991, se dedica a lapromocin de la Educacin Estadstica.

    Panorama actualAunque es difcil dividir la estadstica en partes separadas, una divisin clsica

    hasta hace unos 30 aos ha sido entre estadstica descriptiva y estadstica inferencial.La estadstica descriptiva tiene como fin presentar resmenes de un conjunto de

    datos y poner de manifiesto sus caractersticas, mediante representaciones grficas. Losdatos se usan para fines comparativos, y no se usan principios de probabilidad. Elinters se centra en describir el conjunto dado de datos y no se plantea el extender lasconclusiones a otros datos diferentes o a una poblacin.

    La inferencia estadstica, por el contrario, estudia los resmenes de datos conreferencia a un modelo de distribucin probabilistico o una familia de modelos,determinando mrgenes de incertidumbre en las estimacin de los parmetrosdesconocidos del mismo. Se supone que el conjunto de datos analizados es una muestra

  • 11

    de una poblacin y el inters principal es predecir el comportamiento de la poblacin, apartir de los resultados en la muestra.

    Esta divisin es hoy demasiado simple y han surgido diferentes corrientes dentrode la estadstica. Por ejemplo, es comn hablar de anlisis de datos. Pero este trminotiene diferentes significados. Analizaremos con ms detalle el anlisis exploratorio dedatos, inferencia estadstica y anlisis multivariante de datos. Antes de ello estudiaremosla problemtica epistemolgica asociada a la nocin de aleatoriedad, as como a lasideas estocsticas fundamentales.

    Actividad 2.1. Discutir las siguientes afirmaciones extradas del artculo de D. S. Moore:Teaching Statistics as a respectable subject. En F. Gordon y S. Gordon (eds.), Statistics for theTwenty-First Century, (pp. 14-25).1. La estadstica es una disciplina cientfica autnoma, que tiene sus mtodos especficos de

    razonamiento;2. Aunque es una ciencia matemtica, no es un subcampo de la Matemtica. La estadstica no

    ha surgido de la matemtica;3. Aunque es una disciplina metodolgica, no es una coleccin de mtodos;4. La estadstica es la ciencia de los datos. Con ms precisin, el objeto de la estadstica es el

    razonamiento a partir de datos empricos. Los datos no son nmeros, sino nmeros en uncontexto;

    5. En los ltimos aos la tecnologa ha hecho que la investigacin y la prctica estadstica sedistancie cada vez ms de la matemtica;

    6. La estadstica tiene sus propias controversias, que estn muy alejadas de las controversiasrelacionadas con los fundamentos de las matemticas;

    7. La posicin que un estadstico toma sobre las cuestiones de fundamentos tiene un impactoinmediato en su prctica estadstica;

    8. La relacin entre estadstica y matemticas se produce en un nico sentido ( no esbiunvoca); la estadstica toma conceptos matemticos para el desarrollo de sus mtodos, encambio la matemtica no toma conceptos estadsticos.

    9. La probabilidad es ms cercana a la matemtica que la estadstica.Cuales son las implicaciones para la enseanza de la estadstica en la escuela primaria ysecundaria?

    2.3. AleatoriedadEl Clculo de Probabilidades se ocupa del estudio de los fenmenos aleatorios.

    Ahora bien. Qu es la aleatoriedad? Es una propiedad de los fenmenos a los queaplicamos esta calificativo? De donde surge esta idea? A continuacin discutimos esteconcepto, partiendo del trabajo de Batanero y Serrano (1995).

    Actividad 2.2. Se pidi a algunos nios lanzar una moneda 150 veces. Algunos lo hicieroncorrectamente. Otros hicieron trampas. Anotaron con la letra C la aparicin de una cara y con Xuna cruz. Estos son los resultados de Daniel y Diana:Daniel: c+c++cc++cc+c+c++c++c+ccc+++ccc++c++c+c+c++cc+ccc+

    c+c+cc+++cc++c+c++cc+c++cc+c++cc+cc+c+++c++cc++c++c+c+cc+c++cc+c+c++ccc+cc++c+c++cc+++c+++c+c++ccc++

    Diana: +cc+++c++++c+cc+++cc+cc+++cc+ccc+++c++++++c+c+c+c+

  • 12

    +++cccccc+ccc+c+cc+ccccc+ccc++ccc+c+ccccccccc++c+ccccccc+++++cccc++c+c+cc+cc+cc++++++c+cc++ccc++cccHicieron trampas Daniel o Diana? Por qu?.

    Cual es la solucin correcta al problema? Cmo lo resolveras? Podras dar una lista devariables que podras cambiar en el tem 1 para hacer variar su dificultad (variables del campode problemas de donde surge la idea de aleatoriedad)? Qu otros colectivos de personas seinteresaran por estos problemas? Qu haran para resolverlo?

    2.2.1. Aleatoriedad y causalidad

    Una primera acepcin de lo aleatorio se recoge en el diccionario de M. Moliner(1983):

    "Incierto. Se dice de aquello que depende de la suerte o del azar", siendo el azar"la supuesta causa de los sucesos no debidos a una necesidad natural ni a unaintervencin humana ni divina".

    En esta definicin aleatorio es aquello cuyas causas son desconocidas y el "azar"estara personificado como la causa de los fenmenos aleatorios. Esta interpretacincorresponde a la primera fase histrica en el desarrollo de la idea de aleatoriedad quefinaliza al comienzo de la Edad Media. En esta etapa los dados o huesos de astrlago seusaron para echar a suertes, tomar decisiones y en ceremonias religiosas. puesto que elazar suprima influencia de la voluntad, inteligencia o conocimiento del hombre. SegnPoincar (1936), los filsofos clsicos diferenciaban los fenmenos que parecanobedecer a leyes conocidas y los aleatorios, que no podan preverse porque se rebelabanante toda ley. La aleatoriedad tena, adems, un sentido preciso, objetivo. Lo que eraaleatorio lo era para cualquier persona.

    Otra interpretacin es suponer que todo fenmeno tiene una causa y que el azar esdebido a nuestra ignorancia: "Nada sucede por azar sino que todo ocurre por una razny por una necesidad" (Leucippus, siglo V a.c.). Esta es una interpretacin subjetivaporque lo que es aleatorio para una persona puede no serlo para otra con msconocimientos:

    "El azar no es ms que la medida de nuestra ignorancia. Los fenmenos fortuitos son,por definicin aquellos cuyas leyes ignoramos". (Poincar, 1936, pg. 69 de lareproduccin en el libro de Newmann).

    Que esta interpretacin no es adecuada se deduce de la existencia de fenmenosdeterministas cuyas leyes no conocemos, como la muerte y de otros fenmenosaleatorios, como la transmisin de caracteres genticos que tienen causas conocidas. Ennuestra moderna concepcin, los fenmenos aleatorios son aquellos a los que podemosaplicar el clculo de probabilidades, que seguir siendo vlido el da que encontremossus reglas. As, el jefe de ventas de una empresa ignora cuando o cuanto comprar cadauno de sus clientes. Sin embargo, sus beneficios seguirn siendo los mismos, inclusocuando lo conociese, porque la distribucin del consumo en la poblacin sera la misma,independientemente de este conocimiento.

    Cuando una causa pequea produce un efecto considerable, decimos que elresultado es aleatorio, porque la prediccin resulta imposible, como en los juegos de

  • 13

    azar, terremotos u otros desastres naturales. Es precisamente la complejidad o multitudde las causas lo que muchas veces determina un resultado aleatorio.

    Actividad 2.3. Elaborar una lista de sinnimos del trmino aleatoriedad. Son totalmenteequivalentes? Buscar en diversos diccionarios (Diccionario de la Lengua, de uso del espaol,sinnimos, etc.) y encontrar matices diferenciadores. Elaborar una lista de trminos relacionados.

    Actividad 2.4. Como est presente el azar en los juegos, narrativas y actividades infantiles?

    Actividad 2.5. Estudiar algunas creencias culturales infundadas sobre la posibilidad de control delo aleatorio? Como se ponen de manifiesto? Podras aportar datos al respecto?

    2.2.2. Aleatoriedad y probabilidadCuando comienza el clculo de probabilidades, por ejemplo en el Liber de Ludo

    Aleae de Cardano, se relaciona la aleatoriedad con la equiprobabilidad de los diferentesresultados, es decir, un fenmeno sera aleatorio si todos sus resultados sonequiprobables. Esta interpretacin se acept con facilidad, debido a que los primerosdesarrollos del clculo de probabilidades estuvieron muy ligados a los juegos de azar, enlos que el nmero de posibilidades es finito y el principio de indiferencia de lasdiferentes posibilidades puede considerarse razonable.

    Hacia el final del siglo XVIII y principios del XIX se ampla el nmero desituaciones consideradas aleatorias, incluyendo no slo los juegos de azar, sino muchosfenmenos naturales. Paralelamente, se produce un cambio en el concepto dealeatoriedad, que se hace progresivamente ms formalizado, introduciendo la idea de"independencia", que se considera imprescindible para asegurar la aleatoriedad de unsuceso en experimentos repetidos.

    Concepcin clsicaLa nocin de aleatoriedad ha estado ligada a las diferentes concepciones sobre la

    probabilidad (Vase Godino, Batanero y Caizares, 1987). En una concepcin clsica,la probabilidad de un suceso es el "cociente entre el nmero de casos favorables alsuceso y el nmero de casos posibles, siempre que todos sean equiprobables.

    En esta acepcin de la probabilidad, consideramos que un objeto (o un suceso) esun miembro aleatorio de una cierta clase de objetos (poblacin), si la probabilidad deobtener este objeto (en un sorteo u otro experimento) es igual que la de cualquier otromiembro de su clase. En la lotera nacional o el sorteo de excedentes de cupo en elservicio militar, cada nmero ( o cada mozo) sera un miembro aleatorio del conjunto demiembros en el sorteo.

    Esta definicin de aleatoriedad fue considerada suficiente en una primera etapa,donde el clculo de probabilidades se limitaba a los juegos de azar basados en dados,monedas, cartas, extraccin de bolas en urnas, etc, Sin embargo, pronto se le aplicaronalgunas crticas, as como a la concepcin de probabilidad en que se apoya.

    Hay en esta definicin una circularidad difcil de evitar, lo que hara tambindifcil usarla para discriminar un miembro aleatorio o no aleatorio en una clase dada.Por ejemplo, como sabemos que una ruleta dada o un dado, no estn ligeramentesesgados? O qu el sorteo de excedentes de cupo es realmente equitativo? Adems slo

  • 14

    podramos decir que un objeto es un miembro aleatorio de una clase, si la clase es finita.Si fuese infinita, la probabilidad de cada miembro de la clase siempre sera nula (portanto idntica), aunque el mtodo de seleccin fuese sesgado.

    Que ocurrira, finalmente, en el caso de sucesos elementales no equiprobables?Si aplicamos esta definicin, no podramos considerar que el color del pelo o el gruposanguneo sea una caracterstica aleatoria, ya que hay mayor proporcin de personasmorenas que rubias en la poblacin y hay menos personas con Rh negativo. A pesar deestos problemas, la idea de equiprobabilidad se usa todava para definir la aleatoriedaden situaciones como definir una muestras aleatoria -todos los elementos tienen la mismaprobabilidad de ser elegidos- o la asignacin aleatoria de sujetos a los experimentos -cada sujeto tiene la misma probabilidad de ser asignado al grupo experimental o alcontrol.

    Concepcin frecuencialCuando queremos aplicar la idea de probabilidad a situaciones del mundo fsico o

    natural, como la meteorologa, el resultado de elecciones, accidentes, etc. nosencontramos con que no podemos aplicar el principio de equiprobabilidad Usando laconcepcin frecuencial de la probabilidad, podramos considerar que un objeto es unmiembro aleatorio de una clase si pudiramos elegirlo mediante un mtodo queproporcionase a cada miembro de la clase una cierta frecuencia relativa "a priori" a lalarga.

    Esta definicin es muy til cuando disponemos de datos estadsticos sobre un grannmero de casos, como en los ejemplos citados, aunque tenemos el problema terico dedecidir cuntos experimentos se necesitan para considerar que, a partir de este nmero,habramos probado suficientemente el carcter aleatorio del objeto. Esta definicin de laprobabilidad no proporciona, adems, un valor exacto de la probabilidad, sino slo unaestimacin del mismo.

    Concepcin subjetivaEn los dos casos anteriores la aleatoriedad y la probabilidad son propiedades

    "objetiva" que se asigna al suceso o elemento de una clase, como podra asignrsele unaprofesin, estado civil o nacionalidad, si se trata de una persona. Kyburg (1974) criticaesta visin e indica que la idea de aleatoriedad est compuesta de cuatro trminos:

    el objeto que se supone es miembro aleatorio de una clase; el conjunto del cual el objeto es un miembro aleatorio (poblacin o colectivo); la propiedad con respecto a la cual el objeto es un miembro aleatorio de la clase dada; el conocimiento de la persona que decide si el objeto es aleatorio o que asigna una

    probabilidad.

    La decisin sobre si consideramos que un objeto es o no un miembro aleatorio deuna clase, depende de nuestro conocimiento sobre el mismo. Lo que puede ser aleatoriopara una persona puede no serlo para otra. y la aleatoriedad no es una propiedad fsica"objetiva", sino que tiene un carcter subjetivo. Utilizamos ahora la concepcinsubjetiva de la probabilidad, por la que todas las probabilidades seran condicionales yes ms conveniente en las situaciones en que poseemos cierta informacin que puede

  • 15

    cambiar nuestro juicio sobre la aleatoriedad o la probabilidad de un suceso.Hay algunas situaciones que todo el mundo considerara aleatorias y donde el uso

    de la idea de equiprobabilidad para definir un suceso aleatorio parece claro y nocontrovertido. Por ejemplo, en el caso de un dado equilibrado, cualquier lanzamiento essimplemente un ejemplo de cualquier otro posible lanzamiento. No hay nada nuevo quepodamos conocer acerca del dado que nos permita predecir otra probabilidad diferentede 1/6 para un resultado particular del dado.

    En otros casos la situacin no es tan clara. Consideremos, por ejemplo, laprobabilidad de que un chico apruebe el examen de conducir. Si tenemos que dar unvalor para esta probabilidad, nuestras estimaciones sern muy diferentes en caso delexaminador o de su profesor de la autoescuela, que ha estado observando como conducea lo largo de los ltimos dos meses.

    Actividad 2.6. En los siguientes sucesos indica cuales consideras aleatorios y qu concepcin dealeatoriedad puede aplicrsele1. Germinacin de una semilla plantada con cuidado2. El resultado obtenido en un dado que yo he lanzado y puedo ver, pero tu no3. El nmero ganador de la lotera el prximo mes4. El color del prximo jersey que te compres5. Si llovi en Melbourne el 3 de Agosto pasado6. Si llover en Melbourne el 3 de Agosto prximo7. Que cojas la gripe este ao8. Que ests expuesto a coger la gripe este ao9. El resultado de lanzar una moneda, si la he lanzado 10 veces y he obtenido 10 caras

    2.2.3. Procesos y secuencias aleatoriasSegn Zabell (1992) la idea de aleatoriedad contiene dos aspectos distintos que, a

    veces, pueden no coincidir, que son: el proceso de generacin, que es lo que, matemticamente se conoce como

    experimento aleatorio; el patrn de la secuencia aleatoria producida como consecuencia del experimento.

    Muchas personas piensan que estos dos aspectos estn ligados entre s y esperanque slo un proceso aleatorio proporcione un patrn de resultados aleatorios. Sinembargo, puede haber secuencias que, aparentemente, parezcan aleatorias, siendoproducidas por un proceso completamente determinista, como cualquier trozo de lasecuencia de nmeros decimales del nmero Pi u otro nmero irracional.

    Por otro lado, incluso una secuencia aparentemente regular y determinista, comoC+C+ puede obtenerse como resultado de lanzar cuatro veces una moneda y estasecuencia particular, en contra de la creencia popular es tan probable como CCC+ o++C+.

    A final del siglo XIX Edgeworth, Galton, Pearson, Fisher y sus colaboradoresinician el estudio de mtodos de inferencia, basados en la eleccin de muestrasaleatorias de datos. Hasta esa fecha los estudios estadsticos eran puramentedescriptivos, analizando grandes masas de datos empricos. En los casos en que seutilizaban muestras, estas no se elegan al azar, porque no se era consciente de la

  • 16

    importancia de elegir muestras aleatorias para poder realizar inferencias vlidas yprecisas sobre la poblacin. Cuando los nuevos estudios muestran la importancia de lasmuestras aleatorias, empieza el inters por encontrar modelos de procesos que asegurenla consecucin de largas secuencias de dgitos aleatorios, a partir de los cuales setomaran las muestras.

    Se puede generar resultados aleatorios con dispositivos fsicos, como extraccinde bolas, dados o ruletas. Es el mtodo que usamos en juegos y sorteos, como la lotera.Sin embargo, es muy difcil conseguir construir dispositivos que aseguren laaleatoriedad fsica perfecta y es un procedimiento lento. Las tablas de nmerosaleatorios, iniciadas por Lord Kelvin, Fisher, Yates y Kendall surgen para sustituir estosdispositivos fsicos. Este tipo de tablas puede tambin ser usado en clase con losalumnos de educacin secundaria.

    Para generar nmeros aleatorios podemos tambin usar una frmula (los llamados"nmeros pseudo-aleatorios"). Con ayuda de un algoritmo un ordenador o calculadoraproduce una secuencia numrica que puede ser empleada como aleatoria para lospropsitos prcticos. Asimismo, podemos obtener sucesiones aleatorias extradas dedistintos tipos de distribucin terica, como la distribucin normal con una cierta mediay varianza.

    Actividad 2.7. Investigar algunos algoritmos de generacin de nmeros aleatorios Cmo podrasasegurar la calidad de un algoritmo o una tabla de nmeros aleatorios? Recuerdas algunostest de aleatoriedad clsicos?

    2.2.4. Formalizacin de la Idea de AleatoriedadLos autores de las primeras tablas de nmeros aleatorios se preocuparon por

    asegurar su "calidad". Puesto que era posible obtener nmeros pseudo-aleatorios conayuda de algoritmos deterministas, deba examinarse la sucesin producida,independientemente del proceso que la genera.

    En el siglo XX varios estadsticos estudian este problema, finalizando con laformalizacin del concepto de aleatoriedad. Una idea intuitiva es que con una sucesinaleatoria es imposible inventar un mtodo que nos permita ganar en un juego de azarcuyos resultados fuesen los de la sucesin; Otra idea intuitiva es que la sucesinaleatoria como altamente irregular o compleja.

    Enfoque de los algoritmos de seleccinVon Mises comenz su estudio definiendo la poblacin o colectivo, como

    fenmeno de masas, suceso repetitivo o larga serie de observaciones, para las cuales hayrazones suficientes para creer que la frecuencia relativa de un suceso tiende a un lmitefijo.

    A partir de esta idea, considera que una secuencia de observaciones es aleatoria sila frecuencia relativa de cada posible suceso en la sucesin no vara en ninguna parte dela misma. Dicho de otra forma, en una secuencia aleatoria no puedo encontrar unalgoritmo por el cual seleccionar una subsecuencia en la cual la frecuencia relativa deuno de los resultados se vea afectada.

    Supongamos, por ejemplo, que al elegir todos los elementos pares, o cada diezelementos, o todos los elementos primos en una sucesin de caras y cruces obtenidas al

  • 17

    lanzar una moneda obtuviese una secuencia en la que la probabilidad de cara fuese 3/5.Considerara, entonces, que la secuencia dada no era realmente aleatoria, ya que podraobtener ventaja en un juego de azar apostando a favor de la cara cada dos, diez jugadas oen las jugadas nmero primo.

    Esta definicin de aleatoriedad se us para inventar contrastes de aleatoriedad quese aplicaban a las tablas de nmeros aleatorios, antes de ponerlas en uso en lacomunidad cientfica. Estos contrastes tratan de detectar las posibles regularidades de lasucesin. Sin embargo, puesto que todo contraste de hiptesis siempre lleva asociadouna posible probabilidad de error, nunca podramos tener total seguridad de que unasucesin dada, a pesar de haber pasado todas las pruebas, tuviese algn tipo de patrnque nos hubiera pasado desapercibido y, por tanto, no fuese totalmente aleatoria.Adems, en toda sucesin finita podramos tomar una subsucesin que alterase lafrecuencia de uno de los resultados, por lo que esta definicin slo vale para sucesionesinfinitas.

    Enfoque de la complejidad absoluta Otro intento de definir la aleatoriedad de una sucesin, debido a Kolmogorov, se

    basa en su complejidad. La complejidad de una sucesin es la dificultad de describirla (oalmacenarla en un ordenador) mediante un cdigo que nos permita reconstruirla mstarde. El mnimo nmero de signos necesarios para codificar esta sucesin proporcionauna escala para medir la dificultad de almacenarla, o, lo que es lo mismo, sucomplejidad. Por ejemplo, si comparamos las secuencias:

    CC++C+CC++C+C+C+C+C+

    vemos que puedo codificar mas abreviadamente la primera como CC+2+CC++,mientras que la segunda la podramos codificar como 4C+. Por lo tanto la primerasucesin es ms compleja que la segunda, ya que precisa ms signos para codificarse.

    Bajo este enfoque, una secuencia sera aleatoria si no se puede codificar en formams abreviada, por lo que la ausencia de patrones peridicos sera su caractersticaesencial. Es decir, una secuencia sera aleatoria si slo podemos describirla listando unotras otros todos sus componentes. Esta definicin establece una jerarqua en los gradosde aleatoriedad de diferentes sucesiones y la aleatoriedad perfecta sera un conceptoterico o lmite.

    Como resumen, podemos decir que el concepto de aleatoriedad se puedeinterpretar desde un punto de vista formal o informal. Desde el punto de vista informal,hablamos del azar, como patrn que explica aquellos efectos para los que no conocemosla causa o que no son predecibles. Esta interpretacin refleja muchos aspectosfilosficos epistemolgicos sociales y personales y es una importante fuente deconfrontacin entre las probabilidades subjetivas y objetivas. Desde el punto de vistaformal la idea central es la sucesin de resultados de un mismo experimento realizadorepetida e independientemente, que lleva, en su caso ms sencillo a la sucesin deensayos de Bernoulli.

    Actividad 2.8. Estudiar la complejidad de las secuencias propuestas en el tem 1 y decidir cualsera ms aleatoria en este enfoque. Generar 10 secuencias de dgitos aleatorios con lacalculadora y ordenarlas segn su complejidad de codificacin.

  • 18

    Actividad 2.9. El modelo ms simple de secuencia de resultados aleatorios es la secuencia deensayos de Bernoulli. Dar una lista de modelos aleatorios que se deducen de este tipo desecuencia. Analizar las secuencias presentadas en el tem 1, desde el punto de vista de estemodelo. Tendramos ahora argumentos para afirmar que una de las nias hace trampas?

    Actividad 2.10. Pablo juega a un juego con 16 fichas numeradas 1, 2, 3, 4,...16. Pablo pone lasfichas en una caja y la mueve con fuerza. Toma una ficha al azar y es el 7. Pone una cruz en lacasilla 7.

    1 2 3 45 5 7 x 89 10 11 1213 14 15 16

    Otros nios jugaron al mismo juego, aunque algunos hicieron trampas.

    X X x X XX x X

    x x X X x X X XxX

    X x X x x x x X

    x x X X x x

    LuisJaime

    x x X X x xx

    x X X X X x XX X

    X X X X x x X

    x x x x x XxxX

    JesusMaria

    Qu modelo aleatorio podemos aplicar a estas situaciones? Como podras justificar cuales delos nios hacen trampas? Elabora una lista de situaciones de la vida real en que el modelo quehas encontrado sea til y en donde algunas personas se interesen por resolver un problemasimilar al dado.

    2. 4. Ideas estocsticas fundamentalesAdems de la ideas bsicas de aleatoriedad hay una serie de conceptos sobre los

    cules se apoya todo el clculo de probabilidades y la estadstica. Es importanteidentificar estos conceptos, que son los que debemos ensear en los niveles nouniversitarios. Para elaborar una lista de ideas estocsticas fundamentales, analizaremosel artculo de Heitele (1975), quien se basa en el libro de Bruner "El proceso deeducacin" , publicado en 1960, que sostiene las tesis siguientes:1. El principio decisivo de instruccin en un tema es la transmisin de las ideas

    fundamentales.2. Cualquier tema puede ser enseado efectivamente en alguna forma correcta a

    cualquier nio en cualquier estado de desarrollo, lo que implica que las ideasfundamentales son una gua necesaria desde la escuela primaria a la universidad paragarantizar una cierta continuidad.

  • 19

    3. La ideas fundamentales son aquellas ideas y conceptos que se usarn en diferentesniveles cognitivos y lingsticos en una "espiral curricular".

    4. La transicin a un nivel cognitivo superior se facilita si el tema subyacente ha sidopreparado en una representacin conveniente en etapas cognitivas anteriores.

    Las ideas fundamentales proporcionan al nio modelos explicativos eficientes encada etapa de su desarrollo, que difieren en los distintos niveles cognitivos, no de unaforma estructural, sino slo de una forma lingstica y en su nivel de profundizacin.Por ejemplo, si un nio, al lanzar dos dados concede ms probabilidad al 7, porque hayms sumas con ste valor, tiene un modelo apropiado, que puede evolucionar al mscomplejo de aplicacin de la regla de Laplace, e incluso al de variable aleatoria y modade su distribucin de probabilidad. Por el contrario, si un nio al lanzar dos monedasexplica la mayor proporcin de casos "mixtos" argumentando que tras "cara" es msprobable "cruz", usa un modelo de explicacin que le satisface, pero no permitecontinuacin a un estadio ms elaborado. Se trata de una "intuicin errnea".

    En el campo de la probabilidad la intuicin juega un papel muy importante. Losmodelos intuitivos explicatorios tienen dos funciones: En una edad temprana ayudan al nio a entender su entorno por sus propios medios,

    mucho antes de que sea capaz de comprender la complejidad del modelo matemticosubyacente.

    Preparan el conocimiento analtico posterior.

    El gran nmero de paradojas estocsticas puede confundir incluso a los expertos.Por ello, es ms importante construir intuiciones correctas en este campo que en ningnotro. Como seala Feller, la intuicin estadstica puede ser entrenada incluso en losadultos, aunque si un nio adquiere "intuiciones errneas" cuando es muy pequeo, estole puede impedir mas tarde la adquisicin de un conocimiento adecuado. Por ello parecenecesario ofrecer a los nios actividades estocsticas, en forma de juegos yexperimentos en edad temprana. Sin embargo, las actividades a desarrollar no debenescogerse al azar. Es preciso un principio de organizacin, en la forma de la espiralcurricular, escalonada por las ideas fundamentales. A continuacin analizamos los 10grupos de ideas fundamentales en estocstica que propone Heitele.

    La probabilidad como normalizacin de nuestras creencias.La primera idea fundamental es asignar nmeros a los sucesos aleatorios, de

    forma que estos nmeros reflejen nuestro grado de creencia en su verificacin. En ellenguaje ordinario se usan expresiones del tipo de "casi cierto", "ms probable que",etc., para comparar los sucesos aleatorios, pero estas expresiones son poco precisas,porque diferentes personas les conceden diferente valor.

    Se normalizan estas expresiones asignndoles un valor en la escala de laprobabilidad. De este modo ponemos en correspondencia la multidimensionalidad delcomplejo mundo a nuestro alrededor con el intervalo [0,1], y se hace accesible a losdispositivos matemticos. Podemos comparar sucesos muy dispares, en base a su mayoro menor probabilidad. En la idea de probabilidad, tan sencilla, pero tan potente,encontramos un ejemplo de cmo el hombre idea modelos matemticos paracomprender y predecir la realidad.

  • 20

    Si en la idea de probabilidad (asignar nmeros a los sucesos aleatorios de modoque sean comparables) incluimos todos los procesos de clculo que llevan a asignarestos nmeros (probabilidad a priori, a posteriori, subjetivas, etc.), habremos incluidotoda la teora de la probabilidad en esta primera idea. No obstante, en el estudio quehemos hecho con anterioridad, vemos que, a pesar de su aparente simplicidad, esta ideano est libre de controversias.

    Actividad 2.11. Se toman 3 fichas de la misma forma y tamao, de las cuales una es roja porambas caras; otra es azul por una cara y roja por la otra, y la tercera es azul por las dos caras.El profesor coloca las tres fichas en una caja, que agita convenientemente, antes de seleccionaruna de las tres fichas, al azar. Muestra, a continuacin, una de las caras de la ficha elegida,manteniendo la otra tapada, pidiendo a sus alumnos que adivinen el color de la cara oculta. Unavez hechas las apuestas, el profesor muestra la cara oculta. Cada alumno que haya acertado en laprediccin efectuada, consigue un punto. Se trata de buscar la mejor estrategia en este juego.Qu tipo de razonamiento has dado (o daras) para validar que tu estrategia es la ptima? Esigualmente vlido el argumento que se basa en la experimentacin que el basado enconsideraciones lgicas y combinatorias? Podras probar que tu estrategia es la mejor, slo conla experimentacin?

    Actividad 2.12. A partir de las noticias en la prensa del ltimo Domingo, elaborar una lista desucesos que podran ocurrir (o no) durante el mes en curso. Asignar un valor de probabilidad acada uno de estos sucesos. Revisar las probabilidades iniciales, al cabo de una semana, indicandolas posibles informaciones que han influido en los cambios de asignacin de probabilidades.

    El espacio muestral como conjunto de todas las posibilidadesNo menos fundamental es la idea debida a Kolmogorov de asignar un espacio

    muestral de sucesos observables a cada experimento aleatorio y representar los sucesosobservables como subjconjuntos del espacio muestral, dando una interpretacinprobabilstica a las operaciones con sucesos. Es decir, inventariar todos los posiblesucesos elementales asignados a un experimento, considerarlo como un conjunto dereferencia o universal y aplicar toda la potencia del lgebra de conjuntos para poderdefinir los dems sucesos, a partir de los sucesos elementales

    Esta idea permiti axiomatizar la probabilidad, como medida normada aditiva,sobre el lgebra de conjuntos, puesto que las operaciones en este lgebra de conjuntospermitan definir operaciones sobre la misma probabilidad. Puesto que todo sucesoelemental forma parte del conjunto de referencia, se dota de sentido al muestreo, ya queal observar repetidamente una serie de repeticiones del experimento, siempreobservaremos elementos del espacio muestral.

    Por otro lado, si un subconjunto est incluido en un conjunto mayor, laprobabilidad del primero es menor que la del segundo. Esta propiedad permite, desde laescuela elemental realizar actividades de probabilidad comparativa, incluso sincuantificacin.

    El inventariar todos los posibles resultados del experimento tiene, sin embargo, aveces dificultades para los nios que no han alcanzado un nivel de razonamientocombinatorio suficiente. La dificultad est en que hay que considerar no slo el sucesoque ha ocurrido realmente o incluso el suceso de inters sino todos los sucesos que

  • 21

    podran ocurrir. En la investigacin del desarrollo del concepto de azar se ha mostradoque los nios, como algunos adultos supersticiosos estn confinados estrechamente aldeterminismo: Creen en fuerzas ocultas que expliquen los fenmenos aleatorios.Fischbein y Cohen explican esto por que se concentran en un slo suceso, en lugar dehacerlo sobre la totalidad.

    Actividad 2.13. Ruletas no transitivas: Supongamos que tenemos tres ruletas. Con la primerasiempre obtenemos el nmero 3. Con la segunda obtenemos el nmero 1 con probabilidad 0.52 yel nmero 5 con probabilidad 0.48. Con la tercera obtenemos el nmero 0 con probabilidad 0.25y el nmero 4 con probabilidad 0.75.Jugamos a un juego en el que dos jugadores eligen una ruleta cada uno y gana aqul que consigael nmero mayor al girar la ruleta. Cul jugador tiene ventaja, el que elige la ruleta en primer osegundo lugar?

    Regla de adicin de probabilidades Una regla general en matemticas es construir modelos complejos a partir de

    otros ms simples. Aunque las probabilidades pueden asignarse fcilmente en espaciosmuestrales sencillos, la regla de Laplace es difcil de aplicar directamente en casos mscomplejos, como obtener tres nmeros iguales al lanzar 3 dados.

    La regla de adicin permite obtener este tipo de probabilidades. Consiste encalcular la probabilidad de un suceso compuesto calculando por separado laprobabilidad de cada uno de los sucesos simples que la componen y luego sumandoestas probabilidades. Otra aplicacin de esta regla sera calcular la probabilidad delsuceso contrario a uno dado. La regla de adicin se generaliza posteriormente aconjuntos infinitos, por ejemplo en las distribuciones de probabilidad geomtrica o enlas distribuciones continuas. Vemos por tanto que esta idea puede aprenderse a diversosniveles de profundidad y que el aprendizaje temprano para casos finitos prepara lacomprensin del caso general.

    Independencia y regla del productoLa caracterstica de la Matemtica en general y de la estocstica en particular de

    composicin y descomposicin de modelos, se distingue ms claramente si los mismosexperimentos aleatorios se combinan entre s y se asignan probabilidades a losexperimentos compuestos. El producto cartesiano permite construir el espacio muestraldel experimento compuesto. De nuevo vemos como a partir de la idea de experimentosimple pasamos a la de experimento compuesto y posteriormente a la idea de procesoestocstico en tiempo discreto (ms tarde al proceso estocstico en tiempo continuo).

    En todos estos modelos es fundamental, en primer lugar, el concepto deprobabilidad condicional como medida de como cambia nuestro grado de creencia conla nueva informacin. Esta idea de probabilidad condicional ser utilizada con muchafrecuencia en inferencia y otros mtodos estadsticos, como en el estudio de laasociacin entre variables.

    Ms importante an en la definicin de los experimentos compuestos y en elclculo de probabilidades es la idea de independencia. Aunque matemticamente la ideade independencia puede deducirse de la regla del producto de probabilidades y serelaciona con la de probabilidad condicional, desde un punto de vista didctico merece

  • 22

    un anlisis independiente. Por un lado, mientras que la definicin de independencia desucesos de un mismo experimento se entiende con facilidad cuando se usa la regla deproducto, es ms complejo de explicar cuando se trata de independencia de sucesos dedistintos experimentos, porque en este caso, tenemos que identificar con claridad queentendemos por la interseccin de los sucesos intervinientes en la frmula del producto.

    Por otro lado, la idea de que un experimento aleatorio se puede repetir en lasmismas condiciones y que los resultados de cada experimento son independientes es unbuen ejemplo de la diferencia que hay entre entender un modelo terico y saber aplicarloen una situacin concreta. Por un lado, el modelo matemtico de la independencia,expresado por la regla del producto es fcil de entender. Por otro, ocurre que en la vidacotidiana mucha gente, incluso cientficos, no son capaces de aplicar esta ideaconsecuentemente en las situaciones prcticas.

    Actividad 2.14. Monedas dependientes. Una bolsa contiene 7 monedas de 100p, 50p, 50p, 50p,10p, 10p, 10p. Sacamos dos monedas al azar. Cul es el valor esperado de su suma? Dependeeste valor esperado de si la primera moneda es o no reemplazada? Por qu?

    Actividad 2.15. Paradoja de Blythe. Tenemos tres ruletas: La primera siempre da como resultadoel nmero 3. La segunda da como resultado 2 con probabilidad 0.51, 4 con probabilidad 0.29 y 6con probabilidad 0.20. La tercera da como resultados 1 con probabilidad 0.52 y 5 conprobabilidad 0.48. Si cada uno de dos jugadores tiene que elegir una ruleta, y gana el queobtenga el nmero mayor, cual es la mejor eleccin para el primer jugador? Cambie estaeleccin si son tres los jugadores?

    Equidistribucin y simetraLas cuatro primeras ideas fundamentales no dan reglas prcticas de cmo calcular

    las probabilidades. Es una idea estratgica descubrir y usar las simetras fsicas o de otrotipo en las situaciones problemticas, para decidir que ninguno de los resultadosposibles tiene mayor ventaja que el resto y que, por lo tanto, podemos asignarles lamisma probabilidad. Una vez que se acepta esta conclusin, a partir de los axiomas sellega con facilidad al clculo de las probabilidades de los sucesos elementales en losespacios muestrales finitos.

    Por ejemplo, al lanzar un dado, la simetra supone que ninguna cara se distinguede las dems. Esto es tomado como argumento para aceptar la igualdad de probabilidadde cada resultados y llegar a la regla de Laplace, que nos permite asignar unaprobabilidad de 1/6 a cada uno de los resultados posibles. Una vez calculadas estasprobabilidades elementales, podremos calcular la probabilidad de sucesos mscomplejos como obtener un nmero par o obtener una suma par al lanzar 2 o 3 dados.

    Hay que recalcar que la equidistribucin (igualdad de probabilidad) de los sucesoselementales de un experimento no puede ser separada de la simetra estadstica, es decir,la simetra confirmada por los registros estadsticos de resultados del experimento. Elque un dado u otro dispositivo generador de resultados aleatorios cumpla lascondiciones de simetra no es un hecho que pueda deducirse de la teora matemtica,sino de la experiencia. De hecho, se han establecido algunos principios, como que lasimetra fsica implica la simetra estadstica, aunque este principio es insuficiente,puesto que, aunque el dado est bien construido, podra haber un sesgo en el jugador que

  • 23

    lo lanza. En muchas situaciones, es la hiptesis ms adecuada, pero slo puede sercontrastada a posteriori, por medio de la adecuacin del modelo.

    Parece ser que la idea de simetra es difcil de ensear a los nios, por ste motivoy porque los nios tienen creencias sobre que algunos resultados son ms fciles queotros, a pesar de la simetra fsica. Slo con el trabajo repetido de ejemplos de diversosmateriales simtricos y no simtricos se ir desarrollando esta idea.

    CombinatoriaEl utilizar tcnicas de recuento para calcular el nmero de elementos favorables y

    desfavorables a un suceso y usar estos nmeros para calcular las probabilidades es otraidea fundamental, sobre todo en el clculo de probabilidades complejas. Sin embargo, esdemasiado simple considerar la combinatoria tan slo como auxiliar de la probabilidad,como puede parecer a la vista de su estructura matemtica. La extraccin al azar de unaurna de tres objetos entre cuatro posibles es un experimento aleatorio en tres fases, quepuede ser interpretado significativamente en el espacio muestral de las variaciones V4,3.Adems las operaciones combinatorias pueden definirse, mediante experimentosaleatorios (extraccin con o sin reemplazamiento, ordenada o no ordenada). Estaconexin entre los experimentos compuestos y la combinatoria se clarifica con el uso dediagramas en rbol.

    El diagrama en rbol es una representacin icnica fundamental, porque visualizala estructura multi-paso del experimento compuesto. Por ello, las operacionescombinatorias, ms que ser algoritmos de clculo de probabilidades en espaciosprobabilsticos complejos, proporcionan una interpretacin clara de la estructura interiorde los experimentos y el encadenamiento de sucesivos experimentos en un complejomayor.

    Este punto de vista es soportado por los resultados de psicologa del desarrollo, enparticular por los trabajos de Piaget, quien sostiene que el camino de la comprensin delos fenmenos de azar pasa por el de las operaciones combinatorias bsicas. Adems lasoperaciones combinatorias son un componente fundamental de pensamiento formal queopera mediante combinaciones de las posibilidades que descubre. Finalmente sealamosla presencia de las operaciones combinatorias en las definiciones de las distribucionesde probabilidad discreta, as como en el estudio de los procesos estocsticos discretos.

    Actividad 2.16. Las operaciones combinatorias se pueden definir mediante un modelo de muestreoo seleccin. Analizar los tipos diferentes de problemas que podemos tener segn la seleccin sea ono ordenada y si se permite el reemplazamiento. Proponer un problema combinatorio de cadauno de estos tipos.

    Actividad 2.17. Otros problemas combinatorios se refieren a la colocacin de una serie de nobjetos en m celdas, como en el tem siguiente:Disponemos de tres cartas iguales. Deseamos colocarlas en cuatro sobres de diferentes colores:amarillo, blanco, crema y dorado. Si cada sobre slo puede contener, a lo sumo, una carta. Decuntas formas podemos colocar las tres cartas en los cuatro sobres diferentes? Ejemplo:podemos colocar una carta en el sobre amarillo, otra en el blanco y otra en el crema.Analizar los diferentes tipos de problema que podemos generar en el modelo de colocacin,proponiendo ejemplo de enunciados. Es cada problema de colocacin directamente traducible a

  • 24

    un problema de seleccin?

    Actividad 2. 18. Otro tipo de problema combinatorio es el de particin de un conjunto en partes.Por ejemplo, De cuantas formas diferentes puede descomponerse el nmero 5 en sumandos?Analizar los diferentes tipos de problemas de particin y estudiar su posible equivalente con losproblemas de seleccin y colocacin.

    Modelos de urnas y simulacinLa palabra clave "simulacin" en estadstica significa algo parecido al

    isomorfismo en otras ramas de las matemticas. Consiste en poner en correspondenciados experimentos aleatorios diferentes. La condicin es que a cada suceso elemental delprimer experimento le corresponda un suceso elemental del segundo y slo uno, deforma que los sucesos puestos en correspondencia en ambos experimentos seanequiprobables. Un ejemplo sera simular el experimento aleatorio consistente enobservar el sexo de un recin nacido por el experimento aleatorio consistente en lanzaruna moneda al aire.

    Lo importante de la simulacin es que podemos operar y observar resultados delsegundo experimento y utilizarlos para obtener informacin del primero. Por ejemplo, siqueremos saber cual es la probabilidad que entre 100 recin nacidos hay ms de un 60%de varones, podemos lanzar, por ejemplo 1000 veces 100 monedas al aire, estudiar encada uno de los 1000 experimentos si hubo o no ms de un 60% de nacimientos yobtener una estimacin para la probabilidad pedida. La ventaja de la simulacin esobvia, incluso en este ejemplo tan sencillo, pues permite condensar el experimento enun tiempo y espacio concreto.

    Otro hecho importante es que, en principio es posible asignar un modelo de urnas(el experimento consistente en extraer al azar una bola de una urna con una ciertacomposicin de bolas de colores) a la mayor parte de experimentos aleatorios, al menosa aquellos con espacio muestral numerable. Adems, no slo el experimento originalpueden componerse para formar nuevos experimentos, sino tambin los modelos deurnas asociados. Esto permite, como ha mostrado Polya, simular procesos aleatorioscomplejos mediante una secuencia de extracciones de bolas en urnas.

    Por otro lado, la idea de la urna es fundamental, ya que en estocstica hay unospocos conceptos firmemente enraizados que desafan toda definicin rigurosa, como"muestreo al azar", que slo pueden ser descritos concretizndolos en un modelo deurnas.

    La variable aleatoriaLa idea de variable aleatoria ha sido responsable de las mltiples aplicaciones

    actuales del clculo de probabilidades, puesto que el clculo de probabilidades pas deocuparse del estudio de la probabilidad de sucesos aislados al estudio de lasdistribuciones de probabilidad (y posteriormente al de los procesos estocsticos). Lavariable aleatoria y su distribucin, as como el estudio de las familias de distribucionesy sus propiedades son una herramienta muy potente, porque permite trabajar con elaparato del anlisis matemtico. Hay seria razones que justifican por qu losmatemticos pasados, que no conocan esta idea, tuvieron serios problemas con diversasparadojas matemticas y, por ejemplo, Bernouilli necesitara 20 aos para descubrir y

  • 25

    probar su ley dbil de los grandes nmeros, temas que hoy se explica en unas pocaslneas.

    Desde el punto de vista elemental, manejamos intuitivamente la idea de variablealeatoria cuando nos encontramos con juegos y experimentos en los que usamos dados,monedas, etc. As mismo tenemos experiencias cotidianas con variables aleatoriascontinuas, como el tiempo de espera del autobs, o el necesario para llegar de nuestracasa al trabajo. Por el refuerzo de las mltiples, a veces inconscientes, experiencias convariables aleatorias en la vida cotidiana, la intuicin de la magnitud aleatoria y de valoresperado, a veces aparece antes que la de probabilidad.

    Por ejemplo, algunos psiclogos sostienen que la habilidad para estimar laesperanza matemtica de las variables aleatorias es puramente biolgica; mediante laexperiencia llegamos a estimar el tiempo medio que tardaremos en preparar la comida oarreglarnos, lo que gastaremos en promedio al hacer la compra. En un plano formal, laesperanza matemtica se interpreta como la media aritmtica de los valores de unavariable aleatoria, si el experimento se repitiese suficientemente en idntica condiciones.

    En el modelo de variable aleatoria hay tres conceptos bsicos: su distribucin,media y varianza. Mientras que la idea de media (esperanza matemtica) es muyintuitiva, lo es menos la idea de distribucin, especialmente cuando unos valores sonms probables que otros. Para los nios pequeos, todas las variables aleatorias, tienenen principio distribucin uniforme. Esto plantea el dilema de si debera restringirse laenseanza o no a este tipo de variable.

    Sea cual sea la respuesta, no debe negarse el hecho de que la distribucin normaltenga una parte fundamental para explicar el mundo que nos rodea, ya que laencontramos en muchos fenmenos fsicos, psicolgicos o de otro tipo. Un modelomatemtico convincente para explicar la presencia de la distribucin normal en tantosfenmenos es el teorema central del lmite que, por otra parte, no es accesible en suforma deductiva en ningn nivel por debajo de la universidad. Esto no excluye que seainteresante con los alumnos de secundaria considerar alguna aproximacin intuitiva yexperimental-inductiva, por ejemplo, usando el aparato de Galton u otro dispositivo desimulacin.

    Las leyes de los grandes nmerosLa convergencia estocstica hace posible el estudio de los fenmenos aleatorios en

    su conjunto, ya que individualmente son impredecibles. Para analizar la dificultad decomprensin de la convergencia, hay que distinguir entre las leyes empricas de losgrandes nmeros (la que se observa al recoger datos estadsticos sobre un ciertofenmeno) y las correspondientes leyes matemtica deducidas en forma de teoremas pordiferentes probabilistas y que pueden ser demostradas formalmente.

    La convergencia emprica es observable en la realidad, por ejemplo, al observarlas gotas de lluvia sobre un pavimento, o la proporcin de recin nacidos varones en unhospital a lo largo del ao. Es filosficamente interesante que una regularidad globalsurja de la variabilidad local, que parece inherente al curso de la naturaleza "libertadindividual bajo restricciones colectivas". Esta convergencia emprica hace que lascorrespondientes leyes matemticas de los grandes nmeros se justifiquen como un buenmodelo para los fenmenos aleatorios, aunque no contesta la pregunta de si es posible

  • 26

    que los alumnos sean capaces de diferenciar entre el modelo y realidad, ya que de hechovemos que con frecuencia se espera una convergencia emprica demasiado rpida odemasiado exacta.

    Las oportunidades didcticas de experiencias empricas sobre la convergenciaseran deseables desde la escuela, para preparar la comprensin posterior de losteoremas matemticos.

    Sin embargo, estas oportunidades son ms restringidas de lo que nos dicen lostextos escolares. Las sucesiones aleatorias obtenidas en clase convergen lentamente y aveces fallan, cuando se precisan para una demostracin, lo que puede sercontraproducente.

    Muestreo La ltima idea fundamental es la de muestra que nos introduce en la inferencia y

    establece otro nuevo puente entre estadstica y probabilidad. Esta idea es muyimportante porque todo nuestro conocimiento y juicios sobre el mundo o las personasestn basado en el muestreo. El conocimiento cientfico se adquiere a partir de lasexperiencias empricas y estas son siempre limitadas, por lo que las conclusiones debenser ms amplia de los datos que obtenemos en las observaciones. La idea de muestratiene en si dos caractersticas contradictorias: representatividad y variabilidad. Larepresentatividad nos indica que la muestra se parece, en cierto modo a la poblacin ydebe ser una caracterstica importante, ya que un prejuicio es slo juicio basado en unamuestra no representativa.

    Por otro lado, la variabilidad indica que una muestra puede ser diferente de otra,por lo que al enjuiciar, pensar e inferir slo es posible a base de muestras, la gentedebera ser cauta y crtica al argumentar. Al igual que un estadstico profesional, todo elmundo debiera considerar el muestreo como modelo para explicar la realidad y entenderla naturaleza estadstica de sus conclusiones en cada caso particular, y las consecuenciasde una decisin equivocada.

    2.5. Anlisis exploratorio de datosHasta los comienzos del siglo XX la estadstica se restringa a la estadstica

    descriptiva, que, a pesar de sus limitaciones, hizo grandes aportaciones al desarrollo delas ciencias experimentales. A partir de esa poca, comenzara la inferencia estadsticaclsica, con los trabajos de Fisher, Pearson y sus colaboradores y progresivamente seincorporara la aportacin de la escuela bayesiana.

    Cabri (1994) seala que los avances del clculo de probabilidades llevaron a lacreacin de la estadstica terica, que en cierto modo, se alej de las ideas estadsticasprimitivas centradas en el anlisis y recogida de datos. De este modo, en los aos 60, lamayor parte de los libros de texto se ocupaban especialmente de los modelosinferenciales clsicos o bayesianos con respecto a conjunto simple de datos y hubo unatendencia a la matematizacin, junto con un descuido en la enseanza de los aspectosprcticos del anlisis de datos.

    Con el desarrollo espectacular de la informtica en la segunda mitad del siglo XXy la posibilidad de manejar rpidamente grandes masas de datos, se produjo, por unlado, una reaccin ante tanta matematizacin, y por otro, disminuy la importancia delos estudios muestrales.

  • 27

    Puesto que era fcil analizar grandes muestras ya no haba por qu limitarse a losmtodos estadsticos basados en distribuciones conocidas, cuya principal aplicacin eranlas pequeas muestras. Tampoco haba por qu restringirse a analizar una o unas pocasvariables, porque el tiempo d