PD_01_EB_270511.pdf

download PD_01_EB_270511.pdf

of 43

Transcript of PD_01_EB_270511.pdf

  • 7/22/2019 PD_01_EB_270511.pdf

    1/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 1

    Primer cuatrimestre

    Programa de la asignatura:

    Estadstica bsica

    Clave:

    ESADNoviembre, 2010

  • 7/22/2019 PD_01_EB_270511.pdf

    2/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 2

    ndice

    I. Informacin general de la asignatura 3

    A. Ficha de identificacinB. DescripcinC. Propsito

    II. Competencia a desarrollar 5

    III. Temario 5

    IV. Metodologa de trabajo 6

    V. Evaluacin 7

    VI. Material de apoyo 8

    VII. Desarrollo de contenidos por unidad 9

    Unidad 1. Fundamentos de estadstica 9

    Unidad 2. Representacin numrica y grfica de datos 21

    Unidad 3. Medidas de tendencia central y dispersin 34

  • 7/22/2019 PD_01_EB_270511.pdf

    3/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 3

    I. Informacin general de la asignatura

    A. Ficha de identificacin

    Nombre de la Licenciatura o Ingeniera: Tronco comn

    Nombre del curso o asignatura Estadstica bsica

    Clave de asignatura:

    Seriacin: Sin seriacin

    Cuatrimestre: Primero

    Horas contempladas: 90

    B. Descripcin

    En un mundo cada vez ms competitivo, tanto en las reas comerciales, financieras,tecnolgicas y cientficas, y donde invariablemente el flujo de informacin es mayor a cadamomento, se hace indispensable no slo la correcta descripcin de los datos sino tambin suanlisis e interpretacin. Es aqu donde la estadstica juega un papel preponderante, al ser unade las herramientas ms poderosas para comprender la variabilidad inherente a los datosobservados y se constituye como la mejor herramienta para la toma de decisiones.

    La diversidad de conocimientos, habilidades, actitudes, creencias y valores, requeridos en cadauna de las carreras que ofrece la ESAD, hace necesaria la conformacin de un tronco bsicoque, por un lado, garantice la formacin integral en los atributos generales deseables de losestudiantes, y por el otro, derive, de manera natural, en los atributos particulares necesariospara cada disciplina de estudio.

    El tronco bsico se conforma de varias asignaturas comunes que promueven, por un lado, laformacin integral de los estudiantes, integrando asignaturas de distintas reas delconocimiento, y por otro lado, desarrollan en el estudiante competencias transversales

    necesarias para la investigacin, el anlisis crtico, el manejo y la sistematizacin deinformacin y datos, as como una serie de valores que le permitan conducirse con tica yresponsabilidad durante su trayectoria acadmica y su desempeo profesional.

    Las materias que forman el tronco bsico son: Contexto socioeconmico de Mxico, Desarrollohumano, Estadstica bsica y Fundamentos de investigacin; estas materias a simple vistaparecen desarticuladas, pero se interrelacionan para contribuir a la formacin integral de losestudiantes.

  • 7/22/2019 PD_01_EB_270511.pdf

    4/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 4

    En relacin al tronco bsico la asignatura Estadstica bsica tiene varios propsitos, puespretende despertar en el estudiante el inters por la investigacin para la toma de decisiones, lasolucin de problemas y el anlisis de situaciones y eventos relacionados con el entornoacadmico, profesional, personal y social, rigindose en todo momento por un cdigo de ticaprofesional y personal.

    Los propsitos de la asignatura en relacin al tronco bsico son que los estudiantes:

    1. Adquieran la capacidad de lectura e interpretacin de tablas y grficos estadsticos quecon frecuencia aparecen en diferentes medios.

    2. Lleguen a comprender y apreciar el papel de la estadstica en la sociedad, incluyendosus diferentes campos de aplicacin y el modo en que la estadstica ha contribuido a su

    desarrollo.3. Identifiquen, dentro del contexto socioeconmico mexicano, la importancia y utilidad de

    los anlisis estadsticos para la toma de decisiones.4. Se conduzcan de manera tica y responsable en el manejo y anlisis de la informacin.

    De manera particular, la materia pone especial nfasis en el enfoque prctico del material y loscontenidos que se presentan, tratando siempre de relacionar los conceptos, tcnicas y casos deestudio con el quehacer cotidiano de las diferentes disciplinas, esperando despertar en losestudiantes el deseo de adentrarse cada vez ms a la teora de la probabilidad y estadstica, alver lo importante que resulta su utilizacin en las diferentes reas de trabajo.

    La asignatura consta de cuatro unidades. En la primera unidad se estudian los fundamentos dela estadstica, en la segunda las tcnicas para representacin grfica y numrica de datos, en latercera se abordan los conceptos bsicos de la teora de probabilidad como una medida delriesgo frente a la incertidumbre en experimentos aleatorios y la ltima unidad presenta elconcepto de variables aleatorias y los modelos de probabilidad Binomial, Poisson y Normal.

    C. Propsito

    La asignatura tiene como propsito introducir al estudiante con los conceptos y tcnicas bsicas

    de la estadstica aplicada a la licenciatura e ingeniera. El curso tiene un nivel matemticoelemental, con la intencin de que el estudiante comprenda la metodologa y su aplicacin, y notanto la teora matemtica detrs de ella.

  • 7/22/2019 PD_01_EB_270511.pdf

    5/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 5

    II. Competencia a desarrollar

    2.1. Competencia general

    Utiliza la estadstica descriptiva para el anlisis de informacin a travs de la recoleccin,representacin y la descripcin de datos.

    III. Temario

    1. Fundamentos de la estadstica

    1.1. Introduccin a la estadstica1.1.1. Divisin de la estadstica

    1.2. Conceptos bsicos e importancia de estadstica1.2.1. Poblacin1.2.2. Individuo1.2.3. Muestra1.2.4. Muestreo1.2.5. Dato1.2.6. Variable1.2.7. Solucin de un problema estadstico

    1.3. Muestreo aleatorio1.3.1. Conceptos bsicos de muestreo aleatorio1.3.2. Metodologa del muestreo aleatorio simple

    2. Representacin numrica y grfica de datos

    2.1. Organizacin de datos y distribucin de frecuencias2.1.1. Frecuencias2.1.2. Intervalos2.1.3. Construccin de intervalos de clase2.1.4. Tablas de datos2.1.5. Tablas de frecuencias2.1.6. Tablas por intervalos de clase2.1.7. Tablas de doble entrada

    2.2. Representacin grfica de datos2.2.1. Histograma2.2.2. Grfica de barras2.2.3. Grfica de lneas

  • 7/22/2019 PD_01_EB_270511.pdf

    6/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 6

    2.2.4. Grfica de rea o de pastel

    3. Medidas de tendencia central y dispersin

    3.1. Medidas de tendencia central3.1.1. Media aritmtica3.1.2. Mediana3.1.3. Moda

    3.2. Medidas de dispersin3.2.1. Recorrido3.2.2. Varianza3.2.3. Desviacin tpica o estndar

    IV. Metodologa de Trabajo

    Para el logro de la competencia, es fundamental que los conceptos y procedimientospresentados se ejerciten todo el tiempo, pues esperamos que los contenidos no slo secomprendan sino que se apliquen en la solucin de problemas que tengan que ver consituaciones que los estudiantes pueden enfrentar en su trayectoria acadmica y profesional.

    Por lo anterior, las estrategias metodolgicas de enseanza-aprendizaje son, por un lado, el

    planteamiento de ejercicios y problemas tipo, de cada uno de los procedimientos que seabordan durante el curso, esto con el objetivo de que los estudiantes ejerciten en el uso,aplicacin y manejo de formulas y contenidos procedimentales. Por otro lado, los facilitadoresde la asignatura tendrn que orientar la aplicacin de cada uno de estos procedimientos a lasreas especficas de inters de los estudiantes; es decir, dentro de la asignatura se trabajan loscontenidos de manera aislada y los facilitadores tendrn que ejemplificar y presentar casos ysituaciones aplicables en las diferentes carreras, que complementen los ejercicios que se estnplanteando.

    Como estrategia de evaluacin se utiliza un proyecto integrador, donde el estudiante haga usode todo lo que se trabaj en el curso. A lo largo del curso, se les presentarn a los estudiantes

    varias autoevaluaciones de carcter ldico, esto con el fin de que puedan observar e identificarcules son sus avances y las dificultades que presentan en el aprendizaje de los temas.

    Estas autoevaluaciones contarn con una retroalimentacin que sirva para reforzar los temasque se evalan.

    El facilitador juega un papel muy importante dentro del curso, pues se espera que sea quiendirija y oriente todo el proceso de aprendizaje.

  • 7/22/2019 PD_01_EB_270511.pdf

    7/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 7

    Deber disear estrategias que propicien un aprendizaje verdaderamente significativo,facilitando la comprensin del contenido y relacionando ste con los conocimientos previos delestudiante as como con sus reas especficas de estudio, a travs del estudio casos yproblemas relacionados con el hacer cotidiano donde los estudiantes puedan aplicar y ejercitarlo aprendido. Adems de ser quien oriente las discusiones y sesiones de trabajo que seplantean en los espacios de aprendizaje colaborativo.

    V. Evaluacin

    En el marco del Programa de la ESAD, la evaluacin se conceptualiza como un procesoparticipativo, sistemtico y ordenado que inicia desde el momento en que el estudiante ingresa

    al aula virtual. Por lo que se le considera desde un enfoque integral y continuo.

    Por lo anterior, para aprobar la asignatura, se espera la participacin responsable y activa delestudiante as como una comunicacin estrecha con su facilitador para que pueda evaluarobjetivamente su desempeo. Para lo cual es necesaria la recoleccin de evidencias quepermitan apreciar el proceso de aprendizaje de contenidos: declarativos, procedimentales yactitudinales.

    En este contexto la evaluacin es parte del proceso de aprendizaje, en el que laretroalimentacin permanente es fundamental para promover el aprendizaje significativo yreconocer el esfuerzo. Es requisito indispensable la entrega oportuna de cada una de lastareas, actividades y evidencias as como la participacin en foros y dems actividadesprogramadas en cada una de las unidades, y conforme a las indicaciones dadas. La calificacinse asignar de acuerdo con la rbrica establecida para cada actividad, por lo que es importanteque el estudiante la revise antes realizarla.

    A lo largo de la asignatura encontrars autoevaluaciones, que te servirn de ejercitacin y

    prctica, su realizacin te preparar para resolver el examen final de la asignatura. Dichoexamen se presenta al concluir el estudio de todas las unidades temticas que integran laasignatura.

    A continuacin presentamos el esquema general de evaluacin.

  • 7/22/2019 PD_01_EB_270511.pdf

    8/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 8

    Esquema de Evaluacin

    Foros y base de datos 10%

    Taller y tareas 30%

    E-portafolio. 50%Evidencias 40%

    Autorreflexiones 10%

    Examen final 10%

    Calificacin Final 100%

    Cabe sealar que para aprobar la asignatura, se debe de obtener la calificacin mnimaindicada por la ESAD.

    VI. Material de apoyo

    Bibliografa bsica:

    Douglas C. Montgomery, George C. Runger (2007). Probabilidad y Estadstica aplicadas

    a la ingeniera. Cuarta Edicin. Mxico: McGraw-Hill. Walpole Ronald E., Myers Raymond H. (2007). Probabilidad y Estadstica para

    Ingenieros.Octava Edicin. Mxico: Editorial Pearson.

    Bibliografa complementaria:

    Wackerly Dennis D., Mendenhall William III, Scheaffer, Richard L. (2010). EstadsticaMatemtica con Aplicaciones. Sptima Edicin. Mxico: Cengage Learning.

    Ferris Ritchey. (2008). Estadstica aplicada a las ciencias sociales. Segunda Edicin.Mxico: Mc Graw Hill.

    Douglas L., William M., Samuel W. (2008). Estadstica aplicada a los negocios y laeconoma. Decimotercera Edicin. Mxico: Mc Graw Hill.

    Castillo Manrique, Isabel (2006). Estadstica descriptiva y clculo de probabilidades,Primera Edicin. Pearson Education de Mxico.

  • 7/22/2019 PD_01_EB_270511.pdf

    9/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 9

    VII. Desarrollo de contenidos por unidad

    Unidad 1. Fundamentos de la estadstica

    Propsitos

    En esta unidad: Identificars los conceptos bsicos relacionados con la Estadstica. Reconocers la utilidad e importancia de la Estadstica. Aplicars el procedimiento para obtener una muestra aleatoria simple.

    Competencia especfica

    Aplica la metodologa estadstica para obtener informacin de una muestra aleatoria simple,identificando los elementos que intervienen en un problema estadstico.Introduccin

    La palabra estadstica a menudo te remite a grficas y tablas; cifras relativas a nacimientos,muertes, impuestos, demografa, ingresos, deudas, crditos, etc. No obstante, para aprovecharlas herramientas de anlisis estadstico, es necesario comprender qu representa cadaconcepto y la metodologa mediante la cual se obtiene un dato estadstico.

  • 7/22/2019 PD_01_EB_270511.pdf

    10/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 10

    En esta unidad se hablar sobre la importancia de la estadstica, conocers sus conceptosbsicos, as como la metodologa del muestreo para que al final, obtengas una muestraaleatoria simple.

    1.1. Introduccin a la estadstica

    La estadstica es la ciencia cuyo objetivo es reunir informacin cuantitativa relacionada aindividuos, grupos, series de hechos, entre otros. Gracias al anlisis de estos datos se puedendeducir algunos significados precisos o algunas previsiones para el futuro. La estadstica, engeneral, es la ciencia que trata la recopilacin, la organizacin, la presentacin, el anlisis y lainterpretacin de datos numricos con el fin de realizar una toma de decisiones ms efectiva.

    Los estudiantes confunden comnmente los dems trminos asociados con las Estadsticas,una confusin que es conveniente aclarar debido a que esta palabra tiene tres significados: lapalabra estadstica, en primer trmino se usa para referirse a la informacin estadsticadescripcin de parmetros; tambin se utiliza para referirse al conjunto de tcnicas y mtodos

    que se utilizan para analizar la informacin estadstica; y el trmino estadstico, en singular y enmasculino, se refiere a una medida derivada de una muestra.

    Utilidad e importancia

    La estadstica resulta muy til no slo para recopilar y describir datos, sino tambin parainterpretar la informacin obtenida, que puede ser aprovechada para demostrar la evolucin deun fenmeno a travs de cierto tiempo.

    En Mxico, el Instituto Nacional de Estadstica y Geografa (INEGI) se encarga de recabarinformacin estadstica y geogrfica de todo el pas, en diferentes reas y contextos. Los datosque publica sirven para dar a conocer a cualquier persona la situacin en la que se encuentra elrea de donde se obtuvo la informacin.

    Los mtodos estadsticos se utilizan prcticamente en investigaciones de todas las reas deconocimiento; tanto en el mbito acadmico, como en el profesional y laboral, en todos ellos la

    finalidad es poder resolver un problema - entendiendo que unproblemaqueda definido como ladiferencia entre lo real y lo deseado, en donde la estadstica muestra a la realidad para que elinvestigador pueda analizar sus deseos y con ello tomar una decisin.

    1.1.1. Divisin de la estadstica

    La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la EstadsticaDescriptiva y la Inferencial.

  • 7/22/2019 PD_01_EB_270511.pdf

    11/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 11

    Estadstica Descriptiva: La funcin descriptiva de la estadstica se enfoca en lapresentacin y clasificacin de los datos obtenidos de la poblacin que se analiza.

    Estadstica Inferencial: Esta aplicacin de la estadstica busca plantear y resolverproblemas especficos y/o hacer previsiones a partir de los datos de una muestra, dadoque es muy difcil estudiar a la poblacin completa.

    La estadstica descriptivadescribe datos. La estadstica inferencialinfiere con esosdatos, entendiendo inferir como laestimacin de un resultado.

    1.2. Conceptos bsicos e importancia de la estadstica

    1.2.1. Poblacin

    Conjunto de todos los elementos que permiten resolver un problema y que presentan una

    caracterstica comn determinada, observable y medible. Por ejemplo, si el elemento es unapersona, se pueden estudiar las caractersticas edad, peso, nacionalidad, sexo, etc. Loselementos que integran una poblacin pueden corresponder a personas, objetos o grupos (porejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.).

    1.2.2. Individuo

    Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin.Nota que un individuo en estadstica puede ser distinto a un individuo como persona. Porejemplo, en los censos econmicos se obtienen datos de los negocios. En este caso cada

    negocio, que est formado por varias personas, es un individuo de la poblacin.

    1.2.3. Muestra

    Cuando es difcil estudiar la poblacin debido a su gran tamao o que provenga de un procesoque no se detiene (como la produccin de un bien), se debe analizar un subconjunto o parte deesta que la represente, llamado muestra, partiendo del supuesto de que este subconjuntopresenta el mismo comportamiento y caractersticas que la poblacin. En general el tamao dela muestra es mucho menor al tamao de la poblacin.

  • 7/22/2019 PD_01_EB_270511.pdf

    12/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 12

    1.2.4. Muestreo

    Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporcinreducida y representativa de la poblacin.

    1.2.5. Dato

    El dato es cada uno de los valores que se han obtenido al realizar un estudio estadstico. Porejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara,cruz.

    1.2.6. Variable

    Se llama variable a una caracterstica que se observa en una poblacin o muestra, y a la cualse desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo.Las variables se pueden clasificar en cuantitativas y cualitativas:

    a) Variable cuantitativa:se expresa en valores numricos. Dentro de ella, se subdividen en:

    Discreta: Se tratan de variables expresadas con valores enteros. Ej. N de hijos de unafamilia, n de alumnos de un curso.

    Continua: son valores que pueden tomar cualquier valor dentro de un intervalo. Ej. Peso,estatura, sueldos.

  • 7/22/2019 PD_01_EB_270511.pdf

    13/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 13

    b) Variable cualitativa:es aquella que describe cualidades. No son numricas y se subdividen

    en: Nominal: son variables presentadas sin orden ni jerarqua. Ej. Estado civil, preferencia

    por una marca, sexo, lugar de residencia. Ordinal: son variables organizadas de acuerdo con una clasificacin. Ej. grado de

    estudios, das de la semana, calidad de la atencin, nivel socioeconmico.

    1.2.7. Solucin de un problema estadstico

    La solucin de un problema estadstico comprende los siguientes pasos:

    a) Planteamiento del problemaEn el planteamiento se define si se requiere de una muestra o es posible estudiar la

    poblacin, las caractersticas a estudiar (las variables), si es necesario estableceruna hiptesis, etc. En este punto tambin se analizan los medios de los que sedispone y el procedimiento a seguir.

    b) Elaboracin de un modeloSe establece un modelo terico de comportamiento de las variables de estudio. Enocasiones no es posible disear el modelo hasta realizar un estudio previo. Losposibles modelos son Normal, Binomial, Poisson, Uniforme, Cuando es difcilestudiar la poblacin debido a su gran tamao o que provenga de un proceso que nose detiene (como la produccin de un bien) , se debe analizar un subconjunto o

    parte de esta que la represente, etc.

    c) Extraccin de la muestraSe usa alguna tcnica de muestreo o un diseo experimental para obtenerinformacin de una pequea parte de la poblacin.

    d) Tratamiento de los datosEn esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datosy se calculan los valores que sern necesarios en pasos posteriores, como la media

  • 7/22/2019 PD_01_EB_270511.pdf

    14/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 14

    y la varianza de la muestra. Los mtodos de esta etapa corresponden a los mtodosde la estadstica descriptiva.

    Algunas de las etapas de esta fase son: recopilacin, clasificacin y presentacin dela informacin.

    e) Estimacin de los parmetrosLa estadstica inferencial nos proporciona herramientas para la prediccin oestimacin de los parmetros de la poblacin que nos ayudarn a resolver elproblema. Un ejemplo de estas herramientas son las pruebas de hiptesis que seobtienen del anlisis de los datos y los intervalos de confianza.

    1.3. Muestreo aleatorio

    Introduccin

    Los estudios estadsticos normalmente se hacen con una parte de la poblacin, ya querealizarlos sobre la totalidad resultara demasiado complicado. Para que la informacin obtenida

    tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condicionesespecficas, relacionadas con el mtodo para determinar el tamao y caractersticas de lamuestra y los individuos que la componen.

    1.3.1. Conceptos bsicos de muestreo aleatorio

    Para que la informacin obtenida tenga validez y confiabilidad es necesario que cumpla conalgunas condiciones especficas. Los mtodos de muestreo se pueden clasificar en:

    Muestreo probabilstico: en l, todos los elementos de una poblacin y, por lo tanto,

    todas las muestras posibles tienen la misma posibilidad de ser elegidas. Las muestrasobtenidas a travs de este tipo de muestreo son confiables porque aseguran lacondicin de representatividad que es muy importante para hacer generalizaciones.

    Muestreo no probabilstico: en este tipo de muestreo los elementos de la poblacin nocomparten las mismas posibilidades de ser seleccionados. Las muestras obtenidas nocumplen con la condicin de representatividad, por lo que no es confiable hacergeneralizaciones a toda la poblacin.

    1.3.2. Metodologa del muestreo aleatorio simple

  • 7/22/2019 PD_01_EB_270511.pdf

    15/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 15

    1. Definir la poblacin de estudio y el parmetro a estudiar.Recordemos que lapoblacin es el grupo formado por el conjunto total de individuos, objetoso medidas que poseen algunas caractersticas comunes observables en un lugar y en unmomento determinado. Por lo tanto, el paso 1 es determinar el que se va a estudiar.Por ejemplo:

    Un investigador realiza un estudio sobre las relaciones de gnero en el noviazgo, suobjeto de estudio es las manifestaciones de violencia fsica y psicolgica entre losestudiantes del ltimo ao de la carrera de qumica. Su poblacin es el total deestudiantes del ltimo ao de ingeniera qumica que tengan novio o novia; el totalde individuos con esta caracterstica es de 386 en este ejemplo. Por lo que, lapoblacin es de 386 individuos y las variables son: violencia fsica y violencia

    psicolgica.

    2. Enumerar a todas las unidades de anlisis que integran la poblacin,asignndoles un nmero de identidad o identificacin.

    Una vez que hemos definido nuestra poblacin y las variables a estudiar, esnecesario asignar un nmero de identificacin a cada individuo de la poblacin.Siguiendo con el ejemplo de la relaciones de gnero en el noviazgo en losestudiantes de qumica, lo que sigue es numerar a los 386 estudiantes un nmerodel 1 al 386.

    3. Determinar el tamao de la poblacin, determinar el porcentaje de error y elporcentaje de confianza y obtener una muestra preliminar.

    Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:

    a) El porcentaje de confianza con el cual se quiere generalizar los datos desde lamuestra hacia la poblacin total.

    b) El porcentaje de error que se pretende aceptar al momento de hacer lageneralizacin.c) El nivel de variabilidad que se calcula para comprobar la hiptesis.Veamos en

    qu consiste cada concepto:

    Definir el tamao de la poblacin: Significa determinar el nmero de individuos que laconstituyen; la variable N representa el tamao de la poblacin. Esto es, N=X.

    Porcentaje de confianza:Es el grado o nivel de seguridad que existe para generalizarlos resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir

  • 7/22/2019 PD_01_EB_270511.pdf

    16/43

  • 7/22/2019 PD_01_EB_270511.pdf

    17/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 17

    En un lote grande de medicinas, se desea verificar que la proporcin de los ingredientesactivos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel deconfianza del 95% con un error del 5%. Supongamos que la variabilidad p=q=0.5.

    Solucin:Para el nivel de confianza sea igual al 95%, tenemos que P(Z)=0.95 si Z=1.96.Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, enel caso necesario, hay que convertir esos valores a proporciones.

    Sustituyendo:

    Es decir, se ocupar una muestra de aproximadamente 384 unidades.

    Para cuando se conoce el tamao de la poblacin:

    nes el tamao de la muestraZes el nivel de confianza

    p es la variabilidad positivaq es la variabilidad negativaN es el tamao de la poblacinEes la precisin o error

    Ejemplo:En un lote de 25,000 cajas de medicina, se desea verificar que la proporcin de los

    ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra paraun nivel de confianza del 95% con un error del 5%. Supongamos que la variabilidadp=q=0.5.

    Solucin:Para el nivel de confianza sea igual al 95%, tenemos que p(Z)=0.95 si Z=1.96.Sustituyendo:

  • 7/22/2019 PD_01_EB_270511.pdf

    18/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 18

    En otras palabras, se ocupar una muestra de aproximadamente 378 cajas.

    5. Seleccionar la muestra usando nmeros aleatorios.

    El ltimo paso para obtener la muestra es saber qu individuos especficos de lapoblacin se tomarn. Para hacer esto debemos:

    1. Numerar a los individuos de la poblacin del 1 a N (donde N es el tamao de lapoblacin).

    2. Generar nmeros aleatorios mediante programas computaciones (por ejemplo, Excelcon la funcin =aleatorio() ), funciones en calculadora o bien utilizando tablas denmeros aleatorios. Tambin puedes generar nmeros aleatorios de formas mecnicas,por ejemplo, sacando nmeros de una urna o lanzando una moneda al aire.

    3. Tomar los individuos correspondientes a los nmeros elegidos.

    Nosotros nos enfocaremos nicamente en el uso de la tabla de nmeros aleatorios.Procedimiento para utilizar las Tablas de Nmeros aleatorios:

    Se selecciona el bloque, el rengln y la columna de la tabla. Partiendo de estaseleccin, se toman tantas columnas como dgitos tenga la poblacin (N). Comenzandopor el primer nmero de las columnas, s- e incluirn en la muestra aquellos individuosque en la lista de la poblacin ocupen la posicin de los n nmeros de las columnas

    seleccionadas, siempre que sean menores que N. Si el nmero seleccionado en la tablaes mayor que N lo pasamos por alto y seguimos hasta tener la muestra total.

    Ejemplo:Suponga que tenemos la siguiente tabla de 100 datos, numerados del 00-99.

    0 1 2 3 4 5 6 7 8 9

    0 61 21 15 68 79 63 81 84 73 281 78 73 10 4 40 20 87 1 46 842 83 26 21 49 30 71 69 45 25 29

  • 7/22/2019 PD_01_EB_270511.pdf

    19/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 19

    3 64 74 1 83 74 98 24 25 91 654 29 46 29 34 46 38 25 23 81 17

    5 79 34 24 77 23 1 44 31 29 996 93 39 73 64 66 93 92 61 25 697 58 39 34 88 88 33 5 79 58 518 67 64 52 56 18 51 30 16 68 29

    9 32 7 72 88 48 28 30 22 74 39

    Selecciona una muestra aleatoria de 7 nmeros.

    En la figura anterior tenemos una tabla de nmeros aleatorios tomados de este documento(http://halweb.uc3m.es/esp/Personal/personas/aarribas/esp/docs/NumerosAleatorios.pdf),seleccionemos una fila al azar, suponga la fila 5, y separamos los nmeros de 2 en 2,

    tendramos entonces la siguiente serie de 7 nmeros: 65 03 83 69 67 67 43 54 49 27 82 50 1506 etc. Esto significa que nuestra muestra aleatoria deber contener esos individuos, en el casode 67 que se repite, solo lo consideramos una vez y pasamos al siguiente nmero. (En algunascalculadoras existe la funcin RAN# que nos proporciona tambin nmeros aleatorios, en estabasta con poner en la calculadora el nmero de muestras + (Tecla SHIFT) + RAN# y cada vezque presionemos la tecla (=) nos dar un numero aleatorio, si solo queremos la parte entera,ignoramos al decimal). Tendramos la siguiente tabla:

  • 7/22/2019 PD_01_EB_270511.pdf

    20/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 20

    Nmero aleatorio Individuo de la muestra

    65 93

    03 6883 5669 6967 6143 3454 2349 1727 4582 52

    Por lo que nuestra muestra quedara con los valores 93, 68, 56, 69, 61, 34, 23, 17 ,45 , 52.

    Consideraciones especficas de la unidad

    En esta unidad se trabajar con lecturas de apoyo y se resolvern problemas como ejercicios

    para reforzar el aprendizaje.

    Tendrs que participar en una encuesta con la cual se generar una base de datos, estematerial lo utilizars a lo largo del curso para que elabores las evidencias de aprendizaje decada unidad.

    Referencias:

    1. --- Statistics. (2010). En Merriam-Webster Online Dictionary. Consultado el 8 de marzode 2010 en: http://www.merriam-webster.com/dictionary/statistics

    2. Borrego, Silvia (2008). Estadstica descriptiva e inferencial en:Revista digitalinnovacin y experiencias educativas 13. Consultado el 10 de marzo de 2010 en:http://www.csi-csif.es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.pdf

    3. Castillo Manrique, Isabel (2006). Estadstica descriptiva y clculo de probabilidades.Mxico: Pearson Educacin.

    4. Galbiati Riesco, Jorge M. (s/f). Conceptos Bsicos de Estadstica. Pontificia UniversidadCatlica de Valparaso, Instituto de Estadstica. Consultado el 01 de marzo de 2010 en:http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf

  • 7/22/2019 PD_01_EB_270511.pdf

    21/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 21

    5. Jordi Casal, Enric Mateu (2003). Tipos de muestreo en: Revista Epidem. Med. Prev. 1:3-7. Consultado el 01 de marzo de 2010 en:http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf

    6. Larios Osorio, Vctor (1999). Unidad 5. Teora de muestreo. Consultado el 12 de marzode 2010 en: http://www.uaq.mx/matematicas/estadisticas/xu5.html

    7. Lind, Douglas; William Marchal y Samuel Wathen (2008). Estadstica aplicada a losnegocios y la economa.Decimotercera edicin. Mxico: McGraw-Hill.

    8. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadsticaaplicadas a la ingeniera. Cuarta edicin. Mxico: McGraw-Hill.

    9. Ritchey, Ferris (2008). Estadstica para las ciencias sociales. Segunda edicin. Mxico:McGraw-Hill.

    10. Ruiz Muoz, David (2004). Manual de estadstica. Consultado el 09 de marzo de 2010en: http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm

    11. Wackerly, Dennis D.; William Mendenhall III y Richard L. Scheaffer (2010). EstadsticaMatemtica con Aplicaciones. Sptima edicin. Mxico: Cengage Learning.

    12. Walpole Ronald E.; Raymond H. Myers, et al. (2007). Probabilidad y Estadstica paraIngeniera y ciencias. Octava Edicin. Mxico: Pearson Educacin.

    Unidad 2. Representacin numrica y grfica de datos

    Propsitos

    En esta unidad: Identificars algunos conceptos que se utilizan en estadstica descriptiva. Organizars datos en diferentes tipos de tablas y elaborars varios tipos de grficas.

    Competencia especfica

    Utiliza las tcnicas de representacin numrica y grfica para representar informacin a travsde la organizacin de los datos obtenidos de una muestra o poblacin.

    Introduccin

    En la unidad anterior vimos que existen dos grandes divisiones de la estadstica: la que sededica a la recoleccin, presentacin y categorizacin de datos, llamada estadstica descriptiva,y la que se dedica a realizar hiptesis en base a dichos datos, llamada inferencial. Tambin

  • 7/22/2019 PD_01_EB_270511.pdf

    22/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 22

    aprendimos a determinar el espacio de estudio, es decir la poblacin, y las variables que se vana estudiar de acuerdo al problema planteado.

    En esta unidad estudiaremos la Estadstica Descriptiva, y dentro de ella aprenderemos cmoorganizar y presentar los datos que se obtienen de las muestras tomadas de nuestraspoblaciones. Antes de comenzar con los temas, veamos de dnde y cmo se obtienen losdatos que vamos a organizar.

    Cuando se realiza un trabajo que requiere de la estadstica, las personas que realizan el trabajodisean sus instrumentos para recolectar la informacin y obtener los datos que necesitan.Existen muchos mtodos para recolectar informacin, pero los ms frecuentes son:

    Censos

    Es una tcnica de recoleccin de datos que se aplica a la totalidad de los elementos quecomponen la poblacin o universo que se estudia. Un censo debe cumplir dos condiciones:Universalidad: esto es, se debe tomar en cuanta a todos los elementos de la poblacin.Simultaneidad: debe realizarse dentro de un periodo de tiempo limitado.

    EncuestaEsta tcnica se utiliza para recolectar informacin de una muestra de la poblacin. Consiste enpresentar un conjunto de preguntas abiertas (preguntas que no tienen respuestaspredeterminadas) o cerradas (preguntas que cuentan con una serie de respuestasestablecidas).

    ExperimentoOtra de las tcnicas ms recurridas en estadstica para recolectar informacin son losexperimentos, veamos en qu consisten.

    Un experimentoes una prueba que se realiza para determinar las caractersticas ocomportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qualimentos nos parecen ms salados.

    Un experimento, tambin se define como el proceso que se realiza para verificar una seriede hiptesisrelacionadas con un determinado fenmeno, en el cual se determinan lascaractersticas o comportamientos del fenmeno que se analiza. Por ejemplo, un experimentopara determinar la velocidad de la luz en el vaco; donde se est determinando la velocidad dela luz.

    La diferencia entre la primera y la segunda definicin es que en la segunda se parte de unahiptesis mientras que en la primera no necesariamente.

  • 7/22/2019 PD_01_EB_270511.pdf

    23/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 23

    En el primer ejemplo, experimento los sabores de los alimentos sin antes predecir cul piensoque me sabr ms salado. En el segundo ejemplo, mi hiptesis, a partir de estudios anteriores,es que la velocidad de la luz en el vaco es de 300 000 km/seg.Mi experimento verifica si esta hiptesis es cierta o no y en l cabe un margen de errorexperimental.

    2.1. Organizacin de datos y distribucin de frecuencias

    La descripcin estadstica organiza los datos y los presenta en forma de tablas y grficas. Estarea slo describe, resume, organiza y representalos datos obtenidos de una poblacin omuestra de dicha poblacin, sin elaborar inferencias ni obtener conclusiones.La organizacin de datos se realiza a travs de tablasque se utilizan para simplificar lapresentacin y distribucin de estos datos. A continuacin veremos que existen diferentes tipos

    de presentacin de datos y con base en ellos distintas clasificaciones de frecuencia, como:frecuencia relativa, frecuencia acumulada y frecuencia absoluta.

    2.1.1. Frecuencias

    Dentro de los conceptos bsicos para la organizacin de datos estn los que conciernen a lafrecuencia:

    Frecuencia:es el nmero de veces que se repite un dato, tambin se le conoce comofrecuencia absoluta.

    Frecuencia acumulada:es la suma de las frecuencias absolutas de las variables hastael rengln i.Tambin es conocida como frecuencia absoluta acumulada.

    Frecuencia relativa:es el resultado de dividir la frecuencia entre el nmero total dedatos (N). Este dato tambin puede verse como un porcentaje.

    Frecuencia relativa acumulada: es la suma de las frecuencias relativas hasta elrengln i.

    Podemos encontrar las frecuencias organizadas en tablas que estudiaremos ms adelante. Porahora veamos cmo se representan los tipos de frecuencia que vimos anteriormente,supongamos que tenemos la siguiente distribucin de datos:18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18,23, 52, 7, 18, 52, 23.

    No. De Datos Frecuenci Frecuencia Otra forma Frecuencia Frecuencia

  • 7/22/2019 PD_01_EB_270511.pdf

    24/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 24

    rengln(i)

    obtenidos dela variable

    afi

    AcumuladaFi

    para obtenerFi

    Relativahi

    Relativa acumuladaHi

    1 7 f1= 2 f1=F1=2 f1=F1=2h1=f1/N=0.06

    25

    h1=H1=0.0625

    2 18 f2= 6f1+f2= F2=8

    F1+f2=F2=8

    h2=f2/N=0.1875

    h1+h2=H2=0.2500

    3 23 f3= 8f1+f2+f3=F3=16

    F2+f3=F3=16

    h3=f3/N=0.2500

    h1+h2+h3=H3=0.5000

    4 41 f4= 4f1+f2+f3+f4= F4=20

    F3+f4=F4=20

    h4=f4/N=0.1250

    h1+h2+h3+h4=H4=0.6250

    5 47 f5= 7f1+f2+f3+f4+f5= F5=27

    F4+f5=F5=27

    h5=f5/N=0.2187

    h1+h2+h3+h4+h5=H5=0.8430

    6 52 f6=5f1+f2+f3+f4+f5+f6=F6=32

    F5+f6=F6=32

    h6=f6/N=0.1563

    h1+h2+h3+h4+h5+h6=H6=1.0000

    Total N=32 1.0000

    2.1.2. Intervalos

    Intervalo o rango: Conjunto de nmeros comprendidos entre otros dos nmeros dados,

    conocidos estos ltimos como lmites del intervalo.

    Intervalo de clase: En estadstica, se llama intervalo de clase a la expresin quenombra un intervalo.

    Amplitud del intervalo: Es la diferencia del lmite superior menos el lmite inferior (Ls -Li).

    Fronteras de clase: Son los puntos medios entre los lmites de intervalos consecutivos.

    Las fronteras de clase se utilizan para recuperar los datos entre el lmite superior de unintervalo y el lmite inferior del siguiente.

    Marca de clase: Es el punto medio del intervalo y es el resultado de la suma delos lmites inferior y superior del intervalo dividido entre 2. A la marca de clasetambin se le denomina punto medio de clase.

    Ejemplo de intervalosVeamos cmo se representan los conceptos relacionados con los intervalos.Dados los nmeros 15 y 25, tendramos que:El intervalo corresponde a todos los nmeros que se encuentran entre el 15 y el25. El intervalo de clase sera: 15-25

  • 7/22/2019 PD_01_EB_270511.pdf

    25/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 25

    Los lmites del intervalo son:

    Lmite inferior = 15Lmite superior = 25

    La amplitud del intervalo 15-25 sera: 25 menos 15, es decir 10. Esrecomendable que todos los intervalos tengan la misma amplitud. Para ellopodemos restar el dato menor del dato mayor y dividir este resultado entre elnmero de intervalos que se deseen.La frontera de clase: si tomamos los intervalos 4-14, 15-25 y 26-36, las fronterasde clase seran: 3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundointervalo, por ltimo, 25.5 y 36.5 para el tercer intervalo.

    La frontera de clase no debe coincidir con los datos lmites del intervalo, porquesera complicado identificar el intervalo al que pertenece dicho dato.Ejemplo: Con en base las fronteras dadas se construyen los nuevos intervalos3.5-14.5, 14.5-25.5 y 25.5-36.5. Si se tiene el dato 25.5 no se sabra si ponerloen el segundo o en el tercer intervalo.

    Si esta coincidencia sucede deber moverse el intervalo. Siguiendo con elejemplo, movindolo un punto a la izquierda tendramos los intervalos 2.5-13.5,

    13.5-24.5 y 24.5-35.5.La marca de clase del intervalo 15-25 es igual a:

    Es recomendable que la marca del intervalo coincida con alguno de los datos.Esto no es necesario y no siempre se logra, sobre todo cuando los intervalostienen la misma amplitud.

    2.1.3. Construccin de intervalos de clase

    La formacin de clases o intervalos de clase, que se representa con (k), dependen,generalmente, del tamao del rango de la poblacin o muestra. Lo que se debe hacer paradeterminar los intervalos de clase es lo siguiente:

    1. Calcular el rango:

    Para esto, se identifica el nmero mayor (Xn)y el nmero menor (X1)en los datos. El rango esel resultado de la resta, esto es:

  • 7/22/2019 PD_01_EB_270511.pdf

    26/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 26

    R= XnX1

    Por ejemplo:Si en una serie de datos que van desde el 18 hasta el 56, tendramos lo siguiente:Xn= 56 y X1= 18, por lo tanto:R= XnX1= 5618= 38

    2. Determinar el nmero de intervalos que se desea tener:No existe una regla para determinar el nmero de intervalos, pero generalmente se suelencrear entre 5 y 20 intervalos. La decisin la toma el investigador.Siguiendo con nuestro ejemplo, diramos que vamos a construir 7 intervalos.Entonces decimos que K=7.

    3. Dividir el rango entre el nmero de intervalos que se desea tener:Recordemos que lo recomendable es elegir un nmero entre 5 y 20 para los intervalos.Dividimos entre uno menos de los intervalos deseados porque con el nmero de datos seacumula un intervalo ms.

    Siguiendo con el ejemplo, deseo 7, entonces:

    Esta ser la amplitud de los intervalos. Cuando no es un nmero entero, se escoge el enteroms cercano, como en este caso, tomamos el rango igual a 5.Cuando la cantidad de datos es tal que no alcanza para acumular un intervalo ms, entoncesse divide entre el nmero de intervalos que se quieren.

    4. Se forman los intervalos:

    Los intervalos se forman comenzando un nmero antes del primer dato:

    INTERVALOS:17 a 22 (se cuenta 5 desde 18 hasta 22)23 a 2829 a 3435 a 4041 a 4647 a 5253 a 58

    Nota: No importa que el ltimo intervalo exceda el ltimo dato.

  • 7/22/2019 PD_01_EB_270511.pdf

    27/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 27

    Ejemplo de construccin de intervalosVeamos el siguiente ejemplo para la construccin de intervalos de clase.El director de una consultora en desarrollo de software desea conocer el nmero deincidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Para ellopide a uno de sus empleados que le elabore un reporte, el empleado tiene los siguientes datos:35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35,27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26,25, 24, 60, 55, 48, 37, 31, 30, 22, 20.

    Vayamos paso por paso:

    1. Calcular el rango:

    R= XnX1= 60-20=40

    2. Determinar el nmero de intervalos entre 5 y 20:Elegimos 8 intervalos

    3. Dividir el rango entre el nmero de intervalos:

    4. Se forman los intervalos:Comenzamos por un nmero anterior al lmite inferior: 19-24, 25-29, 30-35, 36-40, 41-45, 46-50, 51-55, 56-60.

    2.1.4. Tablas de datos

    Existen diferentes tipos de tablas para presentar los datos, las ms utilizadas son: Tabla dedatos, Tabla de frecuencias, Tabla por intervalos de clasey Tablas de doble entrada.

    Veamos en qu consiste cada una:Una tabla de datos es la forma ms sencilla de organizar un conjunto de datos y se utilizacuando la informacin que necesitamos son los datos mismos. Se organizan en columnas orenglones y se registran las mediciones o datos obtenidos.

    Ejemplo:

  • 7/22/2019 PD_01_EB_270511.pdf

    28/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 28

    Supongamos que la medicin de temperatura a lo largo del da da como resultado lossiguientes valores en grados Celsius: 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7. Entoncesconstruimos una tabla como la siguiente:

    Temperatura(Celsius)

    20.4 21.2 22.1 23.9 25.3 26.9 27.7

    2.1.5 Tablas de frecuencias

    Esta nos aporta mayor informacin pues est formada por categoras de la variable que se estmidiendo y su frecuencia (es decir, el nmero de ocurrencias de un valor dado).

    Ejemplo:suponga que un experimento da los siguientes valores medidos:1,2,2,2,1,1,5,4,3,2,2,1,3,4,5,6,2,3,4,5,5,4,3,3,2

    Procedemos entonces a agrupar por categoras, segn la frecuencia o nmero de veces queaparece cada medicin:

    Valor de laVariable medida

    Frecuencia

    1 42 73 54 45 56 1

    2.1.6. Tablas por intervalos de clase

    En este tipo de tablas los datos son presentados por intervalos de clase y no por los valorescorrespondientes a cada variable.

    Ejemplo:

  • 7/22/2019 PD_01_EB_270511.pdf

    29/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 29

    En una encuesta sobre el desempleo en el rea Metropolitana de la Ciudad de Mxico, seorganizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia decada intervalo, teniendo un total de 23,700 desempleados.

    Grupo de edad Frecuencia

    De 12 a 19 9600De 20 a 24 7100De 25 a 34 3900De 35 a 44 1500De 45 a 99 1600

    2.1.7. Tablas de doble entrada

    Estas tablas proporcionan informacin referente a dos variables o eventos relacionados entres. Se forma poniendo en los renglones de la tabla la informacin de una de las variables y enlas columnas la informacin de la otra variable.

    Ejemplo:

    Suponga que se miden el nmero de cirugas realizadas por edades en una muestra de 100personas, encontrndose lo siguiente:

    Edades / No. de cirugas Menos de 2 cirugas Ms de 2 cirugas0-10 1 011-20 2 221-30 6 431-40 11 7

    41-50 17 6Ms de 50 30 14

    Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variablesrelacionadas son los rangos contra el valor de las variables en dicho rango.

    Por ejemplo:

  • 7/22/2019 PD_01_EB_270511.pdf

    30/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 30

    Supongamos que medimos la temperatura de un lquido con respecto al tiempo decalentamiento. En el rengln colocamos los tiempos y en las columnas la temperatura obtenida.

    Podramos considerar la tabla como una tabla de frecuencias o como una tabla de dobleentrada:

    Tiempo(min)

    Temperatura(C)

    1-5 366-10 4411-15 67

    2.2. Representacin grfica de datosIntroduccin

    En el tema anterior presentamos diferentes formas de organizar o de tabular datos y vimos ladistribucin de frecuencias. Ahora veremos la representacin grfica de los datos.Las grficas son representaciones visuales de los datos que se muestran en una tabla. Existendiferentes tipos de grficas, cada una de ellas se elabora con base en el tipo de informacinque se quiere representar.

    2.2.1. Histograma

    Histograma es la representacin grfica de una variable continua. Se elabora en un sistema decoordenadas rectangulares.

    El eje horizontal se utiliza para representar a la variable independiente, es decir, a laescala de medicin o fronteras de clase.

    El eje vertical representa a la escala de frecuencias. Si los intervalos de clase tienen el mismo ancho, las alturas de las barras sern

    proporcionales a las frecuencias.

    El histograma tambin proporciona visualmente el aspecto de la distribucin y dispersin de lasmediciones.

    2.2.2. Grfica de barras

    Este tipo de grfica se utiliza para datos de tipo ordinal, nominal y discreto. En estas semuestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura de la barra y

  • 7/22/2019 PD_01_EB_270511.pdf

    31/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 31

    no por el rea de la barra. Esta grfica muestra las discontinuidades en las mediciones pormedio de espacios vacios entre las barras.

    La grfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

    Barras verticales:

    En el eje horizontal se representan los valores de la variable. En el eje vertical se representa la frecuencia de cada clase.

    Barras horizontales:

    En el eje horizontal se representan las frecuencias.

    En el eje vertical los valores de la variable.

    Un histograma y una grfica de barras son muy semejantes, la diferencia radica en que elhistograma no presenta separacin entre las barras.

    2.2.3. Grfica de lneas

    Una grfica de lneas se construye tambin en un sistema coordenado rectangular, y muestra larelacin entre las variables mediante puntos conectados por lneas continuas. La frecuencia decada valor medido es representada por la altura del punto.

    En el eje horizontal se representa a la variable y en el eje vertical la frecuencia. Se determinanlos puntos de corte del valor de la variable con su frecuencia y se unen, obtenindose la grficade lnea.

    2.2.4. Grfica de rea o de pastel

    Una forma de representar datos u observaciones de una variable cualitativa es mediante undiagrama circular. Esta grfica muestra la relacin entre las variables dividiendo un crculo (opastel) en sectores (o rebanadas). Tambin se utilizan para representar la distribucin defrecuencias, pero es el rea de cada sector la proporcional a los valores medidos.

    Para trazar la grfica, se hace una distribucin proporcional de las frecuencias del problemacon respecto a la circunferencia determinando sectores circulares para cada categora.

  • 7/22/2019 PD_01_EB_270511.pdf

    32/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 32

    Ejemplo:

    Considere la siguiente tabla de datos.

    Medicin encm

    FrecuenciaFrecuenciaacumulada

    Porcentaje

    30 3 3 3%30.1 7 10 6%30.2 12 22 10%30.3 18 40 15%30.4 23 63 19%30.5 21 84 18%

    30.6 17 101 14%30.7 11 112 9%30.8 5 117 4%30.9 1 118 1%

  • 7/22/2019 PD_01_EB_270511.pdf

    33/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 33

    En esta figura se muestra el histograma de las mediciones en cm vs. frecuencia, note como elancho de las clases es el mismo.

    En la grfica de pastel se muestra dentro de cada rebanada la medicin en cm y el porcentajeque corresponde a la frecuencia relativa.

    En esta figura se muestra la frecuencia acumulada mediante una grfica de lnea.

  • 7/22/2019 PD_01_EB_270511.pdf

    34/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 34

    Consideraciones especficas de la unidad

    En esta unidad se trabajar con dos problemas diferentes que permitirn practicar aelaboracin de tablas de datos y grficas, adems de participar en un foro sobre el usocotidiano de la estadstica descriptiva. La evidencia de aprendizaje se generar a partir de lamuestra que se obtuvo en la unidad uno. Consiste en la elaboracin de tablas de datos ygrficas de diferentes tipos.

    Referencias:1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadstica

    aplicadas a la ingeniera. Cuarta edicin. Mxico: McGraw-Hill.2. Walpole, Ronald E., Raymond H. Myers et al.(2007). Probabilidad y Estadstica para

    Ingeniera y ciencias. Octava edicin. Mxico: Pearson Educacin.

    3. Intervalos de clase. Consultado el 26 de abril de 2010 en:http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadistica_descriptiva_2/estadistica_descriptiva_2.htm

    4. Censo y entrevista. Consultados el 26 de abril de 2010 en:http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.doc.http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf

    Para saber ms:5. Estadstica y probabilidad. Consultado el 27 de abril de 2010 en:

    http://www.vitutor.com/estadistica.html

    Unidad 3. Medidas de tendencia central y dispersin

    Propsitos

    En esta unidad:

    Aplicars el procedimiento para obtener las medidas de tendencia central y dispersinen datos agrupados y no agrupado.

    Competencia especfica

    Utiliza las medidas de tendencia central y dispersin para describir un conjunto de datosmediante la representacin numrica y grfica de la informacin obtenida en una muestra opoblacin.

    Introduccin

  • 7/22/2019 PD_01_EB_270511.pdf

    35/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 35

    Para cualquier conjunto de datos estudiados es importante tener informacin resumida de suscaractersticas. Esta informacin nos indica cmo se comporta la poblacin de datos quetenemos. Para resumir la informacin se utilizan dos tipos de valores que en lugar derepresentar cada dato, representan conjuntos de datos. Estos dos tipos de indicadoresestadsticos son: las medidas de tendencia central, que nos muestran hacia qu valores seagrupan o acumulan los datos, y las medidas de dispersin, que, de forma contraria a lasanteriores, muestran cmo se dispersan o separan los datos.

    3.1. Medidas de tendencia central

    Las medidas de tendencia central son los valores que representan un conjunto de datos deforma tal que nos ayudan a saber dnde estn acumulados los datos pero sin indicar como se

    distribuyen. Se llaman as porque tienden a ubicarse en la parte central del conjunto de datos.Las medidas de tendencia central ms comunes son: la media aritmtica, comnmenteconocida como media o promedio, la medianay la moda.

    3.1.1. Media aritmtica

    La media aritmtica o, simplemente, media, se denota por o por la letra segn se calcule enuna muestra o en la poblacin, respectivamente. La media es resultado de dividir la suma detodos los valores (xi) entre el nmero total de datos (N).

    La frmula para calcular la media de una distribucin de datos, vara de acuerdo a la maneracmo los tenemos organizados.

    Frmula para calcular la media en datos no agrupados

    Los datos no agrupados son aquellos datos que organizamos en una tabla de datos, es decir,cada valor se representa de manera individual. Las frmulas para calcular la media son:

    En una poblacin En una muestra

  • 7/22/2019 PD_01_EB_270511.pdf

    36/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 36

    En estas frmulas la diferencia radica en que, el total de la poblacin se representa con la letraN y el total de la muestra se representa con la letra n.

    Frmula para calcular la media en datos agrupados por frecuencias simplesLos datos agrupados en frecuencias son aquellos que organizamos en una tabla defrecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable (x i) y, enotra columna, la frecuencia (fi) o el nmero de veces que se repite cada valor en una serie dedatos.

    Las frmulas para calcular la media con los datos organizados de esta manera son:

    En una poblacin En una muestra

    Frmula para calcular la media en datos agrupados por intervalosLos datos agrupados en intervalos son aquellos que se organizan dentro de un rangoestablecido entre un lmite inferior y un lmite suprior. Recuerda que las tablas de intervalosmuestran el nmero de datos que abarca cada intervalo (frecuencia por intervalo).

    Las frmulas para calcular la media con los datos organizados de esta manera son:

    En una poblacin En una muestra

  • 7/22/2019 PD_01_EB_270511.pdf

    37/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 37

    3.1.2. Mediana

    La mediana es el valor que divide a la mitad la serie de datos que se tienen. Es decir, lamediana queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o

    decreciente, entonces, el nmero de datos que queda a la izquierda de la mediana es igual alnmero de datos que queda a la derecha.

    Si n es impar hay un dato que queda en medio de todos, ste ser igual a la mediana. Si n espar hay dos datos que quedan en medio de todos, en este caso la mediana es el promedio deesos dos datos, es decir, su suma dividida entre dos.

    Para cuando la cantidad de valores de la distribucin es impar:

    1. Ordenamos los valores de menor a mayor.2. Buscamos el valor del centro.

    Por ejemplo:Supongamos que tenemos los siguientes valores:

    2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9

    1. Ordenamos:

    0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9

    2. El dato que divide a la mitad es: 4, por lo tanto Me: 4

    Para cuando la cantidad de valores es impar:

    1. Ordenamos los valores de menor a mayor.2. Buscamos los valores del centro.3. Promediamos los valores del centro.

    Por ejemplo:

  • 7/22/2019 PD_01_EB_270511.pdf

    38/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 38

    Supongamos que tenemos los siguientes valores:5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1, 3, 2

    1. Ordenamos1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9

    2. Buscamos los datos del centro:4, 5

    3. Promediamos:

    , por lo tanto Me: 4.5

    Mediana en datos agrupados por intervalosCuando queremos calcular la mediana en datos agrupados por intervalos, tenemos que buscarel intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de lasfrecuencias absolutas, es decir, es necesario localizar el intervalo donde se encuentre, ocupamos siguiente frmula:

    En donde:

    Li= Lmite inferior del rengln en donde debe estar la medianaFi-1= Frecuencia acumulada anterior al rengln de la medianafi= frecuencia del rengln de la medianaai= tamao del intervalo

    3.1.3. Moda

    La moda es el valor del dato que ms veces se repite, esto es, el valor cuya frecuencia absolutaes mayor, y se denota como Mo.Algunas veces el valor que ms se repite puede no ser nico,es decir, puede haber dos o ms datos que aparezcan con la misma frecuencia absoluta,siendo sta la mayor. En esas ocasiones podemos hablar de poblaciones o muestrasbimodales si existen dos modas o multimodales si existen ms de dos.

    Por ejemplo si tomamos una muestra de hombres y mujeres y medimos sus estaturastendremos dos modas.

  • 7/22/2019 PD_01_EB_270511.pdf

    39/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 39

    Cuando nuestra distribucin de datos es por intervalos de clase, primero localizamos elintervalo que tiene mayor frecuencia absoluta y utilizamos la siguiente frmula para calcular lamoda:

    En donde:

    Li= Lmite inferior del rengln en donde debe estar la modafi= frecuencia del rengln de la modafi+1= Frecuencia ulterior al rengln de la moda

    fi-1= Frecuencia anterior al rengln de la modaai= tamao del intervalo

    3.2. Medidas de dispersin

    A diferencia de las medidas de tendencia central, que miden acumulaciones, mediante un solopunto, las medidas de dispersin miden el grado de separacin o alejamiento que tiene unavariable estadstica en torno a una medida de posicin o tendencia central. Dicho grado deseparacin nos indica lo representativa que es la medida de posicin con respecto al conjuntototal de datos. A mayor dispersin menor representatividad de la medida de posicin yviceversa.

    Las medidas de dispersin ms comunes son: el recorrido, la varianza y la desviacin estndar.

    3.2.1. Recorrido

    El recorrido representa la distancia que hay entre el primero y el ltimo valor de la variable,tambin se le conoce como rango y se denota por Re.

    La frmula para calcularlo es:

    Donde:

  • 7/22/2019 PD_01_EB_270511.pdf

    40/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 40

    mx xies el valor mximo del a variablemin xi es el valor mnimo de la variable

    Por ejemplo:

    Supongamos que tenemos la siguiente distribucin de datos: 69, 68, 52, 57, 69, 71, 78, 52, 74,74, 69, 52, 76.

    Calculamos el rango, sustituyendo los valores:

    Re=78-52=26

    3.2.2. Varianza

    La varianza mide la mayor o menor dispersin de los valores de la variable respecto a la mediaaritmtica. Siempre es mayor o igual que cero y menor que infinito. Se define como la media delos cuadrados de las diferencias del valor de los datos menos la media aritmtica de estos.

    La frmula de la varianza para datos no agrupados es:

    Varianza para datos agrupados por intervalos

    La frmula para calcular la varianza en datos agrupados por intervalos es la siguiente:

    3.2.3. Desviacin tpica o estndar

    Para calcularla en una poblacin:Para calcularla en una muestra:

    Para calcularla en una poblacin:

    Para calcularla en una muestra:

  • 7/22/2019 PD_01_EB_270511.pdf

    41/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 41

    La desviacin tpica muestra qu tan alejado est un dato del valor de la media aritmtica, esdecir, la diferencia que hay entre un dato y la media aritmtica. Se denota como S o, segn secalcule en una muestra o en toda la poblacin, respectivamente.

    Se define como la raz cuadrada positiva de la varianza. Se expresa mediante las siguientesfrmulas:

    En datos no agrupados:En una poblacin:

    En una muestra:

    En datos agrupados por intervalos:

    En una poblacin:

    En una muestra:

  • 7/22/2019 PD_01_EB_270511.pdf

    42/43

    Estadstica bsicaPrograma desarrollado

    Educacin Superior Abierta y a Distancia Primer cuatrimestre 42

    Consideraciones especficas de la unidad

    Las actividades de esta unidad se trabajan en diferentes momentos, a partir de un problemaque se trabaja en la unidad 2, los alumnos tendrn que obtener las medidas de tendenciacentral y dispersin. Se les solicita a los alumnos que al concluir cada subtema (tipo de medida)se elabora una actividad relacionada con el mismo, al final del tema uno y dos estas actividadesse comparten con el resto del grupo para que entre todos se revisen y retroalimenten.

    Se contar con dos foros de uso general, uno para las medidas e tendencia central y otro paralas medidas de dispersin. El objetivo de estos foros es que los alumnos planteen sus dudas atodo el grupo o compartan informacin que pueda ser de utilidad para el estudio de los temas.

    Cuenta con una actividad que debe ser enviada al facilitador como tarea, adems de laautoevaluacin y la evidencia de aprendizaje. Esta ltima consiste en la presentacin de lasmedidas de tendencia central y dispersin de los datos obtenidos de la muestra de la unidaduno, adems de incluir, a manera de conclusin, una reflexin sobre el uso y las aplicacionesde la estadstica descriptiva.

    Referencias:

    1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadsticaaplicadas a la ingeniera. Cuarta edicin. Mxico: McGraw-Hill.

    2. Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadstica paraIngeniera y ciencias. Octava edicin. Mxico: Pearson Educacin.

    3. Medidas de tendencia central y dispersin. Consultado el 27 de abril de 2010 en:http://bibliotecavirtual.lasalleurubamba.edu.pe/Estadistica/res/pdf/estadisticadescriptivavariables2.pdf

    4. Estadstica y probabilidad. Consultado el 27 de abril de 2010 en:http://www.vitutor.com/estadistica.html

  • 7/22/2019 PD_01_EB_270511.pdf

    43/43

    Estadstica bsicaPrograma desarrollado