Separa Est

90
ESTADÍSTICA APLICADA Separata de Estadística Descriptiva ING. WILMER JULIO BERMÚDEZ PINO Docente de la Facultad de Ing. Informática y Sistemas. Universidad Nacional Agraria de la Selva. Tingo María

description

contenido

Transcript of Separa Est

  • ESTADSTICA APLICADA

    Separata de Estadstica Descriptiva

    ING. WILMER JULIO BERMDEZ PINODocente de la Facultad de Ing. Informtica y Sistemas.

    Universidad Nacional Agraria de la Selva.Tingo Mara

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    1

    Introduccin

    El trmino estadstica es utilizado frecuentemente para hacer referencia a datosindividuales, un conjunto de datos o cualquier informacin derivada de ellos; sinembargo, la estadstica es mucho ms que una simple coleccin o tabulacin de datospues involucra todo un conjunto de procesos que tienen como objetivo alcanzar unmayor conocimiento de una realidad que es desconocida y sobre la cual se desea tomardecisiones confiables.

    Cualquiera que sea la actividad que realiza una persona, siempre se enfrentar al reto detomar decisiones. Cada da, iniciamos un juego en decisiones que va de la mano connuestro trabajo diario. Del mismo modo, para la gestin diaria de una empresa, de unsector, de un pas, etc. se requiere tomar continuamente decisiones; por ejemplo, paradar una medida econmica sobre modificacin de aranceles a los productos importadosse pueden tener algunas interrogantes como: De qu manera afectaran las medidas aotros sectores productivos? Generarn condiciones favorables para una mejora en latecnologa? Permitirn generar una mayor oferta de trabajo?, etc. Para tomar unadecisin al respecto es necesario tener informacin sobre el comportamiento de losdiferentes sectores econmicos y de la forma como se relacionan entre s. Obviamente,para esto se requiere disponer de datos apropiados (suficientes, oportunos y de buenacalidad), de metodologas y procesos que permitan alcanzar el conocimiento deseado dela realidad sobre la cual se tomaran decisiones. La estadstica tambin brinda apoyo aotras ciencias mediante el desarrollo de procesos dirigidos a la aceptacin y anlisis dedatos; de esta manera, se pueden asociar ciertos niveles de confiabilidad con losprocesos de toma de decisiones.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    2

    I. PRINCIPALES DEFINICIONES

    1. ESTADSTICACiencia que proporciona un conjunto de mtodos y tcnicas que se utilizan pararecolectar, organizar, presentar, analizar e interpretar el comportamiento delos datos con respecto a una caracterstica materia de estudio e investigacin.En primer lugar se encarga de obtener informacin, describirla y luego en base aesta informacin, realizar predicciones y una ptima toma de decisiones frente a laincertidumbre.

    El objeto de estudio de la Estadstica ES EL ESTUDIO DE LOS DATOS: Haceruna inferencia ptima a partir de los datos, para la toma de decisiones.

    1.1. QUIN UTILIZA LA ESTADSTICA?Las tcnicas estadsticas se aplican de manera muy general en mercadotecnia,contabilidad, control de calidad, estudio de consumidores, administradores deinstituciones, en la educacin, rganos polticos, en la medicina y pordiferentes profesionales que intervienen en la toma de decisiones.

    1.2. DIVISIN DE LA ESTADSTICA: El campo de la estadstica generalmenteest divido en dos grandes reas: Estadstica Descriptiva o Deductiva yEstadstica Inferencial o Inductiva.

    1.2.1. ESTADSTICA DESCRIPTIVA:Es el conjunto de mtodos que implican la recoleccin, presentacin ycaracterizacin de un conjunto de datos a fin de describir en formaapropiada las diversas caractersticas de estas. Es decir, un estudioestadstico se considera descriptivo cuando slo se analiza ydescribe un conjunto datos de una muestra o de una poblacin sinsacar conclusiones de tipo general.

    1.2.2. ESTADSTICA INFERENCIAL:La inferencia estadstica es un conjunto de mtodos o tcnicas queposibilitan la generalizacin o toma de decisiones en base a unainformacin parcial obtenida mediante tcnicas descriptivas.

    En este aspecto es inferir o predecir conclusiones que ataen a todafuente de informacin de donde provienen los datos. Ahora bien estaprediccin se hace con un cierto grado de confianza; este grado deconfianza se mide por la probabilidad.

    2. OBJETIVOS GENERALES DE LA ESTADSTICA:La estadstica tiene tres objetivos:

    2.1 Describir colecciones de datos empricos2.2 Inferir las propiedades de una poblacin.2.3 Realizar predicciones sobre el comportamiento de fenmenos.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    3

    2.1. DESCRIBIR COLECCIONES DE DATOS EMPRICOS: Para lograr esteobjetivo general de la estadstica es necesario realizar algunos procesos bsicos,tales como:

    - Evaluar y corregir los datos.- Clasificar los datos en categoras adecuadas.- Tabular los datos clasificados.- Representar los datos adecuadamente, ya sea en forma de tablas o grficos.- Obtener medidas de resumen.

    2.2. INFERIR LAS PROPIEDADES DE UNA POBLACIN: Esta cienciapretende inferir las propiedades de toda una poblacin en estudio a partir delanlisis e interpretacin de los datos conocidos de una muestra de dichapoblacin. Para lograr este segundo gran objetivo general de la estadstica sehan desarrollado conceptos, mtodos y tcnicas relacionadas con:

    - El muestreo estadstico.- La estimacin estadstica.- El clculo de probabilidades.- Las pruebas estadsticas.

    2.3. REALIZAR PREDICCIONES SOBRE EL COMPORTAMIENTO DEFENMENOS: El comportamiento de los fenmenos en el futuro constituyela mxima aspiracin prctica de toda ciencia, puesto que el intersfundamental en este caso es la toma de decisiones con vigencia y efecto en elfuturo. Esta ciencia ha desarrollado y sigue creando conceptos, mtodos ytcnicas para tal fin; los mismos que la convierten en poderosa ciencia auxiliarpara el progreso de otras ciencias.

    3. TRMINOS DE ESTADSTICA.La estadstica usa diversos trminos con un significado especial. Para ello esconveniente especificar el significado de algunos de los ms importantes yfrecuentes. A continuacin se incluyen algunos trminos.

    ESTADSTICAS. Es cualquier conjunto sistemtico de datos estadsticosreferentes a un determinado fenmeno o asunto. Por ejemplo: estadsticaseconmicas, estadsticas policiales, nmero de enfermos segn causas en unhospital, etc.

    Estadstica: Es Ciencia, y siempre se escribe con mayscula la primera letra

    Estadstico: Profesional que se dedica al estudio de la Estadstica.

    Estadista: Es el hombre de estado, ejemplo el presidente de la repblica, ministros,congresistas, etc.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    4

    POBLACIN(N)

    Es el conjunto de todos los individuos, objetos u observaciones que poseenalguna caracterstica observable en comn. Conjunto formado por todaslas unidades de anlisis (elementos) que son cobertura de la investigacinplanteada

    POBLACINOBJETIVO

    Conjunto formado por todas las unidades de anlisis para el cualse deben hacer las extrapolaciones e inferencias a manera degeneralizacin de los hallazgos realizados.

    POBLACINMUESTREADA

    Conjunto formado por todas las unidades de anlisis (elementos) queintegran al directorio o marco de muestreo que permite ver suidentificacin y forma de acceder a ella para efectuar las medicionesrespectivas.

    MUESTRA (n)

    Es una parte o subconjunto representativo de la poblacin y al proceso deobtener la muestra se le llama muestreo.Subconjunto de elementos elegidos de la poblacin muestreada a travsmtodos de seleccin determinados y del cual se obtendr la informacinprimaria cualitativa o cuantitativa que permitir estudiar, analizar y evaluar adicha poblacin

    UNIDAD DEANLISIS

    Es el elemento u objeto de la poblacin que ser analizado y sobre loscuales se obtendrn los datos.Eslaunidadbsicaenlaquesegeneralainformacinprimariaqueesobjetodelestudio

    UNIDAD DEMUESTREO

    Agrupaciones de unidades de anlisis claramente delimitadas no solapadas odisjuntas que cubren completamente al arco de muestreo. En ciertasinvestigaciones la unidad de muestreo coincide con la unidad de anlisis, sinembargo, con frecuencia la unidad de muestreo es un conglomerado quecomprende a un conjunto de unidades de anlisis

    MARCO DEMUESTREO

    Conjunto conformado por el listado de unidades de muestreo que:Permite su identificacin y localizacin de cada unidad de muestreo.Dispone de informacin suficiente para su estratificacin respectiva.Permite establecer la probabilidad de incluir cada unidad en la muestrarespectiva.

    DOMINIOSSubdivisiones de la poblacin para las cuales se prev elegir muestrasindependientes y representativas con el fin de generar estimaciones deconfiabilidad predeterminada.

    CENSO Decimos que realizamos un censo cuando se observan todos los elementosde la poblacin estadstica.

    CARACTERES

    La observacin del individuo la describimos mediante uno o mscaracteres. El carcter es, por tanto una cualidad o propiedad inherente enel individuo.

    TIPOS DE CARACTERES:Cualitativos: aquellos que son categricos, pero no son numricos.

    p. ej. , , ,...Ordinales: aquellos que pueden ordenarse, pero no son numricos.p. ej. .Cuantitativos: son numricos.

    p. ej. , , ,...

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    5

    MODALIDADVALOR

    Un carcter puede mostrar distintas modalidades o valores, es decir, sondistintas manifestaciones o situaciones posibles que puede presentar uncarcter estadstico. Las modalidades o valores son incompatibles yexhaustivos.

    Generalmente se utiliza el trmino modalidad cuando hablamos decaracteres cualitativos y el trmino valor cuando estudiamos caracterescuantitativos.p. ej. El carcter cualitativo puede adoptar las modalidades:casado, soltero, viudo. El carcter cuantitativo puede tomar losvalores: diez, once, doce aos,

    VARIABLEESTADSTICA

    Al conjunto de los distintos valores numricos que adopta un carctercuantitativo se llama variable estadstica.

    TIPOS DE VARIABLES ESTADSTICAS:Discretas: Aquellas que toman valores aislados (nmeros naturales), y queno pueden tomar ningn valor intermedio entre dos consecutivos fijados.p. ej. , , , ,...Continuas: Aquellas que toman infinitos valores (nmeros reales) en unintervalo dado, de forma que pueden tomar cualquier valor intermedio, almenos tericamente, en su rango de variacin.p. ej. , , , , ...

    OBSERVACIONES

    Una observacin es el conjunto de modalidades o valores de cada variableestadstica medidos en un mismo individuo.

    p. ej. En una poblacin de 100 individuos podemos estudiar, de formaindividual, tres caracteres: , y.

    PARMETROS.

    Son aquellas medidas que describen numricamente las caractersticas deuna poblacin. Una poblacin puede tener varias caractersticas y, por tanto,varios parmetros.

    Ejemplo: La media poblacional (), la desviacin estndar poblacional (),la varianza poblacional ( )Son aquellas medidas que describen numricamente las caractersticas deuna muestra. Tambin conocido como estimador puntual. Por ejemplo: Lamedia aritmtica, la mediana (Me), la moda (Mo).

    ESTADGRAFOS.

    Son aquellas medidas que describen numricamente las caractersticas deuna muestra. Tambin conocido como estimador puntual. Por ejemplo: Lamedia aritmtica, la mediana (Me), la moda (Mo).

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    6

    4. ETAPAS EN LA INVESTIGACIN ESTADSTICAEl mtodo estadstico, parte de la observacin de un fenmeno, y como no puedesiempre mantener las mismas condiciones predeterminadas o a voluntad delinvestigador, deja que acten libremente, pero se registran las diferentesobservaciones y se analizan sus variaciones.Para el planeamiento de una investigacin, por norma general, se siguen lassiguientes etapas:

    4.1. Planteamiento del problema.4.2. Fijacin de los objetivos.4.3. Formulacin de la hiptesis.4.4. Definicin de la unidad de observacin y de la unidad de medida4.5. Determinacin de la poblacin y de la muestra.4.6. La recoleccin.4.7. Crtica, clasificacin y ordenacin.4.8. Tabulacin.4.9. Presentacin.4.10. Anlisis.4.11. Publicacin.

    4.1.PLANTEAMIENTO DEL PROBLEMA

    Al abordar una investigacin se debe tener bien definido qu se va a investigary por qu se pretende estudiar algo. Es decir, se debe establecer unadelimitacin clara, concreta e inteligible sobre el o los fenmenos que sepretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, larevisin bibliogrfica del tema, para ver su accesibilidad y consultar losresultados obtenidos por investigaciones similares, someter nuestrasproposiciones bsicas a un anlisis lgico; es decir, se debe hacer unaubicacin histrica y terica del problema.

    4.2.FIJACIN DE LOS OBJETIVOSLuego de tener claro lo que se pretende investigar, Debemos presupuestar hastadnde queremos llegar; en otras palabras, debemos fijar cules son nuestrasmetas y objetivos.Estos deben plantearse de tal forma que no haya lugar a confusiones oambigedades y debe, adems, establecerse diferenciacin entre lo de corto,mediano y largo plazo, as como entre los objetivos generales y los especficos.

    4.3. FORMULACIN DE LAS HIPTESISUna hiptesis es ante todo, una explicacin provisional de los hechos objeto deestudio, y su formulacin depende del conocimiento que el investigador poseasobre la poblacin investigada. Una hiptesis estadstica debe ser susceptiblede docimar, esto es, debe poderse probar para su aceptacin o rechazo.Una hiptesis que se formula acerca de un parmetro (media, proporcin,varianza, etc.), con el propsito de rechazarla, se llama Hiptesis de Nulidad yse representa por Ho; a su hiptesis contraria se le llama Hiptesis Alternativa(H1).

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    7

    4.4. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDADDE MEDIDALa Unidad de Observacin, entendida como cada uno de los elementosconstituyentes de la poblacin estudiada, debe definirse previamente,resaltando todas sus caractersticas; pues, al fin de cuentas, es a ellas a las quese les har la medicin.La unidad de observacin puede estar constituida por uno o varios individuos uobjetos y denominarse respectivamente simple o compleja.El criterio sobre la unidad de medicin debe ser previamente definido yunificado por todo el equipo de investigacin. Si se trata de medidas delongitud, volumen, peso, etc., debe establecerse bajo qu unidad se tomarn lasobservaciones ya sea en metros, pulgadas, libras, kilogramos, etc.Asociado a la unidad de medida, deben establecerse los criterios sobre lascondiciones en las cuales se ha de efectuar la toma de la informacin.

    4.5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA.Estadsticamente, la poblacin se define como un conjunto de individuos o deobjetos que poseen una o varias caractersticas comunes. No se refiere estadefinicin nicamente a los seres vivientes; una poblacin puede estarconstituida por los habitantes de un pas o por los peces de un estanque, ascomo por los establecimientos comerciales o las unidades de vivienda de unaciudad.Existen desde el punto de vista de su manejabilidad poblaciones finitas einfinitas.

    Muestra es un subconjunto de la poblacin a la cual se le efecta la medicincon el fin de estudiar las propiedades del conjunto del cual es obtenida.En la prctica, estudiar todos y cada uno de los elementos que conforman lapoblacin no es aconsejable, ya sea por la poca disponibilidad de recursos, porla homogeneidad de sus elementos, porque a veces es necesario destruir lo quese est midiendo, por ser demasiado grande el nmero de sus componentes ono se pueden controlar; por eso se recurre al anlisis de los elementos de unamuestra con el fin de hacer inferencias respecto al total de la poblacin. Existendiversos mtodos para calcular el tamao de la muestra y tambin para tomarlos elementos que la conforman, pero no es el objetivo de este cursoestudiarlos. Diremos solamente que la muestra debe ser representativa de lapoblacin y sus elementos escogidos al azar para asegurar la objetividad de lainvestigacin.

    4.6. LA RECOLECCINUna de las etapas ms importantes de la investigacin es la recoleccin de lainformacin, la cual ha de partir, a menos que se tenga experiencia conmuestras anlogas, de una o varias muestras piloto en las cuales se pondrn aprueba los cuestionarios y se obtendr una aproximacin de la variabilidad dela poblacin, con el fin de calcular el tamao exacto de la muestra queconduzca a una estimacin de los parmetros con la precisin establecida.El establecimiento de las fuentes y cauces de informacin, as como la cantidady complejidad de las preguntas, de acuerdo con los objetivos de la

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    8

    investigacin son decisiones que se han de tomar teniendo en cuenta ladisponibilidad de los recursos financieros, humanos y de tiempo y laslimitaciones que se tengan en la zona geogrfica, el grado de desarrollo, laausencia de tcnica, etc.Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" sepuede conseguir; es determinar si la encuesta se debe aplicar por telfono, porcorreo, o si se necesitan agentes directos que recojan la informacin; establecersu nmero ptimo y preparar su entrenamiento y/o capacitacin adecuada.

    4.7. CRITICA, CLASIFICACIN Y ORDENACINDespus de haber reunido toda la informacin pertinente, se necesita ladepuracin de los datos recogidos. Para hacer la crtica de una informacin, esfundamental el conocimiento de la poblacin por parte de quien depura parapoder detectar falsedades en las respuestas, incomprensin a las preguntas,respuestas al margen, adems de todas las posibles causas de nulidad de unapregunta o nulidad de todo un cuestionario.Separado el material de "desecho" con la informacin depurada se procede aestablecer las clasificaciones respectivas y con la ayuda de hojas de trabajo, enlas que se establecen los cruces necesarios entre las preguntas, se ordenan lasrespuestas y se preparan los modelos de tabulacin de las diferentes variablesque intervienen en la investigacin.El avance tecnolgico y la popularizacin de los computadores hacen que estastareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo.

    4.8. LA TABULACIN.Una tabla es un resumen de informacin respecto a una o ms variables, queofrece claridad al lector sobre lo que se pretende describir; para su fcilinterpretacin una tabla debe tener por lo menos: Un ttulo adecuado el cualdebe ser claro y conciso. La Tabla propiamente dicha con los correspondientessubttulos internos y la cuantificacin de los diferentes tems de las variables, ylas notas de pie de cuadro que hagan claridad sobre situaciones especiales de latabla, u otorguen los crditos a la fuente de la informacin.

    4.9. LA PRESENTACINUna informacin estadstica adquiere ms claridad cuando se presenta en laforma adecuada. Los cuadros, tablas y grficos facilitan el anlisis, pero sedebe tener cuidado con las variables que se van a presentar y la forma dehacerlo. No es aconsejable saturar un informe con tablas y grficos redundantesque, antes que claridad, crean confusin.Adems la eleccin de determinada tabla o grfico para mostrar los resultados,debe hacerse no slo en funcin de las variables que relaciona, sino del lector aquien va dirigido el informe.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    9

    4.10. EL ANLISISLa tcnica estadstica ofrece mtodos y procedimientos objetivos queconvierten las especulaciones de primera mano en aseveraciones cuyaconfiabilidad puede ser evaluada y ofrecer una premisa medible en la toma deuna decisin.Es el anlisis donde se cristaliza la investigacin. Esta es la fase de ladeterminacin de los parmetros y estadsticos muestrales para lasestimaciones e inferencias respecto a la poblacin, el ajuste de modelos y laspruebas de las hiptesis planteadas, con el fin de establecer y redactar lasconclusiones definitivas.

    4.11. PUBLICACINToda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otrosestudiosos del mismo problema a quienes se les puede aportar informacin,conocimientos y otros puntos de vista acerca de l.

    5. MTODOS PARA RECOLECTAR DATOS:Existen tres principales mtodos con los cuales el investigador puede obtener losdatos:

    5.1. El investigador puede recurrir a datos ya publicados por fuentes gubernamentales,industrias, compaas o individuales.

    5.2.El investigador puede disear un experimento para obtener los datos necesarios.5.3.Puede efectuar una encuesta.

    5.1. FUENTES DE INFORMACIN: Es el lugar, la institucin, la persona, dondeestn los datos que se necesitan para cada una de las variables o aspectos de lainvestigacin. Las fuentes de datos pueden ser:

    5.1.1. FUENTES DE DATOS INTERNOS. Es la informacin recopilada por laempresa de los resultados de una propia gestin.

    Ejemplo: reportes financieros Reportes de operaciones, que estn dadas por la informacin de la

    produccin, compras, ventas, estados de prdida y ganancias. Reportes especiales, es la informacin adicional para el anlisis

    estadstico.

    5.1.2. FUENTES DE DATOS EXTERNOS. Son informaciones estadsticaselaboradas por instituciones de investigacin, que pueden ser pblicas oprivadas.

    5.1.3. FUENTES PRIMARIAS. Cuando la informacin estadstica es obtenidadirectamente de la unidad de observacin.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    10

    Por ejemplo: los resultados de los censos de poblacin y vivienda, lainflacin, la tasa de inters bancaria, ndice de precios al consumidor, etc.

    5.1.4. FUENTES SECUNDARIAS. Cuando la informacin estadstica eselaborada a base de los datos de fuentes primarias.El organismo oficial fundamental de datos estadsticos es el InstitutoNacional de Estadstica e Informtica (INEI).

    5.2. DISEO DE EXPERIMENTO: Es un segundo mtodo de recoleccin de lainformacin. Los diseos experimentales deben utilizarse siempre que seaposible cuando se desee construir modelos explicativos.

    5.3. ENCUESTAS: Proceso de recopilar la informacin a travs de una muestra.

    6. PRINCIPALES PROCEDIMIENTOS PARA RECOLECTARINFORMACIN.

    Toda informacin tiene dos aspectos fundamentales: Fuente de obtencin y mtodospara su recoleccin.

    FUENTE DE OBTENCIN. La fuente de obtencin puede ser primaria ysecundaria.

    Primarios. Cuando se recogen directamente de su origen.Secundarios. Cuando no se recogen directamente de su origen.

    MTODOS DE RECOLECCIN. Cuando es utilizada una fuente primaria pararecolectar informacin se distinguen dos procedimientos fundamentales: Laobservacin y el interrogatorio.

    MTODOS DE INTERROGATORIOS.El interrogatorio puede hacerse mediante dos mtodos:

    Mtodo directo (se efecta por medio de entrevistas)Mtodo indirecto (se efecta por medio de cuestionarios)

    SISTEMAS DE RECOLECCIN.Son procedimientos que se utilizan para recoger informacin.Pueden ser:

    a) Los Registros: son libros, padrones en donde se anotan en forma regular,permanente y obligatoria los hechos ocurridos.Ejemplo: Registros Civiles, RENIEC, Registros Pblicos, etc.

    b) Las Encuestas:son procedimientos de obtencin de informacin estructuradasegn criteriosprevios de sistematizacin que se efecta con un propsitoespecfico en la poblacin o en un sector de ella. Pueden ser:

    b.1) Encuesta Censal:Cuando abarca toda la poblacin en estudio.Ejemplo: censos de poblacin y vivienda en una localidad o pas

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    11

    b.2) Encuesta Muestral:Cuando abarca una parte de la poblacin en estudio.Ejemplo: llevar a cabo una encuesta de preferencia electoral.

    TCNICAS DE RECOLECCINSon procedimientos que se utilizan para recolectar informacin segn la naturaleza deltrabajo de investigacin. Pueden ser:

    a) La observacin: Es la accin de mirar con rigor, en forma sistemtica yprofunda, con el inters de descubrir la importancia de aquello que se observa.

    b) El cuestionario: En un instrumento constituido por un conjunto de preguntassistemticamente elaboradas que se formulan al encuestado o entrevistado con elpropsito de obtener datos de las variables consideras en estudio.

    c) La entrevista: Es un dialogo entre personas, es una tcnica donde una personallamada entrevistador, encuestador o empadronador solicita al entrevistado leproporcione algunos datos e informacin.

    d) Anlisis de contenido: El fin o propsito del anlisis de contenido consiste endeterminar los puntos ms importantes de un documento para observar yreconocer el significado de los mismos en sus elementos, como palabras, frases,etc., y en clasificarlos adecuadamente para su anlisis y explicacin.

    DATO: Es el valor que toma una variable en cada unidad de anlisis. Los datos estnclasificados en:

    SEGN EL NMERO DE VARIABLES.1. DATOS UNIDIMENSIONALES: Cuando el registro es de una sola variable de

    inters. Por ejemplo: El promedio semestral de los estudiantes del tercer ao delFIIS-UNAS.2009 - II

    2. DATOS BIDIMENSIONALES: Cuando el registro es de dos variables deinters. Por ejemplo: La edad y el promedio semestral de los estudiantes deltercer ao del FIIS-UNAS.2009 - II

    3. DATOS TRIDIMENSIONALES: Cuando el registro es de tres variables deinters. Por ejemplo: La edad, el ingreso mensual y el promedio semestralde los estudiantes del tercer ao del FIIS-UNAS.2009 - II

    7. TIPOS DE DATOS.Sea cual fuere la fuente de la que obtenemos la informacin, esta puede estarreferida a caractersticas cualitativas o cuantitativas.

    VARIABLE.Es una caracterstica de la poblacin que se va investigar y que puede tomardiferentes valores.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    12

    Ejemplo.Las horas extras trabajadas por los trabajadores de una empresa y los valores de estavariable vendran dadas por las diferentes horas trabajados por cada trabajador fuerade la jornada normal: ninguna, una, dos, tres, .Notacin. Las variables se denotaran por X, Y, etc.Las variables se clasifican en: cualitativas y cuantitativas.

    VARIABLE CUALITATIVA.

    Se llama as, cuando la variable est asociada a una caracterstica cualitativa. Esdecir, son variables cuyos valores son cualidades que presenta la poblacin.

    Ejemplos.La variable profesin puede adoptar las modalidades: Ingeniero, Mdico,

    Bilogo, Contador, Economista, etc.

    Calidad de servicio del supermercado (Malo, Bueno, Muy Bueno, Excelente)Estado civil o conyugal (Soltero, Casado, Viudo, Divorciado, Conviviente)Rgimen de tenencia de la vivienda (Propia, Alquilada)

    Estos datos a su vez se clasifican en: Nominales y ordinales

    VARIABLE CUALITATIVA NOMINAL: Son aquellos que establecen distincinde los elementos en las categoras sin implicar orden entre ellos.

    Ejemplo:Clasificar un grupo de individuos por sexo: masculino, femenino.Por estado civil: soltero, casado, viudo. Etc.

    VARIABLE CUALITATIVA ORDINAL.Son aquellos datos que agrupan a los objetos, individuos, en categoras ordenadas,para establecer relaciones comparativas. Es decir, se puede establecer un orden entresus atributos.Ejemplo.Calidad de servicio del supermercado (Malo, Bueno, Muy Bueno, Excelente)Nivel de educacin (primaria, secundaria, superior).

    VARIABLE CUANTITATIVA: Es el resultado de un proceso que cuantifica, esdecir, estas surgen cuando se puede establecer cuanto o en que cantidad se poseeuna determinada caracterstica.

    Ejemplo:Ingreso por familiaNmero de ventas diarias de cierto establecimiento.Nmero total de habitaciones que tiene la vivienda.Longitud, tiempo, etc.

    Las variables cuantitativas se dividen en discretas y continuas.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    13

    VARIABLE CUANTITATIVA DISCRETA. Son aquellas que surgen por elprocedimiento de conteo, suelen tomar valores enteros (positivos).Ejemplo.El nmero de hijos por familia.Nmero de estudiantes por colegio, universidad.VARIABLE CUANTITATIVA CONTINUA. Cuando el valor de la variablepuede tomar cualquier valor dentro de un rango dado, por tanto se expresa porcualquier nmero real.

    Ejemplo.El peso, la estatura, la tensin arterial de las personas, los ingresos, el tiempo deservicio, precio en soles, etc.En general, todas las magnitudes relacionadas con el tiempo (edad, duracin de unfenmeno,...), la masa (volumen; peso,.), el espacio (longitud, superficie,) ouna combinacin de estos (velocidad, densidad, capacidad,) son variablescontinuas.

    MUESTREOPara estudiar, analizar y evaluar una poblacin con el fin de efectuar un diagnosticorequerir de contar con informacin cuantitativa y cualitativa:

    Representativa, Oportuna, Confiable y Suficiente

    Esto se lograr a travs de observaciones y mediciones sobre una muestra de elementosadecuadamente elegidos de la poblacin bajo en estudio.

    1) Poblacin y muestra.Poblacin.Conjuntos formado por todas las unidades de anlisis (elementos) que soncobertura de la investigacin planteada.

    2) Muestra. Es una parte o subconjunto representativo de la poblacin y al procesode obtener la muestra se le llama muestreo.

    Motivos para la realizacin de un muestreo. Consideraciones necesarias

    Imagine que va a realizar estudios para conocer la siguiente informacin:

    El porcentaje de peruanos que tiene acceso a internet. La duracin media de una determinada marca de pilas.

    Para el primer caso, la poblacin a la que debes preguntar es de ms de 30 millones depersonas. Es obvio que entrevistar a ms de 30 millones de personas supone un granesfuerzo en varios sentidos.Primero, de tiempo, y segundo de dinero, puesto que es necesario contratar a muchosencuestadores, pagarles viajes para que lleguen a todos los pueblos, etc. Adems, hayuna dificultad aadida: es difcil llegar a todos y cada uno de los ciudadanos peruanos,ya que cuando vayamos a entrevistar, habr personas que est de viaje fuera del pas,habr gente que est enferma en el hospital, etc. En este caso, por motivos econmicos,

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    14

    de tiempo y de dificultad de acceso a toda la poblacin, sera conveniente entrevistar auna cierta parte de la poblacin, una muestra, elegida convenientemente para poderextraer despus conclusiones a toda la poblacin.

    En el segundo caso tenemos una problemtica diferente. Para poder estudiar la duracinde una pila, debemos usarla hasta que se gaste, lo que nos impide volver a usar la pila.Es decir, de alguna manera destruimos este elemento de la poblacin. Si quisiramosprobar todas y cada una de las pilas, nos quedaramos sin ellas. En este caso, de nuevosera conveniente estudiar slo un conjunto de esas pilas y luego extraer conclusionesms generales a partir del conjunto que hemos estudiado.Por las razones anteriores, en muchos casos es conveniente el uso de muestras, peropara que podamos extraer conclusiones, es importante que elijamos bien las muestraspara nuestros estudios.Por ejemplo, para el caso del acceso a internet de los peruanos, elegir a 10 personas de30 millones es insuficiente, no es representativo. Tampoco lo sera preguntarle, porejemplo a 100 personas de Lima, o elegir a todos sus amigos y su familia. Haycuestiones que debemos especificar a la hora de elegir una muestra:

    1. El mtodo de seleccin de los individuos de la poblacin (tipo de muestreo quese va a utilizar).

    2. El tamao de la muestra.3. El grado de fiabilidad de las conclusiones que vamos a presentar, es decir, una

    estimacin del error que vamos a cometer (en trminos de probabilidad).

    Como ya hemos mencionado, la seleccin no adecuada de los elementos de la muestraprovoca errores posteriores a la hora de estimar las correspondientes medidas en lapoblacin. Pero podemos encontrar ms errores: el entrevistador podra no serimparcial, es decir, favorecer que se den unas respuestas ms que otras. Puede ocurrirtambin que, por ejemplo, la persona que vayamos a entrevistar no quiera contestar aciertas preguntas (o no sepa contestar). Clasificamos todos estos posibles errores de lasiguiente manera:

    1. Error de sesgo o de seleccin: si alguno de los miembros de la poblacin tienems probabilidad que otros de ser seleccionados. Imagine que queremos conocerel grado de satisfaccin de los clientes de un gimnasio y para ello vamos aentrevistar a algunos de 10 a 12 de la maana. Esto quiere decir que las personasque vayan por la tarde no se vern representadas por lo que la muestra norepresentar a todos los clientes del gimnasio. Una forma de evitar este tipo deerror es tomar la muestra de manera que todos los clientes tengan la mismaprobabilidad de ser seleccionados.

    2. Error o sesgo por no respuesta: Es posible que algunos elementos de lapoblacin no quieran o no puedan responder a determinadas cuestiones. Otambin puede ocurrir, cuando tenemos cuestionarios de tipo personal, quealgunos miembros de la poblacin no contesten sinceramente. Estos errores son,en general, difciles de evitar, pero en el caso de la sinceridad, se suelenincorporar cuestiones (preguntas filtro) para detectar si se est contestandosinceramente.

    Despus de lo que se acaba de ver, podemos decir que una muestra es sesgada cuandono es representativa de la poblacin.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    15

    MTODOS DE MUESTREO.Ya hemos hecho referencia a la importancia de la correcta eleccin de la muestra paraque sea representativa para nuestra poblacin pero cmo clasificamos las diferentesformas de elegir una muestra? Podemos decir que hay dos tipos de muestreo:

    Muestreo probabilstico: Es aquel en el que cada muestra tiene la mismaprobabilidad de ser elegida de la poblacin en estudio.

    Muestreo no probabilstico: Corresponden a las muestras en las cuales no hayforma de conocer la probabilidad de los elementos de la poblacin y serincluidos como parte de la muestra.

    Fortalezas y debilidades de los mtodos de muestreo:

    MUESTREO PROBABILSTICOFORTALEZAS DEBILIDADES Es aceptado con facilidad Requiere de costos, marcos de muestreo Asegura representatividad Requiere de trabajos de campo costosos Asegura muestras insesgadas Requiere de supervisin rigurosa Los resultados son generalizables Permite calcular el error de muestreo Permite hacer inferencias estadsticas Probabilidad conocida de elegir a la

    unidad como parte de la muestra

    MUESTREO NO PROBABILSTICOFORTALEZAS DEBILIDADES Bajo costo y requiere menor tiempo No permite calcular errores de muestreo Elige solo a las unidades queridas Sus resultados no son generalizables Permite entrar informacin inesperada Pueden ser rechazadas por los usuarios Diseo y cobertura flexible e informal Puede haber sesgo en la seleccin

    No permite hacer inferencia estadstica Requiere de personal muy especializado La supervisin es difcil de realizar Probabilidad no conocida de elegir a la

    unidad como parte de la muestra.

    Seleccin de muestras bajo un enfoque cuantitativo.

    Ante la necesidad de generar informacin cuantitativa representativa y confiable, elmtodo a seguir para la seleccin del subconjunto de unidades de anlisis comomuestra, deber asegurar la representatividad de los elementos elegidos a fin de permitir

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    16

    al investigador efectuar inferencias, extrapolaciones y generalizaciones de los resultadosencontrados hacia toda la poblacin objetivo; en este enfoque, se deber asegurar que lamuestra ser estadsticamente representativa con el fin de permitir:

    Calcular el error de muestreo que afectan a las estimaciones resultantes. Conocer el nivel de confianza con el cual se realizan las estimaciones resultantes. Generalizar los resultados observados en la muestra a toda la poblacin. Utilizar pruebas estadsticas para verificar hiptesis planteadas en la investigacin.

    En caso que el investigador requiera de presentar resultados estadsticamenterepresentativos, deber asegurar selecciones de muestras imparciales e insesgadas locual se lograra eligiendo las unidades con base a las leyes de la probabilidad.

    Diseos de Muestreo:

    Muestreo Aleatorio Simple.

    Es el mtodo de muestreo que asegura que cada una de las unidades de anlisis tieneigual probabilidad de ser incluida en la muestra, igualmente, cada una de las muestrasposibles tendr la misma probabilidad de ser elegida; esta caracterstica asegura larepresentatividad e imparcialidad de la muestra elegida para el estudio.

    Procedimiento: Elabore el marco de muestreo. Determine un tamao de muestra n. Seleccione n nmeros aleatorios sin reemplazo de la tabla de nmeros

    aleatorios o generados por un computador. Recopile la informacin de cada una de las unidades de anlisis seleccionadas. Estimar: Promedios, totales o porcentajes y su error estndar respectivo.

    Estimacin del promedio

    Estimacin del total poblacional

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    17

    Estimacin de la proporcin de elementos que tienen un determinado atributo.

    Donde a es total de elementos de la muestra que tienen el atributo.

    Ejemplo.

    Poblacin de alumnos matriculados en 5to. Ao de secundaria (N). N = 7 154alumnos1.

    Conociendo la poblacin de alumnos matriculados en 5to. Ao de secundaria.

    La muestra inicial estara dado por:

    Muestra inicial:

    = ( 1) + Donde:

    N = tamao de la poblacin. Entonces: N = 7 154

    Z = Valor de distribucin normal estandarizado con probabilidad (1 ). Para 95% deconfianza Z = 1.96

    1 [Fuente: MINISTERIO DE EDUCACIN - Censo Escolar./ http://escale.minedu.gob.pe/magnitudes]

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    18

    Como se desconoce la probabilidad de xito esperada, se tendra que utilizar elcriterio conservador (p = q = 0.5), lo cual maximiza el tamao de muestra.

    p = probabilidad de xito. p = 0.5

    q = probabilidad de fracaso. (1 p) = (1 0.5) = 0.5

    e = precisin (Error mximo admisible) = 5%

    = 1.96 0.5 0.5 7 1540.05 (7 154 1) + 1.96 0.5 0.5 = 365Muestra final corregida a encuestar: = 1 +

    = 3651 + = 347 .Se requerira encuestar a no menos de 347 estudiantes del 5to ao de secundaria parapoder tener una seguridad del 95%.

    8. DISEO O ELABORACIN DE FORMULARIOS.En toda actividad de carcter cientfico, lo que se hace en ltima instancia, es darrepuestas a ciertas preguntas. De acuerdo con esto, necesitamos un documento dondeplantear preguntas y registrar sus respuestas, resultando as que una de las primeras yrealmente ms decisiva etapa en cualquier investigacin es la confeccin deformularios.Antes de elaborar un formulario debe considerarse:

    1. El propsito para el cual ser utilizado.2. Circunstancias bajo las cuales se recogern la informacin.

    Lo primero tiene importancia para decidir sobre los datos que se recogern y lo segundopara la determinacin del tamao de muestra y del material ms conveniente.

    9. PRINCIPIOS BSICOS QUE SE DEBEN TENER EN CUENTA EN LACONFECCIN DE FORMULARIOS.

    En todo formulario se debe recoger slo los datos tiles y adecuados al estudio.Formularios muy extensos conspiran contar la exacta recoleccin de los datos. Es pues,entonces conveniente:

    a. Hacer una lista de todos los datos que sean necesario recoger de acuerdo a lafinalidad del estudio.

    b. Considerar cuales datos son factibles de recoger y exacta.c. Limitar a aquellos datos prcticos a recoger y que se usar.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    19

    DECIDIR SOBRE EL ORDEN QUE SE ACEPTARAN LOS DATOS. Laspreguntas deben hacerse de manera lgica y ordenada. Por ejemplo, preguntas sobreocupacin, educacin, vivienda, y otras referentes a condiciones econmicas y socialesno deben estar separadas.

    CONSIDERAR COMO SE HARN LAS PREGUNTAS.a. Considerar si hay alguna ambigedad en la pregunta como consecuencia de la

    respuesta recibida.b. Toda pregunta debe tener respuesta.c. Debe usarse un leguaje claro y poco tcnico.d. Evitar respuestas inducidas. Por ejemplo, Ud., nunca ha padecido de

    tuberculosis? con esta pregunta estamos induciendo a la persona a que surespuesta sea negativa.

    PLANEAR COMO SE ANOTARAN LAS RESPUESTAS.

    El espacio que se deja debe ser adecuado para las respuestas que se esperan y siempreque sea posible se adoptar el sistema que exige el menor esfuerzo.Ejemplo.

    a. Sexo:; b.Sexo:..Femenino..Masculino.

    En el inciso (a), se pone nombre y en el (b), se marca con una cruz, este ltimo es demenor esfuerzo.

    Puede usarse otro mtodo que sea la utilizacin de un cdigo, por ejemplo, Debeexistir una revisin peridica de salario mnimo?

    SiNoNo sabe o no opina.

    ELECCIN DE VARIAS RESPUESTAS.

    Debe procurarse que se puede elegir varias respuestas, evitando la ambigedad uomisin de datos.Ejemplo.Enfermedades que Ud. Ha padecido?Sarampin___________________Bronquitis___________________Asma ___________________

    REALIZAR ESTUDIO PILOTO.

    120

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    20

    Debe realizarse un estudio piloto antes que el formulario sea impreso de maneradefinitiva, con el fin de probarlo y ver la operatividad del formulario y para darse cuentade las fallas que pueda tener y hacer las correcciones necesarias.

    Se debe redactar las instrucciones de como anotar las respuestas.

    Ver la validez y confiabilidad del instrumento de medicin (Encuesta).

    CASO PRCTICO DE DISEO DE ENCUESTAProyecto Gimnasio Sport Time

    Un grupo de inversionistas ha formado una mediana empresa llamada Sport Time, cuyonegocio es el servicio de preparacin y mantenimiento fsico de las personas. Deacuerdo con sus experiencias empresariales, este gimnasio ser dirigido a los integrantesdel nivel socio econmico A y B de la ciudad de Tingo Mara, teniendo como rea deinfluencia a la ciudad. Sin embargo les gustara poder contar con mayor informacin delmercado con la finalidad de crear y ofrecer un centro deportivo de calidad, incorporandolos gustos y preferencia del futuro cliente.Frente a esta necesidad, uno de los socios propuso realizar una investigacin demercado, propuesta que fue aceptada por todos para tal efecto se procedi a determinarlos parmetros que definen correctivamente las caractersticas de la poblacin queconforma su mercado:

    1.- El segmento estar compuesto por hombres y mujeres con edades entre 18 y 60 aos.2.- El gimnasio estar orientado al segmento A y B de la ciudad de Tingo Mara.

    Una vez determinado estos parmetros se considero que los ms convenientes pararealizar esta investigacin era aplicar una encuesta cuyo proceso de elaboracin implicaseguir los siguientes pasos:

    A.- Definir el propsito y los objetivos especficos.B.- Disear la encuesta.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    21

    Solucin

    A.- Propsito y Objetivos especficos de la encuesta.

    Propsito: Sera evaluar las actitudes y preferencias de las personas respecto a losgimnasios.

    Objetivo Especfico: Se desea obtener informacin sobre caractersticas delconsumidor que permitan tipificarlo, determinar sus expectativas en cuanto al servicio:Adems identificar la competencia y los niveles de precio vigente en el mercado.

    OBJETIVOS ESPECIFICOS PREGUNTAS DE INVESTIGACINCONSUMIDOR PREGUNTAS DE INVESTIGACIN

    Identificacin de hbitos

    Acudes al gimnasio? Por qu acudes al gimnasio? Con que frecuencia vas al gimnasio? Qu instalaciones utilizas con ms

    frecuencia en el gimnasio? A qu gimnasio acudes? Desde cundo acude al gimnasio?

    Intencin de compra Asistiras a un gimnasio ubicado enel centro de la ciudad?

    SERVICIO PREGUNTAS DE INVESTIGACIN

    Caractersticas del servicio Qu servicio te gustara encontrar

    en el gimnasio? Qu tipo de decoracin te

    gustara encontrar?

    COMPETENCIA PREGUNTAS DE INVESTIGACIN Identificacin de competidores Qu gimnasios conoces?

    PRECIO PREGUNTAS DE INVESTIGACIN Precio mximo y mnimo Cunto estara dispuesto a pagar

    mensualmente por el servicio?

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    22

    B). Diseo de Encuesta.

    1. Asiste Ud. a gimnasios?a. Si (pasar a la pregunta 3)b. No (pasar a la pregunta 2)

    2. Le gustara asistir a un gimnasio?a. Si (pasar a la pregunta 3)b. No (fin de la encuesta)

    3. Con que frecuencia asiste y/o legustara asistir gimnasio?a. Diariamente.b. Una vez por semana.c. Dos veces por semana.d. Tres veces por semana.

    4. Qu tipo de servicios prefieresutilizar en el gimnasio?a. Aerbicos.b. Pesas.c. Baile.d. Masajes.e. Otros. (Especifique).

    5. Con quien acude al gimnasio?a. Solo.b. Amigo(a).c. Pareja.d. Familia.e. Otros (Especifique).

    6. A qu gimnasio asiste?.

    7. Qu gimnasio conoce?a. Benavidesb. Universal Gymc. Shape spad. Alan Wong Spaf. Otros (Especifique).

    8. Si contara con un gimnasioubicado en la ciudad de tingomara, el cual le ofreciera losservicios que usted desea:a. Definitivamente asistira.b. Probablemente asistira.c. Indeciso.d. Probablemente no asistira.e. No asistira.

    9. A qu hora prefieres asistir?

    a. 6 : 00 am a 8 : 00 amb. 8 : 00 am a 10 : 00 amc. 10 : 00 am a 12 : 00 amd. 12 : 00 am a 2 : 00me. 12 : 00 m a 4 : 00 pmf. 4 : 00 pm a 6 : 00 pmg. 6 : 00 pm a 8 : 00 pmh. 8 : 00 pm a 10 : 00 pm.

    10. Cunto estara dispuesto a pagarmensualmente por el servicio?a. Menos de S/. 30.00b. Entre S/. 30.00 y S/. 39.00c. Entre S/. 40.00 y S/. 49.00d. Mas de S/. 50.00.

    DATOS DE CONTROL

    11. Sexo: Femenino..Masculino.

    12. Edad.a. 18 a 25 aos.b. 26 a 33 aos.c. 34 a 41 aos.d. 42 a 49 aos.e. 50 a 60 aos.f.

    13. Ingreso promedio mensual familiara. Menos de S/. 700.00.b. Entre S/. 701.00 y S/. 1000.00c. Entre S/. 1001.00 y S/. 1300.00d. Mas de S/. 1301.

    DATOS DE IDENTIFICACIN DELENTREVISTADO

    Nombre:

    Direccin:.

    Telfono:..

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    23

    VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS DE MEDICIN(ENCUESTAS):Estos procesos se aplican en el desarrollo de una investigacin, con la finalidad deevaluar la consistencia del diseo de la estructura de los instrumentos de recoleccinque se usaran para el acopio y recoleccin de la informacin necesaria para la ejecucinde una investigacin.

    II.- CONFIABLIDAD DE LOS INSTRUMENTOS (Encuestas):La confiabilidad de un instrumento de medicin, se refiere al grado en que suaplicacin repetida al mismo sujeto u objeto produce resultados iguales.La confiabilidad de un instrumento se refiere a la constitucin interna de las personas, ala mayor o menor acescencia de errores de medida. Un instrumento confiable significaque si lo aplicamos por ms de una vez a un mismo elemento entoncesobtendramos iguales resultados.

    METODOS PARA CALCULAR LA CONFIABILIDAD DE UNINSTRUMENTO DE MEDICIN:Hay diversos mtodos para determinar la confiabilidad de un instrumento de medicin.Todos utilizan formulas que producen coeficientes de confiabilidad estos coeficientespueden oscilar entre 0 y 1, donde un coeficiente de o significa nulo confiabilidad y 1representa un mximo de confiabilidad (confiabilidad total).

    CONFIABILIDAD

    Muy Baja Baja Regular Aceptada Elevada0 10% 100%

    Confiabilidad del instrumento debe ser: Mayor al 50 %2.1.- METODO DE LA MEDIDA DE ESTABILIDAD: METODO DE TEST RETEST.

    Consiste en la aplicacin de dos veces o ms veces un mismo instrumento de medicin a unmismo grupo de personas, despus de cierto perodo. Si la correlacin entre los resultados delas diferentes aplicaciones es altamente positiva, el instrumento se considera confiable.Se determinar mediante el clculo de Coeficiente de Correlacin de Pearson (r).= ( )( ) Donde:

    n = Nmero de parejas.Xi : valores obtenidos en el momento 1Yi : valores obtenidos en el momento 2

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    24

    2.2.- METODO DE DIVIDIR EN MITADES (Ver Ejemplo en el presente mdulo)

    Consiste en calcular el coeficiente de correlacin de Pearson entre las dos mitades decada factor (pares o impares) de los elementos y luego corregir los resultados segn lafrmula de Sperman Brown, que es una frmula de correccin, que da comoresultado un estimulo corregido de confiabilidad. Este mtodo requiere solo unaaplicacin de la medicin. Especficamente el conjunto total de tems (ocomponentes) se divide en dos mitades y se comparan las puntuaciones o losresultados de ambas. Si el instrumento es confiable, las puntuaciones de ambasmitades deben estas muy correlacionadas.

    Procedimiento de dos mitades (divisn de items en pares e impares)Primero : Se calcula el ndice de Correlacin (Pearson)

    = ( )( ) Alumnos Items Impar ParI II III Xi Yi Xi*Yi Xi2 Yi2

    Campos (1) 3 5 5 8 5 40 64 25Gmez (2) 5 4 5 10 4 40 100 16Linares (3) 4 4 5 9 4 36 81 16Rodas (4) 4 5 3 7 5 35 49 25Saavedra (5) 1 2 2 3 2 6 9 4Tafur (6) 4 3 3 7 3 21 49 9

    = 44 23 178 352 95Reemplazando:

    = 6 178 (44 23)[6 352 (44) ] [6 95 (23) ] = 0.66Indice de correlacin de Pearson ( r ) = 0.66.

    Segundo: Correccin de r con la ecuacin de Spearman Brown ( R ) :

    Coeficiente de fiabilidad = 0.792.3.- MTODO COEFICIENTE ALFA DE CRONBACH:Requiere de una sola administracin del instrumento de medicin y se basa en lamedicin de la respuesta del sujeto con respecto a los tems del instrumento.Su ventaja reside en que no es necesario dividir en dos mitades a los tems delinstrumento de medicin; simplemente se aplica la medicin y se calcula el coeficiente.

    r

    rR+

    =

    12

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    25

    CLCULO DEL COEFICIENTE:

    = 1 1 Donde:K : Es el nmero de tems. : Sumatoria de varianzas de los tems.

    : Varianza de la suma de los tems.: Coeficiente de Alfa de cronbach.

    EJEMPLO:Se tienen los resultados referidos a la opinin de 06 alumnos respecto a los temsformulados en un cuestionario

    Alumnos ItemsI II IIICampos (1) 3 5 5Gmez (2) 5 4 5Linares (3) 4 4 5Rodas (4) 4 5 3Saavedra (5) 1 2 2Tafur (6) 4 3 3

    PROCEDIMIENTO:Paso 1: Calcular las varianzas de cada uno de los tems; en el cuadro de clculo.

    AlumnosItems

    Suma de ItemsI II III

    Campos (1) 3 5 5 13Gmez (2) 5 4 5 14Linares (3) 4 4 5 13Rodas (4) 4 5 3 12Saavedra (5) 1 2 2 5Tafur (6) 4 3 3 10VAR. ( ) 1.90 1.37 1.77 = 10.97

    Paso 2: Calcular la sumatoria de varianzas de los tems.

    Paso 3: Calcular la varianza de la suma de los tems.= 10.97

    Paso 4: Calcular el coeficiente de Alfa de Cronbach. = 0.81Paso 5: Interpretacin de la significancia de = 0.81; lo que significa que los resultadosde opinin de los 06 alumnos respeto a los tems considerados se encuentrancorrelacionado de manera altamente confiable y muy aceptable.

    = 5.03

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    26

    Ejercicio 1. Con el fin de medir los niveles de actitud adversa hacia la fauna silvestre enuna comunidad rural, se propone aplicar la escala de medicin siguiente:

    Asignando los puntajes de medicin a cada tem de ponderaciones iguales y partiendode 1 tenemos:

    [1 = Nunca (N), 2 = Pocas Veces (PV), 3 = A veces (AV), 4 = Muchas Veces (MV), 5 =Siempre (S)]

    Solucin: Para probar la escala se entrevista a 10 agricultores y se obtienen lasrespuestas:

    Cuadro N 01: Distribucin de Agricultores entrevistados segn los niveles de actitud2adversa hacia la fauna silvestre en una comunidad rural Junio de 2012.

    Encuesta I1 I2 I3 I4 I5 I6 TotalE1 2 1 1 1 2 1 8E2 1 1 1 1 2 1 7E3 1 2 2 1 2 2 10E4 2 2 2 1 2 3 12E5 3 3 3 3 3 3 18E6 2 3 3 3 3 4 18E7 4 4 4 3 5 4 24E8 4 4 4 3 5 4 24E9 5 5 4 5 5 5 29

    E10 5 5 5 5 5 4 29Variancia 2.322 2.222 1.878 2.489 2.044 1.878 = 70.54

    = 12.833Fuente: Elaboracin propia.

    Determinacin del Coeficiente Alfa de Cronbach ( ):

    = = 1 . . = 0.982Donde:n: Es el nmero items incluidos en la escala de medicin =6S2j: Variancia del j-simo item de la escala =12.833S2x: Variancia del puntaje total obtenido a travs de la escala de medicin = 70.54Comentario:De 10 agricultores entrevistados la fiabilidad de las respuestas de los 6 items segn elcoeficiente alfa de Cronbach ( = 0.982), indica que las respuestas o resultados de losindividuos entrevistados son muy consistentes, es decir presenta una confiabilidadaceptable.Salida de SPSS vs 20.0:

    2 [1 = Nunca (N), 2 = Pocas Veces (PV), 3 = A veces (AV), 4 = Muchas Veces (MV), 5 = Siempre (S)]

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    27

    Estadsticos de fiabilidad

    Alfa de Cronbach Alfa de Cronbach basada enlos elementos tipificados N de elementos

    ,982 ,982 6

    Matriz de correlaciones inter-elementosI1 I2 I3 I4 I5 I6

    I1 1,000 ,929 ,899 ,906 ,938 ,803I2 ,929 1,000 ,979 ,945 ,938 ,925I3 ,899 ,979 1,000 ,905 ,930 ,893I4 ,906 ,945 ,905 1,000 ,867 ,843I5 ,938 ,938 ,930 ,867 1,000 ,828I6 ,803 ,925 ,893 ,843 ,828 1,000

    Estadsticos de resumen de los elementosMedia Mnimo Mximo Rango Mximo/mnimo Varianza N de

    elementosVarianzas delos elementos 2,139 1,878 2,489 ,611 1,325 ,062 6

    Ejercicio 2. Estime el ndice de fiabilidad del cuestionario con base en la correlacinpar impar.

    El coeficiente de fiabilidad par impar se calcula con base en la correlacin entre lospuntajes totales obtenidos con los tems pares e impares utilizando la funcin EXCEL:

    Suma de puntos de ItemsImpares Pares

    5 34 35 56 69 98 10

    13 1113 1114 1515 14

    rPI = 0.949

    COEF.DE.CORREL (Impares; Pares) = rPI = 0.949

    Coeficiente de fiabilidad: = = ( . ). = 0.974

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    28

    Comentario: se registra un alto ndice de fiabilidad para la alta consistencia interna quese registra entre los tems pares e impares del instrumento.Ejercicio 3. Encuentre los ndices de homogeneidad corregidos para cada tem.

    Cuadro N 02: Distribucin de Agricultores entrevistados segn los niveles de actitudadversa hacia la fauna silvestre en una comunidad rural Junio de 2012.

    Encuesta I1 I2 I3 I4 I5 I6E1 6 7 7 7 6 7E2 6 6 6 6 5 6E3 9 8 8 9 8 8E4 10 10 10 11 10 9E5 15 15 15 15 15 15E6 16 15 15 15 15 14E7 20 20 20 21 19 20E8 20 20 20 21 19 20E9 24 24 25 24 24 24

    E10 24 24 24 24 24 25ndices de homogeneidadcorregidos para cada tem 0.932 0.991 0.963 0.929 0.938 0.885

    Fuente: Elaboracin propia.

    Interpretacin: El tem 6 es el menos relacionado con la prueba general.

    Ejercicio 4. Un ndice de validez del cuestionario previsto.

    En base la valoracin global efectuada por los entrevistados, estime:

    Entrevista PuntajeTotalCalificativo

    Global1 8 52 7 73 10 74 12 75 18 146 18 147 24 178 24 179 29 20

    10 29 20

    Correlacin entre puntajesCOEF.DE.CORREL (total; global) = rxx = 0.984Interpretacin: Este coeficiente alto indica una aceptable validez de constructo

    5. Calcule el coeficiente de fiabilidad de pruebas paralelas.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    29

    Cuestionario AEncuesta I1 I2 I3 I4 I5 I6 Total

    E1 2 1 1 1 2 1 8E2 1 1 1 1 2 1 7E3 1 2 2 1 2 2 10E4 2 2 2 1 2 3 12E5 3 3 3 3 3 3 18E6 2 3 3 3 3 4 18E7 4 4 4 3 5 4 24E8 4 4 4 3 5 4 24E9 5 5 4 5 5 5 29

    E10 5 5 5 5 5 4 29

    Coeficiente de Fiabilidad = COEF.DE.CORREL (A; B) = -0.062

    Interpretacin: El Coeficiente de Fiabilidad es bajo por lo tanto no indica unaaceptable validez de constructo.

    Cuestionario BEncuesta I1 I2 I3 I4 I5 I6 I7 I8 Total

    E1 2 1 2 2 3 1 1 3 15E2 4 5 5 3 4 3 1 2 27E3 4 3 4 4 3 4 3 3 28E4 4 4 4 4 4 4 5 4 33E5 1 1 2 2 3 2 2 1 14E6 3 3 4 4 4 5 5 4 32E7 2 2 2 2 1 1 1 1 12E8 4 4 5 4 3 5 3 1 29E9 4 3 1 3 3 3 2 1 20

    E10 4 5 4 5 4 4 3 2 31

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    30

    II. ORGANIZACIN DE DATOS1. DISTRIBUCIN DE FRECUENCIASDespus de recoger toda la informacin correspondiente a la investigacin, es decir, alagotar todo el trabajo de campo, nuestro escritorio se llena de un cmulo de datos ycifras desordenadas los cuales, al ser tomados como observaciones individuales, dicenmuy poco sobre la poblacin estudiada; es, entonces, tarea del investigador hacerhablar las cifras, comenzando por la clasificacin y ordenacin, consignando lainformacin en tablas inteligibles que denominamos distribuciones de frecuencias.

    ORDENACIN DE DATOS CARACTERES CUALITATIVOS

    Consideremos una muestra de tamao n sacada de una poblacin estadstica de la queobservamos un carcter cualitativo A que presenta las modalidades siguientes: a1, a2,a3,..., ak, llamamos

    FRECUENCIAABSOLUTA

    SIMPLEfi

    De la modalidad ai al nmero de veces que aparecerepetida dicha modalidad en el conjunto de lasobservaciones realizadas.= ; 0 ; = 1, 2, 3, .

    FRECUENCIARELATIVA

    SIMPLEhi

    De la modalidad ai al cociente entre la frecuencia absolutay el nmero de datos (= tamao de la muestra n).= ; = 1 ; 0 1 ; = 1, 2, 3, .

    Los datos de las observaciones sepueden recoger en la siguientetabla de distribucin :

    Modalidadesde carcter A fi hia1 f1 h1a2 f2 h2..

    ..

    ..

    ak fk hkTotal. = = 1

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    31

    CARACTERES CUANTITATIVOS

    Consideramos una variable estadstica X que, en una muestra de tamao n extradade una poblacin estadstica, toma los valores x1

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    32

    En el primer caso no esnecesario agrupar los datos, yla tabla de distribucin presentael siguiente aspecto (ordenandolos datos de menor a mayor) :

    Xi fi hi Fi Hix1 f1 h1 F1 H1x2 f2 h2 F2 H2..

    ..

    ..

    ..

    ..xk Fk hk Fk=n Hk=1

    Total. = = 1En el segundo caso por tratarse de variable continua o discreta pero con un nmero dedatos muy grande, es aconsejable AGRUPAR LOS DATOS EN CLASES.

    Rango (R).= Nmero de clases (m).Determinamos a travs de la regla de sturges.= 1 + 3.322 Log( )Amplitud de clases (C).=Tabla de frecuencias deuna variable estadsticaagrupada en intervalos.

    Intervalosde clase

    Marcasde clase

    Xifi hi Fi Hi

    [a0 a1) x1 f1 h1 F1 H1[a1 a2) x2 f2 h2 F2 H2..

    ..

    ..

    ..

    ..

    ..

    [akak+1] xk fk hk Fk=n Hk=1Total. = = 1

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    33

    MEDIDAS DE TENDENCIA CENTRAL.

    Son estadgrafos de posicin que son interpretados como valores que permiten a unconjunto de datos dispersos, podra asumirse que estas medidas equivalen a un centrode gravedad que adoptan un valor representativo para todo un conjunto de datospredeterminados.

    Estas medidas son:

    1. Promedio Aritmtico (Media Aritmtica).2. Mediana.3. Moda.4. Promedio Geomtrico.5. Promedio Total.6. Media armnica.

    MEDIDAS DE POSICINPercentiles.CuartilesDeciles

    MEDIDAS DE VARIABILIDAD (dispersin)

    Son estadgrafos de dispersin que permiten evaluar el grado de homogeneidad,dispersin o variabilidad de un conjunto de datos. Estas medidas son:

    1. Amplitud o rango.2. Varianza.3. Desviacin estndar.4. Coeficiente de variabilidad.

    MEDIDAS DE FORMA

    Evala la forma que adopta la distribucin de frecuencias respecto al grado dedistorsin (inclinacin) que registra respecto al valor promedio tomado comocentro de gravedad, el grado de apuntamiento (elevamiento) de la distribucin defrecuencias. A mayor elevamiento de la distribucin de frecuencia significarmayor concentracin de los datos en torno al promedio, por tanto, una menordispersin de los datos. Estas medidas son:

    1. Asimetra o sesgo.2. Curtosis.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    34

    1. LA MEDIA ARITMTICA. Para Datos no Agrupados.

    El promedio aritmtico de un conjunto de valores (X1, X2, X3,.., Xn) es:

    = n = 1 + 2 + 3 + +Ejemplo:Durante los ltimos 32 das el valor de las compras (soles) en peridicos fue:

    5.2 10.2 7.0 7.1 10.2 8.3 9.4 9.2 6.5 7.1 8.26.6 7.8 6.8 7.2 8.4 9.6 8.5 5.7 6.4 10.1 9.19.0 7.8 8.2 5.3 6.2 8.6 7.0 7.7 8.3 7.5

    El promedio aritmtico del valor de las compras en peridicos es:

    = n = 250.232 = 7.82 Para Datos Agrupados.

    Rango (R).= = 10.2 5.2 = 5Nmero de clases (m).Determinamos atreves de la regla de sturges.= 1 + 3.3 Log( ) = 1 + 3.3 (32) = 5.97 6Amplitud de clases (C).= = 56 = 0.83

    = Donde: fi = frecuencia en la clase K sima.

    Xi = marca de clase en el intervalo K imo.

    Ejemplo.

    Para los gastos diarios en peridicos del hotel agrupados en una tabla defrecuencia:

    Intervalo Xi fi hi Fi Hi[5.2 - 6.0) 5.62 3 0.09 3 0.09[6.0 - 6.9) 6.45 5 0.16 8 0.25[6.9 - 7.7) 7.28 6 0.19 14 0.44[7.7 - 8.5) 8.12 8 0.25 22 0.69[8.5 - 9.4) 8.95 5 0.16 27 0.84

    [9.4 - 10.2] 9.78 5 0.16 32 1.00Total 32 1

    02468

    10

    5.62 6.45 7.28 8.12 8.95 9.78

    fi

    Xi

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    35

    El promedio aritmtico es:

    = = 5.62 3 + 6.45 5 + + 9.78 532 = 251.4032 = .Durante los 32 das el hotel tuvo un gasto promedio en peridicos de 7.86 soles

    2. LA MEDIANA.

    Es al valor que ocupa la posicin central de un conjunto de observaciones ordenadas. El50% de las observaciones son mayores que este valor y el otro 50% son menores.

    Para Datos no Agrupados.La ubicacin de la mediana de n datos ordenados se determina por: (n+1)/2.Ejemplos.

    En los 7 datos ordenados: {4, 5, 5, 6, 7, 8, 9}.La ubicacin de la mediana es: ( ) = 4, Luego el valor de la mediana: Me = 6.En los 8 datos ordenados: {3, 4, 5, 5, 6, 7, 8, 9}.La mediana se ubica en el lugar ( ) = 4.5, Luego el valor de la mediana es:= ( ) = 5.5

    Para Datos Agrupados. = + Li: Limite inferiordel intervalo que contiene a la mediana.Fi-1 : Frecuencia acumulada en la clase anterior i sima.Fi : Frecuencia en la clase que contiene a la mediana.Hi-1 : Frecuencia relativa acumulada en la clase anteriori sima.hi : Frecuencia relativa en la clase que contiene a la mediana.Ci: Amplitud del intervalo de clase

    Ejemplo. Para los gastos diarios en peridicos del hotel en una tabla de frecuencias.

    L

    a mediana es: = 7.7 + 0.83 = 7.9El 50% de los das el hotel gast menos de 7.9 soles en la compra de peridicos.

    IntervaloDe clase

    Marcade clase

    Xi

    FrecuenciaAbsoluta

    fi

    FrecuenciaRelativa

    hi

    Frec. Acum.Absoluta

    Fi

    Frec. Acum.Relativa

    Hi[5.2 - 6.0) 5.62 3 0.09 3 0.09[6.0 - 6.9) 6.45 5 0.16 8 0.25[6.9 - 7.7) 7.28 6 0.19 14 0.44[7.7 - 8.5) 8.12 8 0.25 22 0.69[8.5 - 9.4) 8.95 5 0.16 27 0.84

    [9.4 - 10.2] 9.78 5 0.16 32 1.00Total 32 1

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    36

    3. LA MODA.

    Es el valor; clase o categora que ocurre con mayor frecuencia y sus caractersticas son:

    Puede no existir o existir ms de una moda. Su valor no se ve afectado por los valores extremos en los datos. Se utiliza para analizar tanto la informacin cualitativa como la cuantitativa. Es una medida inestable cuando en nmero de datos es reducido.

    Para Datos no Agrupados.

    Por ejemplo, Durante los ltimos 32 das el valor de las compras en peridicosfue:

    5.2 10.2 7 7.1 10.2 8.3 9.4 9.26.6 7.8 6.8 7.1 8.4 9.6 7.1 5.7

    Moda =Mo= 7.1; es el valor ms frecuente, ocurre tres veces.

    Ejemplo: 2, 2, 5, 5, 7, 7, 7, 7, 9, 9, 9, 10; Mo = 7 y 9 Serie bimodalEjemplo: 6, 5, 6, 6, 3, 4, 6, 6, 7 Mo = 6 Serie UnimodalEjemplo: 13, 15, 12, 11, 20, 22 No tiene Moda o se dice quecada dato es una moda

    Para Datos Agrupados. = + + Donde: = ( ) = ( )fi= valor de mayor frecuencia.Ejemplo.El gasto diario en peridicos del hotel *** agrupados en una tabla defrecuencias.

    = 7.7 + 22 + 3 0.83 = 8.03Donde:= 7.7= (8 6) = 2= (8 5) = 3El gasto diario en peridicos ms frecuente es 8.03soles.

    Intervalo Xi fi hi Fi Hi[5.2 - 6.0) 5.62 3 0.09 3 0.09[6.0 - 6.9) 6.45 5 0.16 8 0.25[6.9 - 7.7) 7.28 6 0.19 14 0.44[7.7 - 8.5) 8.12 8 0.25 22 0.69[8.5 - 9.4) 8.95 5 0.16 27 0.84

    [9.4 - 10.2] 9.78 5 0.16 32 1.00Total 32 1

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    37

    4. MEDIA GEOMTRICA.

    La media geomtrica simple de n observaciones X1, X2, X3,..,Xn positivos, estadado por la raz ensima del producto de los n valores observados. El promediogeomtrico de los valores: (X1, X2, X3,..,Xn) es :

    Para Datos no Agrupados. = .Ejemplo.Hallar la media geomtrica de los nmeros 3, 5, 8, 3, 5, 2.

    Solucin.En este caso n = 6, entonces la media geomtrica es:= = 3.915 Para Datos Agrupados.

    Si los datos estn agrupados en clases, la media geomtrica ponderada, es la razensima del producto de las marcas de clases elevadas a sus respectivasfrecuencias, es decir. = ( ) ( ) ( )Donde: = , Xi = Marca de clase, fi = Frecuencia absoluta simple,m = nmero de clases.

    Aplicando logaritmo a ambos lados miembros de la ecuacin anterior se tiene:

    Log = [ + +, ,+ ]= ; Luego.= =1Ejemplo.

    = 28.46 = 7.749

    Intervalo Xi fi log (Xi) fi * log(Xi)[5.2 - 6.0) 5.62 3 0.749 2.248[6.0 - 6.9) 6.45 5 0.81 4.048[6.9 - 7.7) 7.28 6 0.862 5.174[7.7 - 8.5) 8.12 8 0.909 7.275[8.5 - 9.4) 8.95 5 0.952 4.759

    [9.4 - 10.2] 9.78 5 0.99 4.952Total ( ): 32 28.46

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    38

    Desventajas de la media geomtrica.

    Est limitado para valores positivos para que pueda ser interpretado. Si algn valor de la variable es cero, la media geomtrica ser cero. Si aparece algn valor negativo, el estadgrafo toma un valor imaginario.

    5. PROMEDIO PONDERADO

    Cuando se desea encontrar el promedio de valores (X1, X2, X3,..,Xn) que ocurren confrecuencias (f1,f2,.fn)diferentes se debern ponderar los valores observados con pesosdiferentes:

    = Donde Wi = fi/n se denominan ponderaciones o pesos.

    Ejemplo.

    En una agencia de viajes se han vendido 200 pasajes a los precios siguientes:

    Precio de venta (soles)Xi

    Numero de pasajesfi

    PonderacinWi Xi*Wi

    12 60 0.30 3.6014 100 0.50 7.0016 40 0.20 3.20

    Total 200 1 = 13.8

    El precio promedio de venta de los 200 pasajes es de 13.8 soles

    6. PROMEDIO TOTAL

    Corresponde al valor promedio representativo de grupos de observaciones separadas odiferentes y que podran estar consolidadas en tablas de frecuencia independientes, portanto: = + + + .+ni: Numero de observaciones en el grupo i-simo.

    : Promedio correspondiente el grupo i-simo

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    39

    Ejemplo.

    Promedio del grupo A: Promedio del grupo B:

    X = 4(7.5) + 16(12.5) + 5(17.5)25 = 12.7 X = 8(2.5) + 10(7.5) + 16(12.5) + 6(17.5)40 = 10X = 25(12.7) + 40(10)65 = 11.04

    7. MEDIA ARMNICA.La media armnica Mh o X de n trminos no nulos X1, X2, X3,..,Xn, es el reciprocode la media aritmtica de los recprocos de esos trminos. Es decir.

    Para Datos no Agrupados.X = n+ + .+Ejemplo.Calcular el rendimiento promedio para el caso de tres automviles querecorrieron 500 kilmetros y cada auto tuvo el rendimiento siguiente:

    Auto A B CRendimiento(Km/galn) 50 62.4 77.6

    X = 3+ . + . = 30.0489121 = 61.334 KmgalnVerificacin.

    Auto Km Rendimiento Total de galones X = 150024.4561 = 61.334A 500 50 10B 500 62.4 8.0128C 500 77.6 6.4433Total 1500 24.4561

    Para Datos Agrupados.La media armnica para datos tabulados (mediaarmnica ponderada) se define por:

    GUPO ANota Xi fi5 10 7.5 410 15 12.5 1615 20 17.5 5Total 25

    GUPO BNota Xi fi

    0 5 2.5 85 10 2.5 10

    10 15 12.5 1615 20 17.5 6Total 40

    PromedioTotal

    Grupo X fiA 12.7 25B 10 40

    Total 65

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    40

    X = Mh = nDonde:m = nmero de clases, Xi = marca de clase, fi = frecuencia absoluta de cada clase.

    MEDIDAS DE POSICIN.Las medidas de posicin equivalen a los valores que puede tomar una variablecaracterizados por agrupar a cierto porcentaje de observaciones en la muestra opoblacin.Las medidas de posicin son ideales para obtener informacin adicional a partir dedatos resumidos, es decir, que presentan perdida de informacin por agrupamiento enintervalos de clase.

    PERCENTILES.

    Son 99 valores que dividen a un conjunto de datos en 100 partes iguales.

    Para Datos Agrupados. = + = Lmite inferior del intervalo que contiene al percentil= Frecuencia acumulada en la clase anterior K-sima= Frecuencia en la clase que contiene al percentil

    C =Amplitud del intervalo de clasek = 1%, 2%, 3%,..,97%, 98%, 99% Percentiles.

    Ejemplo.El percentil 80% de los gastos diarios en peridicos es.

    1. Se determina 80*n/100.

    2. De la tabla, la frecuencia absoluta acumulada inmediatamente superior a 80*n/100 = 25.6 esF5 = 27, luego F5-1 = 22. Por tanto en intervalo de clase que contienen a es [8.5 9.4)

    IntervaloDe clase

    Marcade clase

    Xi

    FrecuenciaAbsoluta

    fi

    FrecuenciaRelativa

    hi

    Frec. Acum.Absoluta

    Fi

    Frec. Acum.Relativa

    Hi[5.2 - 6.0) 5.62 3 0.09 3 0.09[6.0 - 6.9) 6.45 5 0.16 8 0.25[6.9 - 7.7) 7.28 6 0.19 14 0.44[7.7 - 8.5) 8.12 8 0.25 22 0.69[8.5 - 9.4) 8.95 5 0.16 27 0.84

    [9.4 - 10.2] 9.78 5 0.16 32 1.00Total 32 1

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    41

    % = + = 8.5 + ( . 22)5 0.83 = 9.09El 80% de los datos analizados sern menores de 9.09 y el 20% restante sern superiores.

    CUARTILES.

    Son tres valores Q1, Q2, Q3 que dividen a los datos en cuatro partes iguales.

    25% Q1 25% Q2 25% Q3 25%

    = + ; = ; = + Ejemplo.Calcular el tercer cuartil (Percentil 75%) de los gastos diarios en peridicos de la tablaanterior.

    Solucin.

    1. Se determina n/4.

    2. De la tabla, la frecuencia absoluta acumulada inmediatamente superior a 3n/4 = 24 es F5 = 27,luego F5-1 = 22. Por tanto en intervalo de clase que contienen a es [8.5 9.4)

    = + = 8.5 + ( 22)5 0.83 = 8.8El 75% de los datos analizados sern menores a 8.8 y el 25% restante sern superiores.

    DECILES.

    Son nueve valores D1, D2, D3, D4, D5, D6, D7, D8, y D9, que dividen a un conjunto dedatos en 10 partes iguales.

    1. Se construye la tabla de frecuencias absolutas acumuladas.2. Se determina k*n/10.3. Se identifica a la clase que contiene a Dk, identificado a la frecuencia absoluta

    acumulada Fi inmediatamente superior a k*n/10.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    42

    Ejemplo.

    Calcular el decil siete (Percentil 70%) de los gastos diarios en peridicos de la tabla defrecuencia anterior.

    = + = 8.5 + ( . 17)5 0.83 = 9.39670% de los datos sern menores a 9.396 y el 30% restante sern superiores a 9.396.

    Para Datos no Agrupados.

    El lugar o posicin donde se encuentran los cuartiles para n datos ordenados es:

    Cuartil Q1 = P25% Q2 = P50% Q3 = P75%Posicin 25(n + 1)100 50(n + 1)100 75(n + 1)100

    Ejemplo.

    Supngase que los siguientes datos representan los salarios por da de 12 trabajadoresde una compaa muy grande seleccionados aleatoriamente (en soles)

    9 10 12 3 5 7 15 10 9 11 13 11

    Determinar el primer cuartil de la muestra.

    Solucin.

    1. Los datos ordenados en forma ascendente son:

    3 5 7 9 9 10 10 11 11 12 13 15X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12

    2. Como n = 12, = = 3.25. Esto significa que el valor de Q1 es el tercerdato ms 25% de la diferencia entre los valores de las observaciones tercero ycuarto. As, el valor de la tercera observacin es 7 y el del cuarto es 9, entonces

    Q1 = 7 + (9-7)*0.25 =7.5 soles.

    Ejemplo:

    Determine los cuartiles y decil 8 de los 13 datos ordenados siguientes:

    10 11 11 12 12 13 13 13 14 15 17 18 20X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    43

    Percentil Posicin Incremento % Valor del cuartilQ1 = P25 0.25(13+1) = 3.5 50% Q1 = 11+(12-11)*0.50 =11.5Q2 = P50 0.50(13+1) = 7 0% Q2 = 13Q3 = P75 0.75(13+1) = 10.5 50% Q3 = 15+(17-15)*0.50 = 16Q8 = P80 0.80(13+1) = 11.2 20% P80 = 17+(18-17)* 0.20 = 17.2

    MEDIDAS DE VARIABILIDAD.

    1. AMPLITUD O RANGOSean los valores:x1, x2, x3,..,xnla amplitudo rango de estos datos esR = (Xmax - Xmin).

    2. VARIANZA Y DESVIACIN TPICA.Estas medidas son las ms utilizadas en el estudio de la dispersin. La varianzamide la dispersin de los datos con respecto a su media aritmtica y ladesviacin tpica o desviacin estndar es simplemente la raz cuadrada positivade la varianza.

    Para Datos no Agrupados.

    Definicin de de varianza poblacional. La varianza poblacional finita de Nelementos X1, X2, X3,..,Xn, se define como la media aritmtica del cuadradode las desviaciones de las observaciones con respecto a su media , y se denotapor es decir.

    N

    xn

    ii

    =

    =1

    2

    2)(

    Definicin de de varianza de una muestra. La varianza de una muestra, x1, x2,x3,..,xn, de una variable o una caracterstica x (que abreviadamente escribimosV(x)), se define como la media del cuadrado de las desviaciones de lasobservaciones con respecto de la media aritmtica de esos datos. Si denotamospor S2.

    Es fcil verificar que: ==

    =

    n

    ii

    n

    ii xnxxx

    1

    22

    1

    2)(Por lo tanto,

    21

    2

    2 xn

    x

    s

    n

    ii

    =

    =

    n

    x

    s

    n

    ii

    =

    =1

    2_

    2)X(

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    44

    La diferencia entre ( ) ( ) es grande para muestras pequeas, yes mnima para muestras grande, prcticamente son iguales. Entonces, paramuestras grandes 60 , puede usarse cualquiera de las formulas. Paramuestras pequeas se usa ( ) , lo cual es llamada varianza muestral otambin varianza corregida, y se acostumbra denotar por . Es decir la varianzamuestral estar definida por:= ( ) 1 = 1Ejemplo.Calcular la varianza de los cuatro datos siguientes: (Xi: 3, 4, 6 y 7)

    = n = 3 + 4 + 6 + 74 = 204 = 5 1 = 3 + 4 + 6 + 74 1 = 103 = 3.333 Para datos Agrupados.

    n

    fXxs

    n

    iii

    =

    =1

    2

    2*)(

    = ( ) 1 = 1Ejemplo.

    Los gastos diarios en peridicos del hotel agrupados en la tabla de frecuencias.

    = .= ( ) 1 = 5231 = 1.68

    IntervaloDe clase

    Marcade clase

    Xi

    FrecuenciaAbsoluta

    fiXi*fi ( Xi - )2*fi

    [5.2 - 6.0) 5.62 3 16.85 15.10[6.0 - 6.9) 6.45 5 32.25 9.94[6.9 - 7.7) 7.28 6 43.70 2.00[7.7 - 8.5) 8.12 8 64.93 0.53[8.5 - 9.4) 8.95 5 44.75 5.94

    [9.4 - 10.2] 9.78 5 48.92 18.50Total = 32 = 251.40 = 52.00

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    45

    3. DESVIACIN ESTNDAR.Es una medida de variabilidad que corresponde a la raz cuadrada de la varianza.Este indicador tiene la misma unidad de medida en la que se expresa elpromedio.

    = = ( ) 1Entonces, = 1.68 = 1.3 soles.Propiedades dela varianza.

    La varianza de un conjunto de observaciones x1, x2, x3,..,xn,siempre es un nmero no negativo. Esto es( ) 0

    La varianza de una constante es cero.( ) = 0 Si a cada observacin x1, x2, x3,..,xn, se adiciona o resta una

    constante k>0, la varianza del nuevo conjunto de valores y1, y2,y3,..,yn, donde yi=xi K, i=1, 2,.,n, coincide con la varianza delconjunto original. Es decir

    ( ) = ( ). ( ) = ( ) = ( ) ( ) = ( ), donde a y b son

    constantes.

    4. COEFICIENTE DE VARIACIN.Es una medida de variabilidad de los datos que se expresa en porcentaje, igual a ladesviacin estndar dividida entre la media aritmtica. Debido a que se trata de unnmero sin dimensiones, es til para comparar la dispersin de poblaciones con mediassignificativamente diferentes.

    . . =Grado de variabilidad de los datos Coeficiente de variabilidadCon variabilidad baja Menos de 10%Con variabilidad moderada De 10% a 30%Con variabilidad alta Ms de 30%

    En el ejemplo anterior el coeficiente de variabilidad es:

    . . = .. = . %

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    46

    Por ejemplo, Usted es el inspector de control de calidad de una planta embotelladora deleche, la cual embotella el producto en recipientes pequeos y grandes. Usted toma unamuestra de cada producto y observa que el volumen medio de los recipientes pequeoses de una 1 taza, con una desviacin estndar de 0.08 tazas, y el volumen medio de losrecipientes grandes es de 1 galn (16 tazas) con una desviacin estndar de 0.4 tazas.Aunque la desviacin estndar del recipiente de un galn es cinco veces mayor que ladesviacin estndar del recipiente pequeo, sus coeficientes de variacin apoyan unaconclusin diferente:

    Recipiente grande Recipiente pequeoCV% = 100 * 0.4 tazas / 16 tazas = 2.5 CV %= 100 * 0.08 tazas / 1 taza = 8

    El coeficiente de variacin del recipiente pequeo es ms de tres veces mayor que elcoeficiente de variacin del recipiente grande. En otras palabras, aunque el recipientegrande presenta una mayor desviacin estndar, el recipiente pequeo presenta unavariabilidad mucho mayor con respecto a su media.

    MEDIDAS DE FORMA.

    1. ASIMETRA O SEGO.Evala el grado de distorsin o inclinacin que adopta la distribucin de losdatos respecto a su valor promedio tomando como centro de gravedad. Elcoeficiente de asimetra de pearson es:= 3( )

    Grado de asimetra Valor del sesgoSimetra perfecta Cero: El promedio es igual a la medianaSesgo positivo Positivo: Promedio mayor que la medianaSesgo negativo Negativo: Promedio menor que la mediana

    Asimetra Positiva Simtrica Asimetra Negativa(Promedio > Mediana) Promedio = Mediana Promedio < Mediana

    En el ejemplo anterior los gastos diarios en peridicos el promedio es 7.8, lamediana es 7.90 y la desviacin estndar 1.3, por lo tanto es sesgo esligeramente negativo -0.23.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    47

    CURTOSIS.Evala el grado de apuntamiento de la distribucin, el coeficiente es:= ( )

    Grado de Apuntamiento Valor de CurtosisMesocrtica (distribucin normal) 0.263Leptocrtica (Elevada) Mayor a 0.263 se aproxima a 0.5Platicrtica (Aplanada) Menor a 0.263 se aproxima a 0.

    Ku =0.263 Ku> 0.263 Ku< 0.263 MesocurticaLeptocrticaPlaticrtica(Normal)

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    48

    REPRESENTACIN GRFICA.

    GRFICOS DE CAJAS.Existe una gran variedad de graficas estadsticas para extraer informacin acerca de laspropiedades de un conjunto de datos.Una grafica til para reflejar propiedades de los datos es la grafica de caja (boxplots) que se basa en la medida(o en la media), los cuartiles y valores extremos. Lacaja representa el rango intercuartil que encierra el 50% de los valores y tiene lamediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil75, P75 (cuartil superior) y el percentil 25, P25 (cuartil inferior).Adems de la caja se incluya la extensin de los datos mediante segmentos que seextienden de la caja hacia el valor mximo (U) y hacia el valor mnimo (L) de los datos.Es te recuadro se dibuja con el eje de la variable en forma horizontal o vertical como seindica en la figura que sigue.

    De un grafico de caja, se obtiene informacin de los datos acerca de:La centralizacin (observado la ubicacin de la mediana)La dispersin o variabilidad (mediante en rango intercuartil: RI=P75-P25)La asimetra (comparado: Me - P25con P75 - Me)Las colas (por la longitud de los segmentos que salen de los lados de la caja)

    Los datos atpicos o discordantes o raros llamados outliers (aislados) son aquellosque se ubican fuera del intervalo.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    49

    Diagrama de Causa-Efecto1.- El espesor de recubrimiento de un material de acero es evaluado en una sesin de

    tormenta de ideas. El problema de variacin del espesor (la cual es del 10%) que se sealaes por una serie de causas, que fueron clasificadas en: equipos sin calibracin, personal sinentrenamiento, especificaciones mal estructuradas, mal diseo de la maquina, variacin delmaterial, antigedad de la maquina, personal mal seleccionado, sin procedimientos,velocidad sin control, alta temperatura, ambiente de trabajo contaminado, materialdefectuoso, personal sin experiencia, sin instrumentos de control.

    Las causas fueron clasificadas segn se muestra en el cuadro 1:CUADRO 1Material Variacin del material

    Material defectuoso Materia prima de mala calidadProveedores no adecuados

    Maquinaria Antigedad de la maquinariaMal diseo de la maquinaEquipos sin calibracin

    Mtodo Sin procedimientosEspecificaciones mal estructuradas

    Medio Ambiente Alta temperaturaAmbiente de trabajo contaminado

    Mano de Obra Personal sin entrenamientoPersonal sin experienciaPersonal mal seleccionado

    Medicin Sin instrumentos de controlVelocidad sin control

    10%espeso r enVariacion del

    Ento rno

    Med ic iones

    Mtodos

    Material

    Mqu inas

    Personal

    Persona l mal se leccionado

    Persona l sin exper iencia

    Persona l sin entrenamiento

    Equipos sin ca l ibracin

    Mal diseo de la maquina

    Antigedad de la maquinar ia

    Mater ia l defectuoso

    mater ia lVar iacin de l

    estructuradasEspecificaciones mal

    Sin procedimientos

    Ve locidad sin control

    controlSin instrumentos de

    contaminadoAmbiente de trabajo

    Alta temperatura

    Proveedo re s noade cuados

    Ma te ri ap rima

    dema la c al ida d

    diagrama de causa efecto

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    50

    Diagrama de Pareto1.- En la empresa Las Malvinas el ensamblaje de mangueras ha sido criticado debido a que

    presenta muchos defectos. De 14993 ensamblajes inspeccionados en un ao, un total de1509, el 10.1% estaban defectuosos. El reporte de inspeccin se muestra en el cuadro 2:

    CUADRO 2Defectos Turno 1 Turno 2 Turno 3 Total

    Muy corto 30 35 26 91Muy largo 44 44 44 132Sin roscas 70 69 70 209Fugas 330 321 347 998Daadas 8 11 5 24Retrabajado 22 20 13 55Total 504 500 505 1509

    La gerencia expres su preocupacin por que los tres turnos no cuentan con igual supervisin,lo que puede contribuir al problema. Desarrolle un Diagrama de Pareto para el total dedefectos en los tres turnos y un Diagrama de Pareto para cada turno.

    Diagrama de Pareto para el total de defectos en los tres turnos.

    Total 998 209 132 91 55 24Porcentaje 66.1 13.9 8.7 6.0 3.6 1.6

    % acumulado 66.1 80.0 88.7 94.8 98.4 100.0

    Defectos OtroRetrabajadoMuy cortoMuy largoSin roscasFugas

    1600

    1400

    1200

    1000

    800

    600

    400

    200

    0

    100

    80

    60

    40

    20

    0

    Total

    Porcen

    taje

    Diagrama de Pareto de Defectos

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    51

    Diagrama de Pareto para cada turno.

    Turno 1 330 70 44 30 22 8Porcentaje 65.5 13.9 8.7 6.0 4.4 1.6

    % acumulado 65.5 79.4 88.1 94.0 98.4 100.0

    Defectos OtroRetrabajadoMuy cortoMuy largoSin roscasFugas

    500

    400

    300

    200

    100

    0

    100

    80

    60

    40

    20

    0

    Turno1

    Porcen

    taje

    Diagrama de Pareto de Defectos

    Diagrama de Dispersin1.- En un equipo de mejora se obtienen los siguientes datos, que recogen el nmero de

    defectos por lote e conjuntos de 10 000 piezas en funcin del tiempo detratamiento al que se someten:Obs #

    DefectosTiempo(Seg)

    MateriaPrima

    Obs #Defectos

    Tiempo(seg)

    MateriaPrima

    1 48 809 B 26 47 837 A2 52 834 B 27 53 840 A3 54 838 B 28 58 850 B4 50 854 A 29 54 843 A5 48 822 A 30 43 819 A6 51 842 A 31 54 856 A7 52 851 A 32 52 862 A8 59 868 B 33 56 835 B9 54 841 B 34 55 844 B10 54 844 B 35 55 852 A11 44 811 A 36 58 858 B12 54 819 B 37 57 843 B13 48 830 A 38 52 825 B14 47 836 A 39 58 867 B15 58 850 B 40 57 851 B16 57 857 B 41 51 812 B17 54 863 A 42 51 821 B

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    52

    18 49 811 B 43 50 831 B19 49 820 A 44 56 841 B20 48 826 A 45 50 843 A21 52 832 B 46 49 850 A22 50 837 A 47 52 841 B23 49 839 A 48 50 855 A24 54 839 B 49 46 829 A25 56 842 B 50 49 838 A

    Diagrama de dispersin.

    a) Realice un diagrama de dispersin entre la variable nmero de defectos por lote y lavariable tiempo de tratamiento al que se someten. Que comentarios puede hacer alrespecto.

    2.- Fiber Borrad fabrica forros interiores de techo para la industria automotriz. Lagerente de manufactura est preocupada por la calidad de este producto. Sospechaque un defecto en particular, las rasgaduras de la tela, est relacionado con eltamao de las actuales partidas de produccin. Un asistente ha recopilado los datosque se encuentran en la tabla, basndose en los registros de produccin:

    Partida Tamao Defecto (%) Partida Tamao Defecto (%)1 1000 3.5 1 6500 1.52 4100 3.8 2 1000 5.53 2000 5.5 3 7000 1.04 6000 1.9 4 3000 4.55 6800 2.0 5 2200 4.26 3000 3.2 6 1800 6.07 2000 3.8 7 5400 2.08 1200 4.2 8 5800 2.09 5000 3.8 9 1000 6.210 3800 3.0 10 1500 7.0

    y = 0.164x - 85.576R = 0.3991

    4042444648505254565860

    800 810 820 830 840 850 860 870 880

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    53

    a) Dibuje un diagrama de dispersin para estos datosb) Existe alguna relacin entre el tamao de la partida y el porcentaje de defectos?

    Qu consecuencias tiene esto para los negocios de Fiber Borrad?

    7000600050004000300020001000

    7

    6

    5

    4

    3

    2

    1

    Tamao

    Defecto

    (%)

    Grfica de dispersin de Defecto (%) vs. Tamao

    GRFICO DE BARRASCuadro N 01: Distribucin de plntulas de tornillo segn su altura (en milmetros).Brunas-UNAS/Tingo Mara. Mayo 2011mi Li Ls Marca de Clase(Xi) Grupos

    Frecuencia(fi) (Fi) (hi) (Hi) (hi%) (Hi%)

    1 14 18.0 16 17.0 29 29 0.121 0.121 12.1% 12.1%2 18.0 22.0 20 21.0 24 53 0.100 0.221 10.0% 22.1%3 22.0 26.0 24 25.0 27 80 0.113 0.333 11.3% 33.3%4 26.0 30.0 28 29.0 30 110 0.125 0.458 12.5% 45.8%5 30.0 34.0 32 33.0 34 144 0.142 0.600 14.2% 60.0%6 34.0 38.0 36 37.0 24 168 0.100 0.700 10.0% 70.0%7 38.0 42.0 40 41.0 24 192 0.100 0.800 10.0% 80.0%8 42.0 46.0 44 45.0 26 218 0.108 0.908 10.8% 90.8%9 46.0 50.0 48 50.0 22 240 0.092 1.000 9.2% 100.0%

    Total 240 1.000 100%Fuente: Facultad de Recursos de la UNAS.Del cuadro anterior realice el grafico de barras.

  • Ing. Wilmer J. Bermdez Pino Estadstica Aplicada

    54

    Grfico N 01. Distribucin porcentual de plntulas de tornillo segn su altura(en milmetros). Brunas-UNAS/Tingo Mara. Mayo 2011

    Fuente: Facultad de Recursos de la UNAS.

    GRFICO DE SECTORES.

    1. Se ha llevado a cabo una encuesta a personas elegidas al azar de la ciudad deTingo Mara en Julio Agosto del 2012 para analizar su opinin sobre lacalidad de una nueva conserva que se desea introducir en el