Esta Di Stica

download Esta Di Stica

of 312

Transcript of Esta Di Stica

  • GUA DIDCTICA Y MDULO

    GABRIEL JAIME POSADA HERNNDEZ

    MARA VICTORIA BUITRAGO CARDONA

    FUNDACIN UNIVERSITARIA LUIS AMIG

    FACULTAD DE CIENCIAS ADMINISTRATIVAS, ECONMICAS Y CONTABLES

    Colombia, 2008

  • COMIT DIRECTIVO

    Fray Marino Martnez PrezRector

    Hernn Ospina AtehortaVicerrector Administrativo y Financiero Director de Planeacin

    Jos Jaime Daz OsorioVicerrector Acadmico

    Francisco Javier Acosta GmezSecretario General

    ESTADSTICA Gabriel Jaime Posada Hernndez Mara Victoria Buitrago Cardona

    Decana Facultad de Ciencias Administrativas, Econmicas y Contables:Mara Victoria Agudelo Vargas

    Correccin de estilo:Lorenza Correa Restrepo

    Diseo:Colectivo Docente Facultad de Ciencias Administrativas, Econmicas y Contables

    Impresin:Departamento de Publicaciones FUNLAM

    www.funlam.edu.co

    TODOS LOS DERECHOS RESERVADOSMedelln Colombia2008

    Estadstica 2

  • CONTENIDO

    Pg

    GUA DIDCTICA

    PRESENTACIN 13

    1. FICHA TCNICA 15

    2. INTENCIONALIDADES FORMATIVAS 16

    3. OBJETIVOS 17

    3.1. OBJETIVOS ESENCIALES 17

    3.2. OBJETIVOS COMPLEMENTARIOS 17

    4. UNIDADES TEMTICAS 19

    5. METODOLOGA GENERAL 20

    6. EVALUACIN INTEGRAL 21

    II ESTADSTICA DESCRIPTIVA

    INTRODUCCIN 23

    JUSTIFICACIN 25

    UNIDAD 1. INTRODUCCIN Y OBTENCIN DE DATOS

    ESTADSTICOS 27

    1.1. ESTADSTICA 27

    1.1.1. Historia 27

    1.1.2. Definicin 31

    1.1.3. Divisin 32Estadstica 3

  • 1.2. CONCEPTOS GENERALES 32

    1.2.1. Unidad de investigacin 32

    1.2.2. Poblacin 33

    1.2.3. Muestra 34

    1.2.4. Parmetros y estadgrafos 34

    1.2.5. Variables 35

    1.2.6. Escalas de medicin 38

    1.3. MUESTREO 42

    1.3.1. Mtodos de muestreo probabilstico 43

    1.3.2. Mtodos de muestreo no probabilstico 47

    1.3.3. Evaluacin del valor de una encuesta 49

    1.3.4. Errores en las encuestas 50

    1.3.5. Aspectos ticos del muestreo 52

    UNIDAD 2. ORDENACIN DE DATOS ESTADSTICOS

    2.1. TABULACIN DE DATOS 55

    2.1.1. Rango o recorrido 55

    2.1.2. Amplitud del rango 59

    2.1.3. Nmero de clases 59

    2.1.4. Amplitud del intervalo de clase 60

    2.1.5. Lmites de las clases 61

    2.1.6. Tabulacin 62

    2.1.7. Marca de clase o punto medio 62

    2.2. FRECUENCIAS 63

    2.2.1. Frecuencia absoluta 63

    2.2.2. Frecuencia relativa 64Estadstica 4

  • 2.2.3. Frecuencia absoluta acumulada 66

    2.2.4. Frecuencia relativa acumulada 67

    2.2.5. Nmeros ndices 69

    2.3. GRFICAS O DIAGRAMAS 70

    2.3.1. Histogramas 70

    2.3.2. Polgono de frecuencias 72

    2.3.3. Ojivas o polgonos de frecuencias acumuladas 74

    2.3.4. Diagramas de barras 75

    2.3.5. Diagramas circulares 76

    2.3.6. Diagrama de tallo y hojas 77

    2.3.7. Diagrama de Pareto 80

    2.4. TABULACIN DE DATOS BINARIOS O CRUZADOS 82

    UNIDAD 3. MTODOS NUMRICOS

    3.1. MEDIDAS DE TENDENCIA CENTRAL O DE PRECISIN 88

    3.1.1. Media aritmtica 88

    3.1.2. Mediana 91

    3.1.3. Moda 96

    3.1.4. Cuantiles 100

    3.2. MEDIDAS DE VARIABILIDAD 107

    3.2.1. Rango 108

    3.2.2. Rango intercuartil 109

    3.2.3. Varianza 109

    3.2.4. Desviacin estndar 114

    3.2.5. Coeficiente de variacin 115

    Estadstica 5

  • 3.3. MEDIDAS DE LOCALIZACIN 117

    3.3.1. Valor z 118

    3.3.2. Teorema de Chebyshev 119

    3.3.3. Sesgo o forma 122

    3.3.4. Diagrama de caja o bigotes 124

    3.3.5. Curtosis 128

    UNIDAD 4. REGRESIN LINEAL Y CORRELACIN

    4.1. REGRESIN LINEAL SIMPLE 132

    4.1.1. Diagrama de dispersin 132

    4.1.2. Ajuste de una recta por el mtodo de mnimos cuadrados 135

    4.2. CORRELACIN 141

    4.2.1. Coeficiente de correlacin 141

    4.2.2. Coeficiente de determinacin 144

    III TEORA DE PROBABILIDADES

    UNIDAD 1. DEFINICIONES1.1 INTRODUCCIN 148

    1.2 QU ES LA PROBABILIDAD 149

    1.3 CONCEPTOS BSICOS DE PROBABILIDAD 150

    1.3.1 Fenmeno experimento aleatorio 150

    1.3.2 Fenmeno o experimento determinstico 150

    1.3.3 Prueba 150

    1.3.4 Espacio muestral 150

    1.3.5 Elemento o punto muestral 152

    1.3.6 Evento 152

    1.3.7 Interseccin de dos eventos a y b 152Estadstica 6

  • 1.3.8 Unin de dos eventos a y b 153

    1.3.9. Complemento de un evento a 154

    UNIDAD 2. TCNICAS DE CONTEO2.1 TCNICAS DE CONTEO 157

    Regla 2.1.1. Principio de la multiplicacin 157

    Regla 2.1.2. Principio de permutacin 161

    Regla 2.1.3 Variaciones o permutaciones 162

    Regla 2.1.4 Combinaciones 164

    Regla 2.1.5 Particiones 166

    2.2 EJERCICIOS RESUELTOS 167

    UNIDAD 3. SUCESOS PROBABILSTICOS Y REGLAS DE

    PROBABILIDAD

    3.1 SUCESOS PROBABILSTICOS 1723.1.1 Sucesos independientes 172

    3.1.2 Sucesos dependientes 172

    3.1.3 Sucesos compatibles o mutuamente no excluyentes 172

    3.1.4 Sucesos incompatibles o mutuamente excluyentes 172

    3.2 DEFINICIN DE PROBABILIDAD 173

    3.2.1. Modelo de probabilidad emprico o frecuencialista. 173

    3.2.2. Modelo subjetivo 174

    3.2.3 Modelo clsico 174

    3.3. REGLAS PRINCIPALES DE LA PROBABILIDAD 175

    Estadstica 7

  • 3.4. AXIOMAS DE PROBABILIDAD 180

    3.4.1 Teorema 1: regla de la unin o suma 180

    3.4.2 Teorema 2: regla del complemento 180

    3.4.3 Teorema 3: probabilidad condicional 181

    3.4.4 Teorema 4: regla de la multiplicacin o interseccin 182

    UNIDAD 4. VARIABLES ALEATORIAS Y DISTRIBUCIONES

    DE PROBABILIDAD4.1 INTRODUCCIN 191

    4.2DISTRIBUCIN O FUNCIN DE PROBABILIDAD 191

    4.3 ALGUNAS DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 194

    4.3.1 Distribucin binomial 194

    4.3.1.1 Caractersticas 195

    4.3.1.2 Funcin de probabilidad de la v.a. binomial 196

    4.3.1.3 Tablas de probabilidad acumulada de la binomial 200

    4.3.1.4 Parmetros de la distribucin binomial 205

    4.3.2 Distribucin hipergeomtrica 206

    4.3.2.1 Funcin de probabilidad de la v.a. hipergeomtrica 207

    4.3.2.2 Parmetros de la distribucin hipergeomtrica 212

    4.3.3 Distribucin de Poisson 212

    4.3.3.1 Funcin de probabilidad de la v.a. Poisson 213

    4.3.3.2 Tablas de probabilidad acumulada de la Poisson 213

    4.3.3.3 Parmetros de la distribucin Poisson 220

    Estadstica 8

  • 4.4 DISTRIBUCIN CONTINUA DE PROBABILIDAD:

    DISTRIBUCIN NORMAL 220

    4.4.1 La funcin de densidad de la distribucin normal 221

    4.4.2 Representacin grfica de esta funcin de densidad 221

    4.4.3 Distribucin normal estndar 222

    4.4.4 Pasos para buscar en la tabla 222

    IV ESTADSTICA INFERENCIAL

    UNIDAD 1. ESTIMACIN

    1.1 INTRODUCCIN 233

    1.2 NIVEL DE CONFIABILIDAD DE LOS RESULTADOS 236

    1.3 PRINCIPALES PARMETROS, ESTADSTICOS

    Y SUS SMBOLOS 236

    1.4 ESTIMACIN PUNTUAL 237

    1.4.1 Estimacin puntual para variable cuantitativa 237

    1.4.2 Estimacin puntual para variable cualitativa 238

    1.5 TAMAO DE LA MUESTRA PARA ESTIMAR MEDIAS Y

    PROPORCIONES. 238

    1.5.1 Determinacin estadstica del tamao de la muestra 240

    1.5.1.1 Poblaciones infinitas 240

    1.5.1.1.1 Proporcin conocida 240

    1.5.1.1.2 Proporcin desconocida 240

    Estadstica 9

  • 1.5.1.2 Poblaciones finitas

    242

    UNIDAD 2. INTERVALOS DE CONFIANZA2.1 INTRODUCCIN 244

    2.1.1 Intervalos de confianza para el promedio poblacional 244

    2.1.1.1 Parmetros y/o estadsticos para utilizar las frmulas

    de intervalos de confianza 2452.1.2 Intervalo de confianzas para la proporcin poblacional p 253 2.1.2.1 Parmetros para utilizar las frmulas de intervalos de confianza 253

    UNIDAD 3. PRUEBA DE HIPTESIS3.1 INTRODUCCIN 257

    3.2DEFINICIN DE PRUEBA DE HIPTESIS 257

    3.3PASOS PARA LA PRUEBA DE HIPTESIS PARA

    EL PROMEDIO Y LA PROPORCIN P. 258

    4. ESTUDIO DE CASO 272

    5. ACTIVIDADES DE RECONOCIMIENTO 276

    6. RESPUESTA A PREGUNTAS FRECUENTES 277

    7. ACTIVIDADES DE PROFUNDIZACIN 281

    ANEXOS TABLAS DE PROBABILIDAD ACUMULADAAnexo A Tabla acumulada de la distribucin binomial 297

    Anexo B Tabla acumulada de la distribucin Poisson 302

    Anexo C Tabla acumulada de la distribucin normal 305Estadstica 10

  • Anexo D Tabla de la distribucin t-student 307

    GLOSARIO 308

    BIBLIOGRAFA 317

    Estadstica 11

  • Estadstica 12

  • PRESENTACIN

    Apreciado estudiante, bienvenido a la Asignatura Estadstica Descriptiva e

    Inferencial.

    Este mdulo ha sido escrito teniendo presente al estudiante que ingresa en

    la metodologa a distancia, la cual se constituye en uno de los nuevos retos y

    alternativas para la formacin de profesionales capaces de intervenir

    problemticas sociales contemporneas, desde la aplicacin de la ciencia y

    la tecnologa con criterios ticos y de calidad.

    La educacin a distancia responde a la necesidad de ofrecer un proceso de

    formacin que supere obstculos representados en grandes distancias

    geogrficas y escasez de tiempo de personas deseosas de tener las

    oportunidades de desarrollo humano que brinda la educacin superior.

    Dicha metodologa exige a cada estudiante un esfuerzo investigativo,

    creativo e innovador soportado por la voluntad del compromiso que demanda

    nuestra sociedad.

    Por esto, para el alcance de los objetivos en este proceso formativo, ms que

    construir un texto, se ha tratado de presentar un instrumento de

    comunicacin acadmica y dinmica entre la institucin y el estudiante, en el

    que se diferencian dos partes fundamentales: la gua de estudio y trabajo, y

    el mdulo de aprendizaje.

    Estadstica 13

  • La gua considera las orientaciones sobre el desarrollo del curso en cuanto

    define los elementos necesarios para la interlocucin entre estudiantes y

    docente, describiendo en la metodologa las actividades a realizar para cada

    encuentro, bibliografa complementaria, proceso de evaluacin y

    compromisos adquiridos por el estudiante. El mdulo desarrolla el contenido

    conceptual bsico que permite al estudiante la comprensin de los

    problemas potenciales en el campo administrativo.

    Seguros de que en dicho material se encuentran los referentes necesarios

    para el desarrollo de un proceso acadmico con calidad, le deseamos xitos

    en este nuevo ciclo de su formacin profesional.

    Estadstica 14

  • 1. FICHA TCNICA

    CURSO ESTADSTICA DESCRIPTIVA

    AUTORES GABRIEL JAIME POSADA HERNNDEZ

    MARA VICTORIA BUITRAGO CARDONA

    INSTITUCIN FUNDACIN UNIVERSITARIA LUIS AMIG

    UNIDAD ACADMICA FACULTAD DE CIENCIAS ADMINISTRATIVAS,

    ECONMICAS Y CONTABLES

    PROGRAMAS ADMINISTRACIN DE EMPRESAS

    CONTADURA PBLICA

    NEGOCIOS INTERNACIONALES

    PALABRAS CLAVE ESTADSTICA, CONTEO, DATOS, MUESTRA,

    POBLACIN, PROBABILIDAD

    REA DE CONOCIMIENTO BSICA

    CRDITOS 3 (TRES)

    CIUDAD MEDELLN

    FECHA JULIO DE 2007

    ACTUALIZACIN

    ADICIN DE TEMAS

    APROBADA POR

    2. INTENCIONALIDADES FORMATIVAS

    Estadstica 15

  • El mundo global y nuestra sociedad exigen al profesional moderno el

    desarrollo de competencias y habilidades que permitan la solucin oportuna

    y adecuada a los diferentes problemas que se presentan en las

    organizaciones.

    La Fundacin Universitaria Luis Amig, consciente de ello, ha generado

    constantemente espacios que propician la formacin integral de sus

    estudiantes, partiendo del reconocimiento del ser humano como persona y,

    sobre l, la tcnica y el saber especfico que exige la academia.

    Por tal razn, el egresado de la Fundacin Universitaria Luis Amig es un

    profesional ntegro, tico y comprometido con la sociedad en la bsqueda de

    alternativas viables para el mejoramiento funcional de las organizaciones y la

    calidad de vida de sus integrantes.

    3. OBJETIVOS

    Estadstica 16

  • 3.1. OBJETIVOS ESENCIALES

    Manejar adecuadamente los conceptos relacionados con estadstica.

    Aplicar los conceptos y procedimientos matemticos para describir el

    comportamiento de una variable en un conjunto de datos.

    Analizar los mtodos numricos de un conjunto de datos.

    Generar modelos de regresin lineal simple, y realizar anlisis pertinentes

    para la toma de decisiones.

    Aplicar el concepto de teora de probabilidad para tomar decisiones bajo

    incertidumbre.

    Manejar las distribuciones discretas y continuas de probabilidad para

    resolver problemas reales, teniendo en cuenta los parmetros

    poblacionales y el tipo de situacin a resolver.

    Realizar inferencias partiendo de parmetros muestrales, por medio de

    los intervalos de confianza y prueba de hiptesis.

    3.2. OBJETIVOS COMPLEMENTARIOS

    Diferenciar conceptualmente la poblacin y la muestra.

    Reconocer los tipos de variables y escalas de medicin aplicados a un

    conjunto de datos.

    Estadstica 17

  • Calcular e interpretar las medidas de tendencia central, variabilidad y

    localizacin de un conjunto de datos.

    Calcular los parmetros de la ecuacin de regresin lineal simple.

    Calificar el modelo de regresin lineal simple por medio de los

    coeficientes de correlacin y determinacin.

    Reconocer un espacio muestral y su tcnica de conteo acorde al

    problema.

    Reconocer las diferentes reglas de probabilidad y su aplicabilidad.

    Aplicar y calcular por frmula o tabla de probabilidad, las distribuciones

    binomial, Poisson, hipergeomtrica y normal.

    Reconocer la informacin que se tiene para poder sacar una muestra

    aleatoria, con un alto grado de confiabilidad

    Diferenciar una variable aleatoria discreta y una variable aleatoria

    continua.

    Diferenciar un parmetro poblacional y un parmetro muestral.

    Aplicar de acuerdo con los estadsticos, un parmetro muestral por medio

    del intervalo de confianza o prueba de hiptesis a un nivel de

    confiabilidad.

    Estadstica 18

  • 4. UNIDADES TEMTICAS

    II ESTADSTICA DESCRIPTIVA UNIDAD 1. INTRODUCCIN Y OBTENCIN DE DATOS

    ESTADSTICOS

    UNIDAD 2. ORDENACIN DE DATOS ESTADSTICOS

    UNIDAD 3. MTODOS NUMRICOS

    UNIDAD 4. REGRESIN LINEAL Y CORRELACIN

    III TEORA DE PROBABILIDADES

    UNIDAD 1 DEFINICIONES

    UNIDAD 2 TCNICAS DE CONTEO

    UNIDAD 3 SUCESOS PROBABILSTICOS Y REGLAS DE

    PROBABILIDAD

    UNIDAD 4 VARIABLES ALEATORIAS Y DISTRIBUCIONES DE

    PROBABILIDAD

    IV ESTADSTICA INFERENCIAL

    UNIDAD 1 ESTIMACIN

    UNIDAD 2 INTERVALOS DE CONFIANZA

    UNIDAD 3 PRUEBA DE HIPTESIS

    Estadstica 19

  • 5. METODOLOGA GENERAL

    El curso Estadstica, bajo la modalidad a distancia, es realizado por medio

    de encuentros presenciales, utilizando como mediaciones la plataforma

    Dicom y el mdulo.

    En los encuentros presenciales se compartirn los temas propuestos, se

    realizarn ejemplos aplicados a la administracin y se asignarn actividades

    para las siguientes asesoras.

    Al iniciar el curso, cada estudiante selecciona una organizacin (puede ser

    pblica, privada o del sector de la economa solidaria) o un grupo poblacional

    de inters (estudiantes, familias, habitantes de un barrio, etc.). Seleccionar

    una muestra de elementos (de un tamao acordado) y generar una base de

    datos que contemple las variables cualitativas, cuantitativas discretas y

    cuantitativas continuas.

    En los elementos de la muestra seleccionada, se aplicarn paulatinamente

    los conceptos vistos en el desarrollo del curso. En cada encuentro

    presencial se compartirn los avances sobre la secuencia del anlisis

    estadstico de los elementos de la organizacin.

    A travs de la plataforma virtual Dicom, cada estudiante compartir sus

    inquietudes y apreciaciones en el portafolio personal de desempeo. Estas

    inquietudes sern resueltas por este medio o socializadas en la siguiente

    asesora.

    Estadstica 20

  • 6. EVALUACIN INTEGRAL

    La evaluacin del curso Estadstica se realizar de forma cualitativa, por

    medio del portafolio personal de desempeo (acorde con el artculo 80 del

    Reglamento Estudiantil). Se establecer un proceso dinmico y continuo que

    contenga seguimiento, trabajo aplicado y evaluacin final.

    El seguimiento se realizar a travs de evaluaciones cortas sobre temticas

    ya compartidas, designando un espacio para hacerlas, previo acuerdo con

    los estudiantes.

    El trabajo de aplicacin a la organizacin o poblacin de inters tendr un

    seguimiento durante todo el curso, el cual ser tenido en cuenta para la

    evaluacin final del mismo; adems de la presentacin, anlisis de variables

    y conclusiones.

    Al finalizar el curso, se realizar la evaluacin final o Prueba Acumulativa de

    Conocimiento Integral (PACI), la cual pretende evaluar, de forma global,

    todos los temas tratados en el curso.

    Estadstica 21

  • Estadstica 22

  • INTRODUCCIN

    La estadstica o los mtodos estadsticos, como se denomina a veces, est

    jugando un papel de gran importancia en casi todas las facetas del

    comportamiento humano. Ocupada inicialmente en asuntos del Estado, y de

    ah su nombre, la influencia de la Estadstica se ha extendido ahora a la

    administracin, la economa, los negocios, la comunicacin, la agricultura, la

    medicina, la fsica, las ciencias polticas, la psicologa, la sociologa y muchos

    otros campos de la ciencia y la ingeniera.

    El propsito de este mdulo es presentar desde el manejo de la informacin,

    su representacin tabular y medidas, hasta el manejo de las probabilidades,

    y llegar a conclusiones poblacionales por medio de la inferencia estadstica

    en la cual son de gran utilidad, para la manipulacin de la informacin,

    respuestas bajo incertidumbre y respuestas poblacionales. Se ha diseado

    para ser usado como complemento del proceso formativo, acompaado de la

    plataforma Dicom y los encuentros presenciales. Adems, puede ser

    considerado como texto de consulta para aquellas personas que estn

    interesadas en aplicar la Estadstica en el anlisis de problemas

    investigativos.

    Los temas han sido compilados de diferentes autores: Anderson, Sweeney y

    Williams; Berenson, Levine y Krehbiel; Walpole y Myers; Spiegel, entre otros.

    Cada unidad comienza con enunciados claros de las definiciones pertinentes

    y ejemplos aplicados a la vida real. La nica base matemtica requerida

    Estadstica 23

  • para la comprensin de los temas es la aritmtica. En la primera unidad se

    presenta la conceptualizacin de la estadstica y la forma como se obtiene

    una base de datos. La segunda unidad se refiere a la ordenacin de datos

    estadsticos, segn el tipo de variable en la cual se ubican, para luego

    representar en la tercera unidad las medidas de tendencia central, de

    dispersin y de localizacin del conjunto de datos. La cuarta unidad

    establece la relacin entre variables por medio de la regresin lineal y la

    correlacin. La quinta unidad se refiere a un espacio muestral, las tcnicas

    de conteo y las reglas de probabilidad. La sexta unidad se refiere a la

    diferencia entre variables aleatorias discretas y continuas y sus distribuciones

    de probabilidad. La sptima unidad se refiere a resultados poblacionales, por

    medio de los intervalos de confianza y prueba de hiptesis, basndose en

    resultados muestrales.

    Al final, se presenta un estudio de caso, el cual pretende mayor cercana de

    la Estadstica a la administracin; adems de algunas preguntas frecuentes,

    con su respectiva respuesta, que se presentan al estudiar la Estadstica.

    Estadstica 24

  • JUSTIFICACIN

    El desarrollo cientfico del siglo XXI exige una formacin profesional ntegra,

    que rena conocimientos, experiencia y expectativas, que permita la

    utilizacin adecuada de los recursos y herramientas del mundo actual.

    En la actualidad, las reas administrativas, contables y econmicas requieren

    de un profesional con conocimientos bsicos de clculo, de tal forma que lo

    lleven a incursionar en el campo investigativo y en la toma de decisiones,

    para generar nuevos conocimientos a partir de la integracin de los

    conceptos propios y de las diferentes reas de estudio, que lo hagan ms

    competente en los retos del mundo moderno.

    Estadstica 25

  • Estadstica 26

  • 1. INTRODUCCIN Y OBTENCIN DE DATOS ESTADSTICOS

    1.1. ESTADSTICA

    1.1.1. Historia

    Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto,

    cuyos faraones lograron recopilar, hacia el ao 3050 antes de Cristo, prolijos

    datos relativos a la poblacin y la riqueza del pas. De acuerdo con el

    historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con

    el objetivo de preparar la construccin de las pirmides. En el mismo Egipto,

    Ramss II hizo un censo de las tierras con el objeto de verificar un nuevo

    reparto.

    En el antiguo Israel, la Biblia da referencias, en el libro de los Nmeros, de

    los datos estadsticos obtenidos en dos recuentos de la poblacin hebrea. El

    rey David, por otra parte, orden a Joab, general del ejrcito, hacer un censo

    de Israel con la finalidad de conocer el nmero de la poblacin.

    Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los

    griegos efectuaron censos peridicamente con fines tributarios, sociales

    (divisin de tierras) y militares (clculo de recursos y hombres disponibles).

    La investigacin histrica revela que se realizaron 69 censos para calcular

    los impuestos, determinar los derechos de voto y ponderar la potencia

    guerrera.

    Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor

    supieron emplear los recursos de la estadstica. Cada cinco aos realizaban

    un censo de la poblacin, y sus funcionarios pblicos tenan la obligacin de Estadstica 27

  • anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos

    peridicos del ganado y de las riquezas contenidas en las tierras

    conquistadas. Para el nacimiento de Cristo, suceda uno de estos

    empadronamientos de la poblacin bajo la autoridad del imperio.

    Durante los mil aos siguientes a la cada del imperio romano se realizaron

    muy pocas operaciones estadsticas, con la notable excepcin de las

    relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el

    Breve en el 758, y por Carlomagno en el 762 DC. Durante el siglo IX se

    realizaron en Francia algunos censos parciales de siervos. En Inglaterra,

    Guillermo el Conquistador recopil el Domesday Book o Libro del gran

    catastro para el ao 1086, un documento de la propiedad, extensin y valor

    de las tierras de Inglaterra. Esa obra fue el primer compendio estadstico de

    Inglaterra.

    Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols

    Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren

    Descartes, hicieron grandes operaciones al mtodo cientfico, de tal forma

    que cuando se crearon los Estados nacionales y surgi como fuerza el

    comercio internacional exista ya un mtodo capaz de aplicarse a los datos

    econmicos.

    Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones

    debido al temor que Enrique VII tena por la peste. Ms o menos por la

    misma poca, en Francia la ley exigi a los clrigos registrar los bautismos,

    fallecimientos y matrimonios. Durante un brote de peste que apareci a fines

    de la dcada de 1500, el gobierno ingls comenz a publicar estadsticas

    semanales de los decesos. Esa costumbre continu muchos aos, y en 1632

    estos Bills of Mortality (Cuentas de mortalidad) contenan los nacimientos y

    fallecimientos por sexo. Estadstica 28

  • En 1662, el capitn John Graunt us documentos que abarcaban treinta aos

    y efectu predicciones sobre el nmero de personas que moriran de varias

    enfermedades y sobre las proporciones de nacimientos de varones y mujeres

    que cabra esperar. El trabajo de Graunt, condensado en su obra Natural and

    political observations... Made upon the bills of mortality (Observaciones

    polticas y naturales... hechas a partir de las cuentas de mortalidad), fue un

    esfuerzo innovador en el anlisis estadstico. Por el ao 1540, el alemn

    Sebastin Muster realiz una compilacin estadstica de los recursos

    nacionales, comprensiva de datos sobre organizacin poltica, instrucciones

    sociales, comercio y podero militar.

    Durante el siglo XVII aport indicaciones ms concretas de mtodos de

    observacin y anlisis cuantitativo y ampli los campos de la inferencia y la

    teora estadstica. Los eruditos del siglo XVII demostraron especial inters

    por la estadstica demogrfica como resultado de la especulacin sobre si la

    poblacin aumentaba, decreca o permaneca esttica.

    En los tiempos modernos, tales mtodos fueron resucitados por algunos

    reyes que necesitaban conocer las riquezas monetarias y el potencial

    humano de sus respectivos pases. El primer empleo de los datos

    estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a

    cargo de Gaspar Neumann, un profesor alemn que viva en Breslau. Este

    investigador se propuso destruir la antigua creencia popular de que en los

    aos terminados en siete mora ms gente que en los restantes, y para

    lograrlo hurg pacientemente en los archivos parroquiales de la ciudad.

    Despus de revisar miles de partidas de defuncin pudo demostrar que en

    tales aos no fallecan ms personas que en los dems. Los procedimientos Estadstica 29

  • de Neumann fueron conocidos por el astrnomo ingls Halley, descubridor

    del cometa que lleva su nombre, quien los aplic al estudio de la vida

    humana. Sus clculos sirvieron de base para las tablas de mortalidad que

    hoy utilizan todas las compaas de seguros.

    Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli,

    Francis Maseres, Lagrange y Laplace desarrollaron la teora de

    probabilidades. No obstante, durante cierto tiempo, la teora de las

    probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII

    no comenz a aplicarse a los grandes problemas cientficos. Godofredo

    Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra

    estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con

    sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz

    del gobernante consciente. La raz remota de la palabra se halla, por otra

    parte, en el trmino latino status, que significa estado o situacin. Esta

    etimologa aumenta el valor intrnseco de la palabra, por cuanto la estadstica

    revela el sentido cuantitativo de las ms variadas situaciones.

    Jacques Qutelect es quien aplica las estadsticas a las ciencias sociales.

    Este interpret la teora de la probabilidad para su uso en las ciencias

    sociales y resolver la aplicacin del principio de promedios y de la

    variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la

    aplicacin prctica de todo el mtodo estadstico, entonces conocido, a las

    diversas ramas de la ciencia. Entre tanto, en el perodo del 1800 al 1820 se

    desarrollaron dos conceptos matemticos fundamentales para la teora

    estadstica: la teora de los errores de observacin, aportada por Laplace y

    Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace,

    Gauss y Legendre.

    Estadstica 30

  • A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por

    Correlacin, que tena por objeto medir la influencia relativa de los factores

    sobre las variables. De aqu parti el desarrollo del coeficiente de correlacin

    creado por Karl Pearson y otros cultivadores de la ciencia biomtrica como J.

    Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios

    sobre la medida de las relaciones.

    Los progresos ms recientes en el campo de la Estadstica se refieren al

    ulterior desarrollo del clculo de probabilidades; particularmente en la rama

    denominada indeterminismo o relatividad, se ha demostrado que el

    determinismo fue reconocido en la Fsica como resultado de las

    investigaciones atmicas y que este principio se juzga aplicable tanto a las

    ciencias sociales como a las fsicas.

    1.1.2. Definicin

    La Estadstica es la ciencia cuyo objetivo es reunir una informacin

    cuantitativa concerniente a individuos, grupos, series de hechos, etc., y

    deducir de ello, gracias al anlisis de estos datos, significados precisos o

    previsiones para el futuro.

    La estadstica, en general, es la ciencia que trata de la recopilacin,

    organizacin presentacin, anlisis e interpretacin de datos numricos con

    el fin de realizar una toma de decisin ms efectiva.

    Los estudiantes confunden comnmente los dems trminos asociados con

    las estadsticas, una confusin que es conveniente aclarar debido a que esta

    palabra tiene tres significados: la palabra estadstica, en primer trmino, se

    usa para referirse a la informacin estadstica; tambin se utiliza para

    Estadstica 31

  • referirse al conjunto de tcnicas y mtodos que se utilizan para analizar la

    informacin estadstica; y el trmino estadstico, en singular y en masculino,

    se refiere a una medida derivada de una muestra.

    1.1.3. Divisin

    La Estadstica, para su mejor estudio, se ha dividido en dos grandes ramas:

    la Estadstica Descriptiva y la Inferencial.

    Estadstica Descriptiva: consiste sobre todo en la presentacin de datos en

    forma de tablas y grficas. Esta comprende cualquier actividad relacionada

    con los datos y est diseada para resumir o describir los mismos sin

    factores pertinentes adicionales, esto es, sin intentar inferir nada que vaya

    ms all de los datos como tales.

    Estadstica Inferencial: se deriva de muestras, de observaciones hechas

    slo acerca de una parte de un conjunto numeroso de elementos y esto

    implica que su anlisis requiere de generalizaciones que van ms all de los

    datos. Como consecuencia, la caracterstica ms importante del reciente

    crecimiento de la estadstica ha sido un cambio en el nfasis de los mtodos,

    los cuales son utilizados para hacer generalizaciones. La Estadstica

    Inferencial investiga o analiza una poblacin partiendo de una muestra

    tomada.

    1.2. CONCEPTOS GENERALES

    1.2.1. Unidad de investigacin

    Estadstica 32

  • La unidad de investigacin es el elemento a quien va dirigida la investigacin,

    el cual puede ser una persona, una familia, una vivienda, un estudiante, una

    universidad, un empleado, una organizacin, etc. La unidad debe ser

    adecuada al tipo de investigacin y debe poseer caractersticas claras y

    entendibles que permitan mediciones y comparaciones.

    1.2.2. Poblacin

    Se entiende por poblacin o universo un conjunto grande de elementos o

    unidades de investigacin, de los cuales se estudia una o varias

    caractersticas comunes. Por ejemplo, los estudiantes de una universidad,

    las universidades de una ciudad, los artculos producidos en una fbrica, las

    empresas de un pas, los lanzamientos de una moneda, etc.

    Segn el tamao, la poblacin puede clasificarse en finita e infinita.

    Se considera una poblacin finita cuando tiene un nmero determinado de

    elementos, es decir, se conoce el tamao de la poblacin. Por ejemplo, los

    habitantes de un pas, los estudiantes de una universidad, los empleados de

    una empresa, los asociados a una cooperativa, etc., mientras que la

    poblacin infinita tiene un nmero indeterminado de elementos, por ejemplo,

    los cuerpos que caen, los lanzamientos de un dado, etc.

    Esta clasificacin slo existe en la teora, porque en la prctica existen

    poblaciones con un nmero enormemente grande de elementos, las cuales

    son clasificadas como poblaciones infinitas.

    Cuando la poblacin est compuesta por un nmero relativamente alto de

    elementos, por razones de costo, tiempo y recursos tcnicos que acarreara Estadstica 33

  • la observacin exhaustiva de cada uno de los elementos de la poblacin, es

    necesario recurrir a la seleccin de una muestra representativa de la

    poblacin.

    1.2.3. Muestra

    La muestra es un conjunto de unidades pertenecientes a la poblacin,

    seleccionadas adecuadamente; es decir, es una parte de la poblacin o

    universo. Por ejemplo, de los 150 empleados de una empresa que

    constituyen el universo o poblacin en estudio, al azar se pueden seleccionar

    30 empleados, que constituyen la muestra.

    Al emplear una muestra se busca lograr que al observar una porcin

    reducida de unidades, se puedan sacar conclusiones semejantes a las que

    se obtendran si se estudiara el total de la poblacin o universo.

    Lo ideal es que el nmero de elementos o unidades de observacin que

    constituyen la muestra sea igual al de la poblacin, para evitar los errores al

    utilizar muestras no representativas. Sin embargo, por la limitacin de

    recursos, es preciso acudir al muestreo y asumir los posibles errores que

    puedan generarse. Cuando el tamao de la muestra es igual al de la

    poblacin, el trabajo realizado se denomina censo.

    1.2.4. Parmetros y estadgrafos

    Los parmetros son medidas que describen numricamente una

    caracterstica de la poblacin, tales como: la media aritmtica, la varianza, el

    coeficiente de variacin, etc. Una poblacin puede tener varias

    caractersticas y, por lo tanto, varios parmetros.Estadstica 34

  • Los estadgrafos o estadsticas son medidas que describen numricamente

    una caracterstica de la muestra; as como los parmetros lo hacen en una

    poblacin, igual los estadgrafos lo hacen para la muestra, tales como: la

    media aritmtica, la varianza, el coeficiente de variacin, etc.

    1.2.5. Variables

    Una variable es cualquier caracterstica o propiedad de una poblacin o de

    una muestra, susceptible de asumir distintos valores o modalidades. Por

    ejemplo: la altura de cada uno de los estudiantes de un curso puede tomar

    distintos valores: sta puede ser 1.65 m o 1.72 m, o cualquier otro valor, as

    la altura es una variable. Esto no significa que la altura de un estudiante

    puede variar, sino que la altura puede variar de un estudiante a otro.

    El color tambin es una variable. Si se toma, por ejemplo, el color de las

    camisetas de los estudiantes, esta cualidad puede variar de una camiseta a

    otra, ya que puede haber camisetas blancas, negras, rojas, azules, etc.

    Estos colores son, en este caso, los distintos atributos o modalidades que

    puede asumir la variable en mencin.

    Las caractersticas de los objetos pueden ser o no ser susceptibles de

    medida; en el primer caso (la altura de los estudiantes) se tiene una

    caracterstica cuantitativa, y en el segundo (el color de la camiseta) una

    caracterstica cualitativa. Por esta razn, las variables se clasifican en

    cualitativas y cuantitativas.

    Estadstica 35

  • Variables cualitativas

    Las variables cualitativas son las que no permiten construir una serie

    numrica definida; los atributos o caractersticas que toman son distintas

    modalidades observadas cualitativamente. Son variables cualitativas el

    color, la profesin, el estado civil, etc.

    Para designar variables cualitativas, generalmente se utilizan las primeras

    letras del alfabeto en maysculas (A, B, C,...) y para designar el atributo se

    toman las letras minsculas acompaadas por subndices. Por ejemplo, la

    variable profesin en una empresa puede ser representada por la letra A y

    sus posibles caractersticas: administrador, economista, contador, ingeniero,

    por a1, a2 , a3 ,a4, respectivamente, en este caso,

    a1 = administrador

    a2 = economista

    a3 = contador

    a4 = ingeniero

    Variables cuantitativas

    Las variables cuantitativas son aquellas que permiten una escala numrica

    de medicin, toman distintos valores observados cuantitativamente mediante

    una medida y una escala de medidas. Son variables cuantitativas la altura,

    el peso, el nmero de hijos de una familia, el salario, el nmero de artculos

    producidos en una semana.

    Para designar las variables cuantitativas se utilizan las ltimas letras del

    alfabeto en maysculas (... X, Y, Z). Por ejemplo, la variable altura de cinco Estadstica 36

  • estudiantes se representa por X y las alturas 1.65 m, 1.67 m, 1.68 m, 1.70 m

    y 1.72 m, se representan por x1, x2 , x3 , x4 y x5 , respectivamente. En este

    caso,

    x1 = 1.65 m

    x2 = 1.67 m

    x3 = 1.68 m

    x4 = 1.70 m

    x5 = 1.72 m

    Las variables cuantitativas pueden clasificarse en cuantitativas continuas y

    cuantitativas discretas.

    Una variable es cuantitativa continua si entre dos valores consecutivos

    puede tomar infinito nmero de valores; es decir, entre uno y otro valor de la

    variable existen infinitas posibilidades intermedias; son variables continuas el

    peso, la temperatura, el tiempo, el salario, etc.

    Por ejemplo, el peso es una variable cuantitativa continua porque entre los

    valores de 65 Kg y 66 Kg existen infinitos valores, stos pueden ser 65.9 Kg,

    65.99 Kg, 65.999 Kg, etc.

    Una variable es cuantitativa discreta si entre dos valores consecutivos no

    puede asumir otro valor; en este caso la variable no toma valores decimales.

    Por ejemplo, el nmero de empleados de una empresa, el nmero de

    artculos producidos, el nmero de empresas de la competencia, etc. En

    estos casos se habla de un cierto valor como 10, 11, 12 o cualquier otro

    nmero entero, porque es absurdo decir, por ejemplo, que una empresa tiene

    11.8 empleados.Estadstica 37

  • 1.2.6. Escalas de medicin

    Una escala es un sistema para asignar valores numricos a ciertas

    caractersticas o rasgos mensurables. Existen varios mtodos para ordenar

    datos; en la mayora de los casos, las tcnicas de medicin se pueden

    reducir a cuatro tipos de escalas: nominal, ordinal, de intervalos y de razn.

    Escala nominal

    La escala nominal se aplica a la variable cualitativa, la cual presenta

    diferentes categoras o modalidades, cada una de las cuales recibe un

    nombre; de ah la denominacin de esta escala. A las variables con tales

    caractersticas tambin se les denomina atributos. Las categoras pueden

    estar preconstruidas y ser de aceptacin general, o puede definirlas el

    investigador de acuerdo con sus intereses, pero en cualquier caso deben ser

    exhaustivas y mutuamente excluyentes, esto es, que exista una y slo una

    categora para cada uno de los elementos de la poblacin.

    Ejemplos:

    Color = {blanco, rojo, azul, verde, violeta, otro}

    Tipo de artculo = {normal, imperfecto}

    Cargo = {gerente, coordinador, auxiliar}

    Las nicas estadsticas bsicas que se pueden obtener a partir de estas

    variables son la frecuencia y la moda y, por tanto, los mtodos estadsticos

    disponibles son aquellos que se basan en las mismas. En el caso de una

    sola variable, se pueden obtener tablas de frecuencias y diagramas de Estadstica 38

  • barras o de sectores; si se tienen dos variables se puede realizar un anlisis

    de correspondencia o construir tablas de contingencia.

    Escala ordinal

    Cada uno de los niveles de esta escala tiene un rango, lo que permite

    establecer comparaciones de orden entre los mismos (mayor que, menor

    que). No obstante, no es adecuado, en general, suponer que la distancia

    entre un nivel y sus niveles adyacentes superior e inferior es la misma.

    Ejemplos:

    Estado sanitario = {sano, ligeramente afectado, enfermo, muy enfermo,

    muerto}

    Estrato socioeconmico = {1, 2, 3, 4, 5, 6}

    Produccin = {alta, media, baja}

    Las variables medidas en esta escala contienen ms informacin que

    aquellas medidas en escala nominal; por tanto, se podran aplicar los mismos

    mtodos y anlisis, prescindiendo de la informacin de orden.

    Adicionalmente, se pueden calcular la mediana y la desviacin media.

    Aunque es posible reemplazar cada una de los niveles por un nmero

    (etiqueta), ste no aporta informacin adicional y las relaciones que se

    pueden establecer siguen siendo las mismas. As, se podra hacer

    corresponder los nmeros del 1 al 5 con cada uno de los niveles de estado

    fitosanitario, pero lo nico que se podra decir en cuanto a la sanidad es que

    1 > 2 > 3 > 4 > 5. En general, ser inadecuada la utilizacin de estos

    Estadstica 39

  • nmeros para efectuar operaciones o deducciones matemticas de otro tipo,

    como la obtencin del estado fitosanitario promedio, por ejemplo.

    Escala de intervalo

    Es una escala que contiene ms informacin que las anteriores, pues

    adems de que existe un orden entre los diferentes niveles, la distancia entre

    cualquier par de niveles adyacentes es la misma, lo que implica el uso de

    una distancia unitaria de referencia. Esta caracterstica permite establecer

    relaciones entre cualquier par de intervalos en la escala; as, es posible

    afirmar que la distancia que hay entre 5 y 6 es la misma que hay entre 10 y

    11.

    Esta escala hace uso de un punto cero que se asigna arbitrariamente en

    cada sistema y que no implica ausencia de la caracterstica medida. Este

    hecho hace imposible establecer comparaciones de razn. As, para una

    caracterstica medida en esta escala, sera incorrecto afirmar que 5 es la

    mitad de 10.

    Un ejemplo tpico es la escala en que se mide la temperatura; para su

    medicin se pueden utilizar diferentes sistemas: el Celsius, el Fahrenheit1 u

    otro. Dentro de cualquiera de estos sistemas es posible afirmar que la

    distancia entre dos divisiones cualesquiera es la misma, sin importar el lugar

    de la escala. No obstante, en la siguiente tabla se observa cmo una

    relacin entre dos temperaturas cambia dependiendo del sistema, la cual

    explica por qu no puede afirmarse que 5 sea la mitad de 10.

    Celsius Fahrenheit1 (temperatura) F = (9/5) * (temperatura) C + 32

    Estadstica 40

  • 5 C 41 F10 C 50 F

    Ntese que cualquier escala ordinal que se construya cuidando que la

    distancia entre niveles sea la misma constituir, en realidad, una escala de

    intervalos.

    Cuando las variables estn medidas en esta escala, se pueden calcular

    todos los estadsticos, y es posible usar cualesquiera de los mtodos

    estadsticos clsicos, siempre que se cumplan los supuestos especficos de

    los mismos.

    Escala de razones

    Es la escala de medicin que tiene ms informacin. Posee un punto cero

    verdadero que indica ausencia de la caracterstica, lo que permite realizar

    comparaciones no slo de intervalo, sino tambin de razones, sin importar el

    sistema utilizado.

    As, por ejemplo, un objeto que mida 5,08 cm tendr el doble de longitud con

    relacin a un objeto que mida 2,54 cm, cualquiera que sea el sistema en que

    se registre la longitud, tal como se muestra en la siguiente tabla2.

    Centmetros Pulgadas2,54 15,08 2

    Como ejemplo de variables medidas en escala de razones, estn los conteos

    de cualquier caracterstica, pesos y longitudes, ente otras.

    2 1 pulgada = 2,54 centmetrosEstadstica 41

  • Cuando se tiene una variable medida en escala de razones, se pueden

    calcular todos los estadsticos y es posible utilizar cualesquiera de los

    mtodos estadsticos clsicos, siempre que se cumplan los supuestos

    especficos de los mismos.

    Las escalas de medicin que contienen poca informacin se denominan

    dbiles, y los mtodos estadsticos que se pueden aplicar sobre las mismas

    son, por lo general, ms restringidos. Las escalas de medicin con mayor

    informacin se denominan escalas fuertes y pueden analizarse mediante los

    mtodos diseados especficamente para su anlisis o mediante

    cualesquiera de los mtodos diseados para trabajar sobre variables

    medidas en una escala ms dbil, simplemente prescindiendo de la

    informacin adicional.

    Una clasificacin ms amplia llama variables cualitativas a aquellas medidas

    en escala nominal, y cuantitativas a las medidas en escala de razones o de

    intervalo. Las variables medidas en escala ordinal forman un puente entre

    ambas.

    1.3. MUESTREO

    Los mtodos estadsticos proponen diferentes tipos de muestreo, aunque en

    general pueden dividirse en dos grandes grupos: mtodos de muestreo

    probabilsticos y mtodos de muestreo no probabilsticos.

    1.3.1. Mtodos de muestreo probabilsticos

    Estadstica 42

  • Los mtodos de muestreo probabilstico son aquellos que se basan en el

    principio de equiprobabilidad. Es decir, aquellos en los que todos los

    individuos tienen la misma probabilidad de ser elegidos para formar parte de

    una muestra y, consiguientemente, todas las posibles muestras de tamao n

    tienen la misma probabilidad de ser elegidas. Slo estos mtodos de

    muestreo probabilstico aseguran la representatividad de la muestra extrada

    y son, por tanto, los ms recomendables. Dentro de los mtodos de

    muestreo probabilstico se encuentran los siguientes tipos:

    Muestreo aleatorio simple

    El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada

    individuo de la poblacin, y 2) a travs de algn medio mecnico (bolas

    dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios

    generados con una calculadora u ordenador, etc.) se eligen tantos sujetos

    como sea necesario para completar el tamao de muestra requerido.

    Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad

    prctica cuando la poblacin que se est manejando es muy grande.

    Muestreo aleatorio sistemtico

    Este procedimiento exige, como el anterior, numerar todos los elementos de

    la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae

    uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y

    los elementos que integran la muestra son los que ocupan los lugares i, i+k,

    i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el

    resultado de dividir el tamao de la poblacin entre el tamao de la muestra:

    Estadstica 43

  • k=N/n. El nmero i que se emplea como punto de partida ser un nmero al

    azar entre 1 y k.

    El riesgo se este tipo de muestreo est en los casos en que se dan

    periodicidades en la poblacin ya que al elegir a los miembros de la muestra

    con una periodicidad constante (k) se puede introducir una homogeneidad

    que no se da en la poblacin. Supngase que se est seleccionando una

    muestra sobre listas de 10 individuos en los que los 5 primeros son varones y

    los 5 ltimos mujeres; si se emplea un muestreo aleatorio sistemtico con

    k=10 siempre sern seleccionados o slo hombres o slo mujeres; no podra

    haber una representacin de los dos sexos.

    Muestreo aleatorio estratificado

    Trata de obviar las dificultades que presentan los anteriores, ya que

    simplifica los procesos y suele reducir el error muestral para un tamao dado

    de la muestra. Consiste en considerar categoras tpicas diferentes entre s

    (estratos) que poseen gran homogeneidad respecto a alguna caracterstica

    (se puede estratificar, por ejemplo, segn la profesin, el municipio de

    residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de

    muestreo es asegurarse de que todos los estratos de inters estarn

    representados adecuadamente en la muestra. Cada estrato funciona

    independientemente, pudiendo aplicarse dentro de ellos el muestreo

    aleatorio simple o el estratificado para elegir los elementos concretos que

    formarn parte de la muestra. En ocasiones, las dificultades que plantea son

    demasiado grandes, pues exige un conocimiento detallado de la poblacin

    (tamao geogrfico, sexos, edades...).

    Estadstica 44

  • La distribucin de la muestra en funcin de los diferentes estratos se

    denomina afijacin, y puede ser de diferentes tipos:

    Afijacin simple: a cada estrato le corresponde igual nmero de elementos

    muestrales.

    Afijacin proporcional: la distribucin se hace de acuerdo con el peso

    (tamao) de la poblacin en cada estrato.

    Afijacin ptima: se tiene en cuenta la previsible dispersin de los

    resultados, de modo que se consideran la proporcin y la desviacin tpica.

    Tiene poca aplicacin ya que no se suele conocer la desviacin.

    Por ejemplo, se est interesado en estudiar el grado de aceptacin que la

    implantacin de la reforma educativa ha tenido entre los padres de un

    municipio. A tal efecto se seleccion una muestra de 600 padres de familia.

    Se conoce por los datos del Ministerio de Educacin que de los 10.000 nios

    escolarizados en la bsica, 7.000 acuden a colegios pblicos y 3.000 a

    colegios privados. Como el inters es que en la muestra estn representados

    todos los tipos de colegio, se realiza un muestreo estratificado empleando

    como variable de estratificacin el tipo de colegio.

    Si se emplea una afijacin simple seran 300 nios de cada tipo de centro,

    pero en este caso parece ms razonable utilizar una afijacin proporcional

    pues hay bastante diferencia en el tamao de los estratos. Por consiguiente,

    se calcula la proporcin para cada uno de los estratos respecto de la

    poblacin, para poder reflejarlo en la muestra.

    Estadstica 45

  • Colegios pblicos: 7.000/10.000 = 0.70

    Colegios privados: 3.000/10.000 = 0.30

    Para conocer el tamao de cada estrato en la muestra se multiplica la

    proporcin por el tamao muestral.

    Colegios pblicos: 0.70x600 = 420 padres de familia

    Colegios privados: 0.30x600 = 180 padres de familia

    Muestreo aleatorio por conglomerados

    Los mtodos presentados hasta ahora estn pensados para seleccionar

    directamente los elementos de la poblacin, es decir, que las unidades

    muestrales son los elementos de la poblacin. En el muestreo por

    conglomerados la unidad muestral es un grupo de elementos de la poblacin

    que forman una unidad, a la que se denomina conglomerado. Las unidades

    hospitalarias, los departamentos universitarios, una caja de determinado

    producto, etc. son conglomerados naturales. En otras ocasiones, se pueden

    utilizar conglomerados no naturales como, por ejemplo, las urnas electorales.

    Cuando los conglomerados son reas geogrficas suele hablarse de

    "muestreo por reas".

    El muestreo por conglomerados consiste en seleccionar aleatoriamente un

    cierto nmero de conglomerados (el necesario para alcanzar el tamao

    muestral establecido) y en investigar despus todos los elementos

    pertenecientes a los conglomerados elegidos.

    Por ejemplo, en una investigacin se trata de conocer el grado de

    satisfaccin laboral de los empleados de una cadena de almacenes; se toma Estadstica 46

  • una muestra de 700 empleados. Ante la dificultad de acceder individualmente

    a estos empleados, se decide hacer una muestra por conglomerados.

    Sabiendo que el nmero de empleados por almacn es aproximadamente de

    35, los pasos a seguir seran:

    Recoger un listado de todos los almacenes.

    Asignar un nmero a cada uno de ellos.

    Elegir por muestreo aleatorio simple o sistemtico los 20 almacenes

    (700/35 = 20) que proporcionarn los 700 empleados que se

    necesitan.

    Finalmente, ante lo compleja que puede llegar a ser la situacin real de

    muestreo es muy comn emplear lo que se denomina muestreo polietpico.

    Este tipo de muestreo se caracteriza por operar en sucesivas etapas,

    empleando en cada una de ellas el mtodo de muestreo probabilstico ms

    adecuado.

    1.3.2. Mtodos de muestreo no probabilsticos

    A veces, para estudios exploratorios, el muestreo probabilstico resulta

    excesivamente costoso y se acude a mtodos no probabilsticos, aun siendo

    conscientes de que no sirven para realizar generalizaciones, pues no se

    tiene certeza de que la muestra extrada sea representativa, ya que no todos

    los sujetos de la poblacin tienen la misma probabilidad de ser elegidos. En

    general, se selecciona a los sujetos siguiendo determinados criterios

    procurando que la muestra sea representativa.

    Estadstica 47

  • Muestreo por cuotas

    Tambin denominado en ocasiones "accidental". Se asienta generalmente

    sobre la base de un buen conocimiento de los estratos de la poblacin y/o de

    los individuos ms "representativos" o "adecuados" para los fines de la

    investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio

    estratificado, pero no tiene el carcter de aleatoriedad de aqul.

    En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero

    de individuos que renen determinadas condiciones, por ejemplo: 20

    individuos de 25 a 40 aos, de sexo femenino y residentes en una misma

    ciudad. Una vez determinada la cuota, se eligen los primeros que se

    encuentre que cumplan esas caractersticas. Este mtodo se utiliza mucho

    en las encuestas de opinin.

    Por ejemplo, una universidad desea estudiar la incidencia de las drogas en la

    adolescencia. Lo que debera hacer sera: conocer por los informes del

    Estado cules son los centros educativos ms afectados por el problema,

    fijar un nmero de sujetos a entrevistar, proporcional a cada uno de los

    estratos (cuotas) y, finalmente, dejar en manos de los responsables del

    trabajo de campo a qu sujetos concretos se deber entrevistar.

    Muestreo opintico o intencional

    Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener

    muestras "representativas" mediante la inclusin en la muestra de grupos

    supuestamente tpicos. Es muy frecuente su utilizacin en sondeos

    preelectorales de zonas que en anteriores votaciones han marcado

    tendencias de voto. Estadstica 48

  • Muestreo casual o incidental

    Se trata de un proceso en el que el investigador selecciona directa e

    intencionadamente los individuos de la poblacin. El caso ms frecuente de

    este procedimiento es el utilizar como muestra los individuos a los que se

    tiene fcil acceso (los profesores de universidad emplean con mucha

    frecuencia a sus propios alumnos). Un caso particular es el de los

    voluntarios.

    Bola de nieve

    Se localiza a algunos individuos, los cuales conducen a otros, y stos a

    otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy

    frecuentemente cuando se hacen estudios con poblaciones "marginales",

    delincuentes, sectas, determinados tipos de enfermos, egresados de una

    institucin, etc.

    1.3.3. Evaluacin del valor de una encuesta

    Cotidianamente se oye o se lee sobre resultados de encuestas en los

    diferentes medios de comunicacin. Es evidente que los avances

    tecnolgicos en las comunicaciones han provocado la proliferacin de

    investigaciones por medio de encuestas; sin embargo, no todas son

    aceptables, significativas o importantes.

    Para evitar encuestas carentes de objetividad o credibilidad, debe evaluarse

    con sentido crtico todo lo que se lee y escucha, adems de examinarse el

    valor de la encuesta, evaluando los siguientes aspectos:Estadstica 49

  • Propsito de la encuesta: por qu y para quin se realiza. Un resultado

    de opinin o una encuesta realizada para satisfacer la curiosidad

    pertenece a la esfera de la diversin. Su resultado es un fin en s mismo,

    no un medio para lograr un fin. Debe existir escepticismo ante tales

    encuestas porque el resultado no tiene una aplicacin posterior.

    Determinar si la encuesta est basada en una muestra probabilstica o no

    probabilstica: el nico medio disponible para hacer inferencias

    estadsticas correctas a partir de una muestra es el uso de un muestreo

    probabilstico. Las encuestas que emplean mtodos de muestreo no

    probabilstico estn sujetas a errores significativos, quiz no

    intencionales, que pueden generar resultados sin sentido.

    1.3.4. Errores en las encuestas

    Aun cuando en las encuestas se utilizan mtodos de muestreo probabilstico,

    estn sujetas a errores potenciales, los cuales se describen a continuacin:

    Error de cobertura o sesgo en la seleccin

    La clave para una seleccin apropiada en la muestra es un marco de

    poblacin adecuado o una lista actualizada de todos los elementos que

    participarn en el muestreo. El error de cobertura ocurre si se excluyen

    ciertos elementos de la lista de poblacin, de manera que no tienen

    oportunidad de ser seleccionados en la muestra. El error de cobertura

    conduce a un sesgo de seleccin. Si el listado es inadecuado porque no se

    incluyeron algunos elementos de la poblacin, cualquier muestra

    Estadstica 50

  • probabilstica aleatoria proporcionar una estimacin de las caractersticas

    del marco, no de la poblacin real.

    Error o sesgo de no respuesta

    No todas las personas estn dispuestas a contestar una encuesta. El error

    de no respuesta surge del fracaso al recopilar datos de todos los sujetos de

    la muestra y el resultado es un sesgo de no respuesta. Como en general no

    se puede suponer que las personas que no responden son semejantes a

    aquellas que s responden, es importante realizar un seguimiento a las no

    respuestas despus de un periodo determinado. Deben hacerse varios

    intentos, ya sea por correo o por telfono, para convencerlos de que

    diligencien la encuesta. Con base en estos resultados, las estimaciones

    obtenidas con las respuestas iniciales se combinan con las estimaciones

    obtenidas con el seguimiento, de manera que las inferencias hechas a partir

    de la encuesta sean vlidas.

    Error de muestreo

    El error de muestreo se presenta cuando se encuesta una muestra y no la

    poblacin, es decir, cuando no se aplica un censo. Aun cuando no se puede

    evitar este error, s se puede controlar; una forma importante de controlarlo

    es seleccionar un mtodo o un diseo adecuado de muestreo. El error de

    muestreo muestra la heterogeneidad o las diferencias aleatorias de una

    muestra a otra, segn la probabilidad de que elementos especficos sean

    seleccionados en unas muestras determinadas.

    Error de medicin

    Estadstica 51

  • Se refiere a la falta de precisin en las respuestas registradas, debido a fallas

    en la redaccin del enunciado de las preguntas, la influencia del

    entrevistador en la persona que responde, o por el esfuerzo que realiza la

    persona que responde.

    1.3.5. Aspectos ticos del muestreo

    En la actualidad se existe una tendencia a la proliferacin de investigaciones

    que se apoyan en encuestas; no todas son buenas, significativas o

    importantes, y no todas son ticas. Debe intentarse distinguir entre un

    diseo de encuesta deficiente y un diseo carente de tica.

    Las consideraciones ticas surgen con relacin a cuatro tipos de errores

    potenciales que pueden ocurrir cuando se disean encuestas que utilizan

    muestras probabilsticas aleatorias: error de cobertura o sesgo de seleccin,

    error o sesgo de no respuesta, error de muestreo y error de medicin. El

    error de cobertura o sesgo de seleccin se convierte en un problema tico,

    slo si se excluyen a propsito grupos especficos de individuos del marco de

    poblacin, para obtener resultados sesgados, que indican una posicin ms

    favorable para los intereses del investigador.

    De igual manera, el error o sesgo de no respuesta se convierte en un

    problema tico, slo si es menos probable que grupos o individuos

    especficos respondan a una encuesta, y si el investigador la disea a

    propsito con el fin de excluir grupos o elementos.

    El error de muestreo se convierte en un problema tico, slo cuando los

    resultados se presentan, a propsito, sin referencia al tamao de muestra o

    Estadstica 52

  • al margen de error, de modo que el investigador puede promover un punto

    de vista que de otra manera sera insignificante.

    El error de medicin se convierte en un problema tico en cualquiera de las

    siguientes situaciones:

    Un investigador puede elegir preguntas orientadas que guan las

    respuestas hacia una direccin especfica.

    Un investigador, mediante actitudes y tono de voz, puede crear un efecto

    deliberado de halo o puede guiar las respuestas en cierta direccin.

    Alguien que responde, pero no est de acuerdo con la encuesta, puede

    proporcionar informacin falsa a propsito.

    Estadstica 53

  • 2. ORDENACIN DE DATOS ESTADSTICOSEstadstica 54

  • En los datos obtenidos en encuestas, experimentos o mediante cualquier

    instrumento de medida, por ser numerosos, se dificulta su interpretacin, a

    menos que se ordenen y clasifiquen en forma conveniente. Por lo tanto, se

    deben agrupar los datos y presentarlos en forma de tablas.

    2.1. TABULACIN DE DATOS

    La tabulacin de datos consiste en tomar los distintos valores o atributos que

    toma la variable y colocarlos en columna, de acuerdo con algn criterio de

    ordenacin, y al frente se coloca el nmero de veces que aparece el valor o

    atributo, o sea, la frecuencia.

    Para la tabulacin de datos correspondientes a variables cualitativas se

    puede hacer de acuerdo con el orden cronolgico, con el orden alfabtico o

    en forma convencional.

    Por ejemplo, una Cooperativa de Trabajo Asociado Epsilon desea conocer el

    nivel de escolaridad de sus asociados y encuentra la siguiente informacin: 5

    profesionales, 15 tcnicos, 20 bachilleres y 10 con bsica primaria.

    Ordenando los niveles de escolaridad en forma convencional se obtiene la

    tabla 1.

    Estadstica 55

  • Tabla 1. Nivel de escolaridad de los asociados de la Cooperativa de

    Trabajo Asociado Epsilon

    NIVEL DE ESCOLARIDAD TABULACIN FRECUENCIAProfesional 5Tcnico 15Bachiller

    20

    Bsica primaria 10Fuente: Datos hipotticos

    Para la clasificacin de datos correspondientes a variables cuantitativas se

    utilizan escalas numricas y se pueden colocar de forma creciente o

    decreciente.

    Por ejemplo, se seleccionan diez asociados de la Cooperativa de Trabajo

    Asociado Epsilon y se les consulta por el nmero de hijos que poseen en el

    momento, obteniendo los siguientes datos: 2, 3, 1, 1, 0, 2, 4, 3, 2, 2.

    Ordenando en forma creciente se obtiene la tabla 2.

    Tabla 2. Nmero de hijos de los asociados de la Cooperativa de Trabajo

    Asociado Epsilon

    NMERO DE HIJOS TABULACIN FRECUENCIA0 11 22 43 24 1

    Fuente: Datos hipotticos

    En la tabla 2 se ha ordenado en forma creciente el nmero de hijos de los

    asociados, pero cuando los datos son numerosos o el recorrido de la variable

    es largo, este procedimiento no es prctico y, por lo tanto, se deben formar

    Estadstica 56

  • grupos o intervalos de clase, mediante el siguiente procedimiento: rango o

    recorrido, amplitud del rango, nmero de clases, amplitud del intervalo de

    clase, lmites de cada clase y tabulacin.

    2.1.1. Rango o recorrido (R)

    El rango o recorrido (R) de una variable es el campo de variacin numrica

    de dicha variable, es decir, el intervalo entre el menor valor y el mayor valor

    que toma la variable. Se representa como:

    Donde, R: rango o recorrido.

    Li: lmite inferior (menor valor de la variable).

    Ls: lmite superior (mayor valor de la variable).

    Por ejemplo, un grupo de expertos en auditaje analiza el tiempo que tarda

    (en minutos) en realizar la auditora de un proceso similar en diferentes

    empresas. Los datos se presentan en la siguiente tabla:

    Tabla 3. Tiempo que tarda (en minutos) un grupo de expertos en auditar

    un procesoEstadstica 57

    R = [ Li , Ls ]

  • Auditor Tiempo

    (min)

    Auditor Tiempo

    (min)

    Auditor Tiempo

    (min)

    Auditor Tiempo

    (min)

    Auditor Tiempo

    (min)Aud. 1 70 Aud. 11 47 Aud. 21 57 Aud. 31 52 Aud.41 51Aud. 2 71 Aud. 12 68 Aud. 22 55 Aud. 32 63 Aud.42 50Aud. 3 62 Aud. 13 60 Aud. 23 55 Aud. 33 65 Aud.43 60Aud. 4 63 Aud. 14 54 Aud. 24 57 Aud. 34 50 Aud.44 56Aud. 5 67 Aud. 15 63 Aud. 25 59 Aud. 35 53 Aud.45 67Aud. 6 65 Aud. 16 60 Aud. 26 74 Aud. 36 59 Aud.46 59Aud. 7 74 Aud. 17 69 Aud. 27 56 Aud. 37 45 Aud.47 68Aud. 8 62 Aud. 18 54 Aud. 28 59 Aud. 38 72 Aud.48 61Aud. 9 65 Aud. 19 73 Aud. 29 71 Aud. 39 64 Aud.49 51Aud. 10 56 Aud. 20 55 Aud. 30 50 Aud. 40 69 Aud.50 64Fuente: Datos hipotticos

    En la tabla 3 el valor mayor es 74 minutos y, el menor, 45 minutos, por lo

    tanto:

    Li = 45 minutos, Ls = 74 minutos y R = [45, 74]

    Lmites reales: como los tiempos se registran con aproximacin a 1 minuto,

    el lmite inferior, 45 minutos, incluye el valor 44.6 minutos; por lo tanto, el

    valor real del lmite inferior es 44.5 minutos; y el lmite superior, 74 minutos,

    incluye el valor 74.5 minutos; luego, el lmite real superior es 74.5 minutos, y

    el recorrido real en este caso es:

    R = [44.5, 74.5]

    2.1.2. Amplitud del rango (AR)

    La amplitud del rango de una variable se determina hallando la diferencia

    entre el lmite superior real y el lmite inferior real.

    Estadstica 58

    AR = Ls - Li

  • Para el ejemplo de la tabla 3 la amplitud del rango es:

    AR = 74.5 minutos 44.5 minutos = 30 minutos

    2.1.3. Nmero de clases (m)

    El nmero de clases puede obtenerse de forma convencional, teniendo en

    cuenta que no debe ser menor a 5 ni mayor de 20 clases. Sin embargo,

    puede obtenerse por medio de la frmula de Sturges, la cual es:

    Donde n es el nmero total de datos.

    Para el ejemplo de la tabla 3 el nmero de intervalos es:

    m = 1 + 3.3 x log (50)

    m = 1 + 3.3 x 1.69

    m = 1 + 5.6

    m = 6.6

    En este caso se pueden tomar 6 7 intervalos.

    2.1.4. Amplitud del intervalo de clase (C)

    El valor del intervalo de clase no es necesario que sea igual para todos los

    intervalos; sin embargo, para fines de simplificacin y funcionalidad es Estadstica 59

    m = 1 + 3.3 x log

  • conveniente que todas las clases tengan la misma amplitud. Para obtenerla,

    se divide la amplitud del rango entre el nmero m de clases que se considere

    ms adecuado, teniendo en cuenta que C debe ser un nmero exacto. En

    consecuencia,

    Para el ejemplo de la tabla 3 la amplitud del intervalo podra ser:

    Si m = 6, entonces C = 30/6, C = 5 minutos

    Si m = 7, entonces C = 30/7, C = 4.285714286... minutos

    Entre estos dos valores, el ms recomendable es C = 5, ya que es exacto.

    Por lo tanto, se deben construir 6 intervalos con una amplitud de 5 minutos.

    Esto es m = 6 y C = 5.

    Cuando la amplitud del intervalo (AR) no es divisible por un nmero entero,

    sta se puede incrementar hasta hacerla divisible; este incremento debe ser

    distribuido proporcionalmente, sumando la mitad al lmite superior y restando

    la otra mitad al lmite inferior.

    2.1.5. Lmites de las clases

    Cada clase tiene un lmite inferior il y un lmite superior sl ; el lmite inferior

    de la clase ms baja o clase uno es igual al lmite inferior del rango L i, y el

    lmite superior de esta clase es igual al lmite inferior, ms la amplitud del

    intervalo (C). El lmite inferior de la clase dos es igual al lmite superior de la

    Estadstica 60

    C = AR / m

  • clase uno, y el lmite superior de esta clase es igual al lmite inferior, ms la

    amplitud del intervalo (C). Y as sucesivamente, hasta cubrir el nmero de

    clases definidas.

    Para el ejemplo de la tabla 3, los lmites de clases seran:

    Tabla 4. Lmites de clases para el tiempo que tarda (en minutos) un

    grupo de expertos en auditar un proceso

    N DE CLASE LMITES DE CLASE

    il - sl

    INTERVALOS DE CLASE

    il - sl1 44.5 - 44.5 + 5 = 49.5 44.5 - 49.52 49.5 - 49.5 + 5 = 54.5 49.5 - 54.53 54.5 - 54.5 + 5 = 59.5 54.5 - 59.54 59.5 - 59.5 + 5 = 64.5 59.5 - 64.55 64.5 - 64.5 + 5 = 69.5 64.5 - 69.56 69.5 - 69.5 + 5 = 74.5 69.5 - 74.5

    Fuente: Datos hipotticos

    2.1.6. Tabulacin

    Una vez establecidos los intervalos de clase, se procede al conteo como en

    el caso para datos no agrupados, como se ilustra en la tabla 5.

    Tabla 5. Tabulacin para el tiempo que tarda (en minutos) un grupo de

    expertos en auditar un proceso

    N DE CLASE TIEMPO (minutos) TABULACIN FRECUENCIAS

    Estadstica 61

  • 1 44.5 - 49.5 22 49.5 - 54.5 93 54.5 - 59.5

    12

    4 59.5 - 64.5

    11

    5 64.5 - 69.5 96 69.5 - 74.5 7

    Fuente: Datos hipotticos

    2.1.7. Marca de clase o punto medio

    Cada clase tiene un punto medio o marca de clase .

    ix que representa a cada

    intervalo. La marca de clase se calcula como la semisuma entre los lmites

    inferior y superior de cada intervalo, as:

    Tabla 6. Marca de clase para el tiempo que tarda (en minutos) un grupo

    de expertos en auditar un proceso

    N DE

    CLASE

    INTERVALO

    (Tiempo en minutos)

    MARCA DE

    CLASE1 44.5 - 49.5 472 49.5 - 54.5 523 54.5 - 59.5 574 59.5 - 64.5 625 64.5 - 69.5 676 69.5 - 74.5 72

    Estadstica 62

    2

    .is

    ill

    x+

    =

  • Fuente: Datos hipotticos

    Obsrvese que al pasar de una marca de clase a la siguiente, sta se

    incrementa en las mismas unidades de la amplitud del intervalo C; por esta

    razn es que C siempre debe ser un nmero exacto.

    2.2. FRECUENCIAS

    2.1.1. Frecuencia absoluta (fi)

    Se llama frecuencia absoluta (fi) al nmero de veces que aparece el valor xi

    de una variable X en un colectivo. As, si en un grupo de 30 empleados hay 6

    que tienen una edad de 25 aos, se dice que la edad 25 aos tiene una

    frecuencia de 6.

    Las frecuencias absolutas para el grupo de expertos de la auditora de un

    proceso se presentan en la tabla 7.

    Tabla 7. Frecuencias absolutas para el tiempo que tarda (en minutos) un

    grupo de expertos en auditar un proceso

    N DE CLASE INTERVALO

    (Tiempo en minutos)

    FRECUENCIA

    ABSOLUTA (fI)1 44.5 - 49.5 22 49.5 - 54.5 93 54.5 - 59.5 124 59.5 - 64.5 115 64.5 - 69.5 96 69.5 - 74.5 7

    TOTAL 50Fuente: Datos hipotticos

    Estadstica 63

  • Obsrvese que la suma de las frecuencias absolutas debe ser igual al

    nmero total de datos.

    2.2.2. Frecuencia relativa (hi)

    Se llama frecuencia relativa (hi) al cociente de dividir la frecuencia absoluta

    entre el nmero total de elementos del colectivo. Tambin se puede

    representar en porcentaje.

    Donde n es el total de elementos.

    As, si en un grupo de 30 empleados hay 6 que tienen una edad de 25 aos,

    entonces la frecuencia relativa ser:

    %20100*306

    ==ih

    Aqu la edad 25 aos tiene una frecuencia relativa de 20%; es decir, el 20%

    de los empleados tiene edad de 25 aos.

    Las frecuencias relativas para el grupo de expertos de la auditora de un

    proceso se presenta en la 8.

    Tabla 8. Frecuencias relativas para el tiempo que tarda (en minutos) un

    grupo de expertos en auditar un proceso

    Estadstica 64

    100*nfh ii =

  • N DE CLASE INTERVALO

    (Tiempo en minutos)

    FRECUENCIA

    RELATIVA (hI)1 44.5 - 49.5 (2/50)*100 = 4%2 49.5 - 54.5 (9/50)*100 = 18%3 54.5 - 59.5 (12/50)*100 = 24%4 59.5 - 64.5 (11/50)*100 = 22%5 64.5 - 69.5 (9/50)*100 = 18%6 69.5 - 74.5 (7/50)*100 = 14%

    TOTAL 100%Fuente: Datos hipotticos

    Obsrvese que la suma de las frecuencias relativas es igual al 100%.

    La frecuencia relativa se aplica a las variables cualitativa, cuantitativa

    discreta y continua.

    2.2.3. Frecuencia absoluta acumulada (FI)

    Se llama frecuencia absoluta acumulada (FI) de un valor xi de una variable X

    a la suma de las frecuencias absolutas hasta la correspondiente frecuencia fI

    del valor xi .

    Tabla 9. Frecuencias absolutas acumuladas para el tiempo que tarda

    (en minutos) un grupo de expertos en auditar un proceso

    INTERVALO

    (Tiempo en

    minutos)

    FRECUENCIA

    ABSOLUTA (fi)

    FRECUENCIA ABSOLUTA

    ACUMULADA (Fi)

    Estadstica 65

    =

    =

    i

    kki fF

    1

  • 44.5 - 49.5 2 249.5 - 54.5 9 2 + 9 = 1154.5 - 59.5 12 2 + 9 + 12 = 2359.5 - 64.5 11 2 + 9 + 12 + 11 = 3464.5 - 69.5 9 2 + 9 + 12 + 11 + 9 = 4369.5 - 74.5 7 2 + 9 + 12 + 11 + 9 + 7 = 50

    Fuente: Datos hipotticos

    2.2.4. Frecuencia relativa acumulada (Hi)

    Se llama frecuencia relativa acumulada (HI) de un valor xi de una variable X a

    la suma de las frecuencias relativas hasta la correspondiente frecuencia hI

    del valor xi .

    Tabla 10. Frecuencias relativas acumuladas para el tiempo que tarda (en

    minutos) un grupo de expertos en auditar un proceso

    INTERVALO

    (Tiempo en

    minutos)

    FRECUENCIA

    RELATIVA (hi)

    FRECUENCIA RELATIVA

    ACUMULADA (Hi)

    44.5 - 49.5 4% 4% 49.5 - 54.5 18% 4% + 18% = 22%54.5 - 59.5 24% 4% + 18% + 24% = 46%

    Estadstica 66

    =

    =

    i

    kki hH

    1

  • 59.5 - 64.5 22% 4% + 18% + 24% + 22% = 68%64.5 - 69.5 18% 4% + 18% + 24% + 22% + 18% = 86%69.5 - 74.5 14% 4% + 18% + 24% + 22% + 18% + 14% = 100%

    Fuente: Datos hipotticos

    Una vez construidos los intervalos y las frecuencias, se ilustra en una tabla el

    consolidado para facilitar la interpretacin y el anlisis de la variable (ver

    tabla 11).

    Tabla 11. Intervalos y frecuencias para el tiempo que tarda (en minutos)

    un grupo de expertos en auditar un proceso

    N DE

    CLASE

    TIEMPO EN

    MINUTOS.

    ix fi hi Fi Hi

    1 44.5 - 49.5 47 2 4% 2 4%2 49.5 - 54.5 52 9 18% 11 22%3 54.5 - 59.5 57 12 24% 23 46%4 59.5 - 64.5 62 11 22% 34 68%5 64.5 - 69.5 67 9 18% 43 86%6 69.5 - 74.5 72 7 14% 50 100%

    Fuente: Datos hipotticos

    Para analizar los resultados obtenidos en la tabla anterior, se deben tener en

    cuenta los siguientes aspectos:

    Las frecuencias absolutas y relativas se interpretan a partir de los

    intervalos.

    Por ejemplo: 2 expertos tardan entre 44.5 y 49.5 minutos en realizar la

    auditora del proceso o el 4% de los expertos tardan entre 44.5 y 49.5

    minutos en realizar la auditora del proceso; 9 expertos tardan entre 49.5

    y 54.5 minutos en realizar la auditora del proceso o el 18% de los

    Estadstica 67

  • expertos tardan entre 49.5 y 54.5 minutos en realizar la auditora del

    proceso, as sucesivamente.

    Las frecuencias absolutas acumuladas y relativas acumuladas se

    interpretan con la marca de clase del intervalo.

    Por ejemplo: 2 expertos tardan menos de 47 minutos en realizar la

    auditora del proceso o 4% de los expertos tardan menos de 47 minutos

    en realizar la auditora del proceso, 11 expertos tardan menos de 52

    minutos en realizar la auditora del proceso o 22% de los expertos tardan

    menos de 52 minutos en realizar la auditora del proceso, as

    sucesivamente.

    NOTA: las frecuencias acumuladas no se aplican a la variable cualitativa.

    2.2.5. Nmeros ndice

    Un nmero ndice es una medida estadstica diseada para resaltar cambios

    en una variable o un grupo de variables relacionadas con respecto al tiempo,

    situacin geogrfica, ingresos, o cualquier otra caracterstica.

    El nmero ndice es el cociente que resulta al dividir una determinada

    frecuencia de una serie por otra frecuencia de la misma serie, la cual se toma

    como base o punto de referencia; puede expresarse en porcentaje o en

    miles.

    Ejemplo: los precios de un artculo A durante los aos 2001 a 2005 fueron

    $40.000, $48.000, $56.000, $70.000, $84.000, respectivamente. Al tomar

    Estadstica 68

  • como base el ao 2001, que corresponde al 100%, se obtienen los ndices

    para cada ao.

    Tabla 12. ndices de precios del artculo a, de los aos 2001 a 2005

    AO PRECIO ($) NDICE2001 40.000 (40.000/40.000)*100 = 100%2002 48.000 (48.000/40.000)*100 = 120%2003 56.000 (56.000/40.000)*100 = 140%2004 70.000 (70.000/40.000)*100 = 175%2005 84.000 (84.000/40.000)*100 = 210%

    Fuente: Datos hipotticos

    Esto indica que el precio del artculo A se increment 20% en el ao 2002

    con respecto al ao 2001; 40% en el ao 2003 con respecto al ao 2001;

    75% en el ao 2004 con respecto al ao 2001; y 110% en el ao 2005 con

    respecto al ao 2001.

    2.3. GRFICAS O DIAGRAMAS

    Las grficas permiten describir brevemente las caractersticas de un

    colectivo. Existen varios tipos de grficas que pueden utilizarse para

    representar el comportamiento de una variable, tales como histogramas,

    polgonos de frecuencia, ojivas, diagramas circulares y barras.

    2.3.1. Histogramas

    Estadstica 69

  • Un histograma de frecuencias consiste en una serie de rectngulos que se

    construyen sobre un plano cartesiano. Este tipo de grfica se aplica a la

    variable cuantitativa continua.

    Sobre el plano cartesiano, en el eje horizontalm, se ubican los intervalos de

    cada clase, y en el eje vertical las frecuencias. Luego, para cada intervalo se

    dibuja un rectngulo cuya base es la amplitud del intervalo de cada clase, y

    la altura es la frecuencia de cada clase.

    Si sobre el eje vertical se ubican las frecuencias absolutas, se obtiene el

    histograma de frecuencias absolutas, y si se ubican las frecuencias relativas,

    se obtiene el histograma de frecuencias relativas, como se ilustra en las

    grficas 1 y 2 para un grupo de expertos que auditan un proceso.

    Grfica 1. Histograma de frecuencias absolutas para un grupo de

    expertos que auditan un proceso

    Estadstica 70

  • Grfica 2. Histograma de frecuencias relativas para un grupo de

    expertos que auditan un proceso

    2.3.2. Polgono de frecuencias

    El polgono de frecuencias se construye de forma similar al histograma; la

    diferencia radica en la forma y estructura de la grfica, la cual se obtiene

    ubicando las marcas de clase sobre el eje horizontal; y sobre el eje vertical,

    las frecuencias, segn el tipo de polgono; si se ubican las frecuencias

    absolutas, se denomina polgono de frecuencias absolutas; y si se ubican las

    frecuencias relativas, se denomina polgono de frecuencias relativas, como

    se ilustra en las grficas 3 y 4 para un grupo de expertos que auditan un

    proceso.

    Estadstica 71

  • Grfica 3. Polgono de frecuencias absolutas para un grupo de

    expertos que auditan un proceso

    Grfica 4. Polgono de frecuencias relativas para un grupo de expertos

    que auditan un proceso

    Estadstica 72

  • Se acostumbra prolongar el polgono hasta las marcas de clase inferior y

    superior inmediatas, que corresponderan a las clases de frecuencia cero.

    Los polgonos de frecuencia pueden tomar muchas formas, sin embargo, en

    la mayora de los casos toman una forma acampanada que se identifica con

    la curva normal.

    2.3.3. Ojivas o polgonos de frecuencias acumuladas

    La construccin de estos polgonos es similar a los polgonos de frecuencias

    absolutas y relativas; la diferencia radica en que aqu se toman las

    frecuencias acumuladas, como se puede observar en las grficas 5 y 6,

    donde se presentan los polgonos de frecuencias absolutas y relativas

    acumuladas para el grupo de expertos que auditan un proceso.

    Grfica 5. Polgono de frecuencias absolutas acumuladas para un grupo

    de expertos que auditan un proceso

    Estadstica 73

  • Grfica 6. Polgono de frecuencias relativas acumuladas para un grupo

    de expertos que auditan un proceso

    2.3.4. Diagramas de barras

    Los diagramas de barras son muy utilizados por la facilidad y sencillez que

    ofrecen para presentar caractersticas de una poblacin, especialmente de

    variables cualitativas o cuantitativas discretas.

    Los diagramas de barras consisten en rectngulos de anchura arbitraria en la

    cual se ubican los valores de la variable, y de longitud proporcional al nmero

    de observaciones o frecuencias. Las barras se pueden construir de forma

    horizontal o vertical, como se muestra en la grfica 7, correspondiente a los

    datos del cuadro 2.

    Estadstica 74

  • Grfica 7. Nmero de hijos de los asociados de la Cooperativa de

    Trabajo Asociado Epsilon

    2.3.5. Diagramas circulares

    Estas grficas consisten en un crculo dividido en partes proporcionales a los

    porcentajes de cada una de las caractersticas o valores de la variable. Se

    utilizan principalmente en la representacin de variables cualitativas.

    Para su construccin, se dividen los 360 de la circunferencia

    proporcionalmente a los porcentajes o a las frecuencias absolutas de cada

    caracterstica.

    En la grfica 8 se ilustra el nivel de escolaridad de los asociados de la

    Cooperativa de Trabajo Asociado Epsiln. En ella, 360 corresponde al

    Estadstica 75

  • 100% de los asociados; con nivel profesional corresponde 36; nivel tcnico

    corresponde 108; nivel de bachillerato, 144; y con bsica primaria, 72.

    Grfica 8. Nivel de escolaridad de los asociados de la Cooperativa de

    Trabajo Asociado Epsilon

    2.3.6. Diagrama de tallo y hojas

    El diagrama de tallo y hoja es una herramienta valiosa y verstil para

    organizar un conjunto de datos y entender la distribucin y agrupacin de los

    valores dentro del intervalo de observaciones en el conjunto. Un diagrama

    de tallo y hoja separa los datos en dgitos gua, o tallos, y dgitos que le

    siguen, u hojas. Para construir el diagrama, primero se ordenan los dgitos

    principales de cada dato a la izquierda de una lnea vertical. A la derecha de

    sta se registra el ltimo dgito para cada dato conforme al orden de

    aparicin de las observaciones. El ltimo dgito de cada dato se coloca en la

    fila que corresponde a su primer dgito.

    Para ilustrar el uso del diagrama de tallo y hojas se consideran los siguientes

    datos de la tabla 13. La informacin es resultado de un examen de aptitudes Estadstica 76

  • de 150 preguntas, aplicado a 50 personas durante un proceso de seleccin

    de personal en Manufacturas Alfa.

    Tabla 13. Nmero de preguntas contestadas en forma correcta en una

    prueba de aptitud

    112 84 108 76 115 102 124 119 7 11573 68 76 118 94 80 83 95 95 85126 100 141 132 97 98 92 104 134 10782 72 119 96 86 106 81 69 128 10092 92 98 91 127 106 106 113 81 75Fuente: Datos hipotticos

    Inicialmente, se deben ubicar los datos en tallo y hojas, as:

    6 9 8

    7 2 3 6 3 6 5

    8 6 2 3 1 1 0 4 5

    9 7 2 2 6 2 1 5 8 8 5 4

    10 7 4 8 0 2 6 6 0 6

    11 2 8 5 9 3 5 9

    12 6 8 7 4

    13 2 4

    14 1

    Posteriormente, se ordena cada lnea en forma ascendente, y una vez

    ordenado, queda el diagrama de tallo y hojas como sigue:

    Estadstica 77

  • 6 8 9

    7 2 3 3 5 6 6

    8 0 1 1 2 3 4 5 6

    9 1 2 2 2 4 5 5 6 7 8 8

    10 0 0 2 4 6 6 6 7 8

    11 2 3 5 5 8 9