ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

44
ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia

Transcript of ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

Page 1: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

ESTADÍSTICA BÁSICA II

PROFESORFRANCISCO JAVIER RODRÍGUEZ

MatemáticoUniversidad de Antioquia

Page 2: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

¿Qué es la estadística?

Métodos y procedimientos destinados a recoger, clasificar, resumir, hallar regularidades, analizar los datos y realizar inferencias con el fin de ayudar a la toma de decisiones y en su caso formular predicciones.

Page 3: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

CLASIFICACIÓN

ESTADÍSTICA INFERENCIAL

ESTADÍSTICA DESCRIPTIVA

A partir del cálculo de probabilidades y datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.

Page 4: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

DEFINICIONES Y CONCEPTOS BÁSICOS

• Individuos o elementos: Personas u objetos que contienen cierta información que se desea estudiar.

• Población: Conjunto de individuos o elementos que cumplen ciertas propiedades comunes.

• Muestra: Subconjunto representativo de una población.

• Muestreo: Métodos para la recolección de la muestra.

• Datos: Conjunto de valores de una variable para cada uno de los elementos de la muestra.

Page 5: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

• Variable: Característica que toma diferentes valores en diferentes personas, lugares o cosas.

OrdinalesVariables cualitativas

Nominales

DiscretasVariables cuantitativas

  Continuas

• Parámetro: Medición numérica que describe algunas características de una población.

• Estadístico: Medición numérica que describe algunas características de la muestra.

DEFINICIONES Y CONCEPTOS BÁSICOS

Page 6: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

¿Qué incluye un problema estadístico?

• Definición clara del objetivo del experimento y de la población pertinente.

• Diseño del experimento o procedimiento del muestreo.

• Recolección y análisis de los datos.

• El procedimiento para hacer inferencias acerca de la población, basado en la información muestral.

• La provisión de una medida de bondad (confiabilidad) para la inferencia.

Page 7: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

ESTADÍSTICA DESCRIPTIVA

Page 8: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

ESTADÍSTICA DESCRIPTIVA

DATOS CUALITATIVOS

Nominal

Gráficos

Diagramas de Barras

Diagramas de Sectores

Ordinal

Contingencia

Tablas

Frecuencia

Se miden en escala

Se representan en

Page 9: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

DATOS CUANTITATIVOS

Discretos Continuos

Se dividen en

Se miden en escalas

IntervalosRazón

Se representan en

Se resumen en medidas de

ESTADÍSTICA DESCRIPTIVA

Moda

Mediana

Media

Diagramas de Dispersión

Boxplot

Histogramas

Frecuencia no Agrupada

Frecuencia Agrupada

VariabilidadCentralidadTablasGráficos

Coeficiente de Variación

Rango

Varianza

Page 10: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

REGRESIÓN LINEAL SIMPLERelaciones entre variables estadísticasCon frecuencia encontramos variables estadísticas que presentan algún tipo de asociación o dependencia unas de otras.

Ejemplos:

• El consumo de cigarrillo con el cáncer pulmonar.

• El aumento de peso de un animal con la ración diaria de alimentos.

• El consumo de una droga con la publicidad que se le hace.

• El entrenamiento en la realización de una actividad con el tiempo gastado en realizarla.

En los ejemplos anteriores podemos ver que las variables tienen algún grado de correlación

Page 11: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

si al aumentar o disminuir una deCorrelación Positiva ellas, la otra varía en la misma

forma.

Correlación Negativa cuando varían en sentido inverso.

REGRESIÓN LINEAL SIMPLE

Si no existe ninguna relación o dependencia entre las variables se dice que ellas están incorrelacionadas.

Page 12: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

REGRESIÓN LINEAL SIMPLEObservación: La dependencia estadística no implica relación causa-efecto.

Ejemplos:

• La dependencia estadística no permite concluir que el consumo de cigarrillo es causa de cáncer pulmonar.

• El consumo de licor y el número de automóviles de un país presentan una correlación positiva muy alta. No por ello podemos concluir que el poseer automóvil hace que las personas se vuelvan bebedoras. La alta correlación se debe a que ambas variables crecen al aumentar el número de habitantes del país.

Page 13: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

REGRESIÓN LINEAL SIMPLE

…Consideraciones Importantes

Vamos a considerar una relación funcional entre las variables X y Y

Suponiendo que X toma valores asignados o controlados por el investigador y Y depende de X a través de la relación

Y= f(X)

Decimos que X es la variable independiente y Y la variable dependiente.

Page 14: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

Ejemplo:

Se desea conocer la relación entre la presión arterial y la edad en personas adultas.

EDAD (Años)X

PRESIÓN (mmHg)

Y

19 122

25 125

30 126

42 129

46 130

49 132

52 135

57 138

62 142

70 145

Se han obtenido los siguientes datos de 10 hombres a los cuales se les pregunto su edad y se les midió su presión sistólica.

Page 15: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

los valores de Y aumentan a medida que aumenta la edad y los diferentes puntos tienden a colocarse en una línea recta. Esta información nos permite pensar que las dos variables están relacionadas linealmente.

DIAGRAMA DE DISPERSIÓN

Page 16: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

Si la relación entre X y Y es aproximadamente de la forma entonces se trata de una regresión

lineal. (Nos interesa )

Debemos asumir que la relación entre X y Y no es una relación lineal perfecta ya que Y es una variable aleatoria cuyos

valores exactos son impredecibles.

Para una persona dada, el valor de Y puede expresarse como:

En donde α y β son parámetros desconocidos y εi es el error que cometemos al querer expresar el valor de Y mediante una

relación lineal con X.

Page 17: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

ESTIMACIÓN DE LA RECTA DE REGRESIÓN

La recta de regresión estimada es obtenida por el método de los mínimos cuadrados y está dada por:

Donde:

Page 18: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

GRÁFICO DE REGRESIÓN AJUSTADA

Y= 112.26 + 0.446X

Page 19: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

A) Error de Estimación Mediante la Recta Ajustada

Ejemplo:El sujeto número 5 que tiene una de edad de 46 años. Su presión sistólica fue de 130 mmHg. Supongamos ahora que no se le midió la presión queremos estimarla mediante la ecuación de regresión. Entonces su presión será:

Y5= 112.26 + 0.446X5

Y5 = 112.26 + (0.446) (46)Y5 =  132.8 mmHg

Error:130mmHg – 132.8 mmHg= - 2.8 mmHg

Page 20: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

B) Predicciones a Partir de la RectaMediante la ecuación de regresión podemos predecir o

pronosticar valores de la variable Y.

Ejemplo:Si se sabe que la edad de un sujeto es 50 años, su presión sistólica puede pronosticarse mediante la recta de regresión ajustada como:

Y= 112.26 + (0.446) (50) Y= 134.5 mmHg.

Observación:

La interpretación o cualquier otra inferencia basada en la regresión, es válida fundamentalmente dentro del rango de variación de X.

Para nuestro ejemplo la variación de Y puede ser válida sólo para edades entre 19 y 70 años.

Page 21: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

C) Interpretación de la Pendiente

El coeficiente de regresión β, representa la pendiente de la recta. Este coeficiente indica la cantidad de variación

(creciente o decreciente) de la variable Y por unidad de cambio de la variable X.

Para nuestro ejemplo, la pendiente es 0.446, lo que indica que la presión sistólica aumenta 0.446 mmHg por cada

año.

Page 22: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

D) Coeficiente de Correlación de Pearson (Muestral) “r”

Es un índice estadístico que mide la relación lineal entre dos variables cuantitativas y esta dado por

Para nuestro ejemplo,

r = 0.97

Page 23: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

…Propiedades del Coeficiente de Correlación de Pearson:

 1. El valor de r es independiente de las unidades en que X y Y se

midan.

2. Valores de r cercanos a 1 indican que la relación de X y Y es lineal y que están relacionadas directamente.

3. Valores de r cercanos a -1 indican que la relación de X y Y es lineal y que la relación es inversa.

4. Si r es cercano a cero no existe relación lineal. Pero esto no implica una independencia total entre las dos variables, es decir, puede existir relaciones no lineales entre las dos variables.

Page 24: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

E) Coeficiente de Determinación

Es el cuadrado del coeficiente de correlación

Este coeficiente nos indica la proporción de la variación de Y que es explicada o que puede atribuirse a su relación lineal con X.

Para nuestro ejemplo, el coeficiente de determinación es indicándonos que:

• Un 94% de la variación de la presión sistólica se debe a su relación con la edad o,

• Que la edad explica el 94% de la variación de la presión sistólica en sujetos varones con edades entre los 19 y 70 años.

Page 25: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

INFERENCIA ESTADÍSTICA

Page 26: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

INFERENCIA ESTADÍSTICA• Las poblaciones se caracterizan mediante medidas descriptivas numéricas llamadas parámetros.

• La inferencia estadística tiene como objetivo el hacer inferencias acerca de los parámetros de una población.

• Parámetros típicos de una población: media, varianza, proporción, etc.

• La inferencia estadística es un proceso que permite emitir juicios probabilísticos sobre una población cuando solo disponemos de la información parcial contenida en una muestra.

Page 27: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

¿Qué tamaño debe tener la muestra y cómo debe ser seleccionada para que la

información extraída de ella sea representativa de la población

objeto de estudio?

MUESTREO

Page 28: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

• Población pequeña Censo

• Población grande Muestreo

Sin reposiciónTIPOS DE MUESTREO

Con reposición

Muestreo Aleatorio SimpleALGUNOS MÉTODOS DE MUESTREO Muestreo Estratificado

Muestreo por Conglomerados

GENERALIDADES DEL MUESTREO

Page 29: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

MUESTREO CON REPOSICIÓN MUESTREO SIN REPOSICIÓN

Las unidades se seleccionan sólo una vez

Las unidades se seleccionan por lo menos

una vez

En una encuesta electoral, poco antes de una

elección de voto de las personas entrevistadas,

éstas deben ser escuchadas apenas una sola vez, pues, en una

elección, el voto es individual.

Cuando se desea saber cuánto tiempo gasta una persona haciendo cola en un banco, ésta puede ser

observada una o más veces, cada vez que

vuelve al banco.

TIPOS DE MUESTREO

Page 30: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

MUESTREO ALEATORIO SIMPLE

• La forma más común de obtener una muestra es la selección al azar, es decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido.

• Tiene poca o nula utilidad práctica cuando la población es muy grande.

Page 31: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

MUESTREO ALEATORIO SIMPLE

Ejemplo:

Supongamos que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de estadística de 20 alumnos.

1. Escribir los 20 nombres en pedazos separados de papel, colocarlos en un recipiente, revolverlos y luego extraer cinco papeles al mismo tiempo.

2. Listar los estudiantes y utilizar una tabla de números aleatorios, para escoger los 5 alumnos de acuerdo al orden de lista.

3. Excel tiene una opción para extraer una muestra aleatoria de una lista.

Page 32: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

MUESTREO ESTRATIFICADO Se utiliza cuando la población consiste de grupos heterogéneos.

Se forman grupos disjuntos, llamados estratos, con los elementos más parecidos entre sí, y dentro de cada estrato se hace una selección aleatoria simple.

Se llama afijación a la manera como se puede repartir la muestra en los diferentes estratos.

• Afijación Uniforme La muestra se reparte por igual en cada uno de los estratos.

• Afijación Proporcional La muestra se reparte proporcional al tamaño de cada estrato

Page 33: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

MUESTREO ESTRATIFICADO

Ejemplo:En un estudio sobre salarios en una empresa, se tuvieron en cuenta tres estratos: directivas, empleados y obreros.

Suponiendo que la empresa cuenta con 25 directivas, 130 empleados y 913 obreros, y el tamaño de la muestra que vamos a seleccionar es n = 120. Si la afijación es proporcional debemos repartir la muestra de la siguiente manera:

Las 3 directivas, los 15 empleados y los 102 obreros los seleccionamos utilizando el muestreo aleatorio simple.

Page 34: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

MUESTREO POR CONGLOMERADOS Se obtiene seleccionando aleatoriamente un conjunto de m colecciones de elementos muestrales, llamados conglomerados de la población y posteriormente, llevando a cabo un censo completo en cada uno de los conglomerados.

El muestreo por conglomerados proporciona una cantidad específica de información a un costo mínimo cuando:

• No existe una lista de todos los elementos de la población o sería muy costoso obtenerla.

• La población es grande y está dispersa en una región muy extensa.

Page 35: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

MUESTREO POR CONGLOMERADOS

Ejemplo:

supongamos que un economista desea estimar la cantidad promedio empleada en comida por vivienda en cierto barrio de la ciudad. Como es un barrio grande y no se cuenta con los recursos suficientes para hacer la encuesta en todo el barrio, el economista divide el barrio por manzanas (conglomerados) y extrae una muestra aleatoria de las mismas.Posteriormente procede a hacer la encuesta en cada una de las viviendas de las manzanas seleccionadas.

Page 36: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

Diferencias entre el Muestreo Estratificado y el Muestro por

Conglomerados• En el de conglomerados sólo se elige una muestra de subpoblaciones, en el estratificado todas las subpoblaciones (estratos) se seleccionan para muestreo posterior.

• En relación a la homogeneidad y la heterogeneidad, el criterio para formar conglomerados es el opuesto al de formar estratos. Los elementos dentro de un conglomerado deben ser tan heterogéneos como sea posible, pero los conglomerados mismos deben ser tan homogéneos como sea posible.

• Cada conglomerado debe ser una representación en pequeña escala de la población.

Page 37: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

ERROR DE ESTIMACIÓNCuando la muestra se obtiene por métodos probabilísticos es posible hacer inferencias acerca de ciertas características numéricas de la población con base en las características numéricas de la muestra.

MUESTRA POBLACIÓN

La media, la proporción y la varianza muestral, son respectivamente estimadores de la media, la proporción y la varianza poblacional

Page 38: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

ERROR DE ESTIMACIÓNEjemplo:

Supongamos que queremos estimar la edad promedio de los estudiantes de un colegio nocturno de 635 estudiantes y que para ello escogimos aleatoriamente 84 estudiantes. Si años, entonces podemos estimar en 21.7 años la edad promedio de los estudiantes del colegio nocturno.

¿Qué tan precisas son estas estimaciones?

En general, si queremos estimar el parámetro θ por medio del estimador , el error de estimación estará dado por

Un estimador es más preciso entre menor sea su error de estimación.

Page 39: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

A) Error de Estimación para la Media

Para un error aleatorio simple sin remplazo está dado por:

En esta fórmula aparece la varianza poblacional que generalmente es desconocida. Esta varianza se estima

usualmente con la varianza muestral , de modo que una estimación del error de muestreo para la media sería:

Page 40: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

A) Error de Estimación para la Media

Se puede mostrar que si la población es normal o aproximadamente normal el 95% de las estimaciones del parámetro µ caen el intervalo .

Diremos entonces que el intervalo es un intervalo de confianza del 95% para estimar a µ.

Page 41: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

A) Error de Estimación para la Media

Ejemplo: El gobierno de cierta localidad desea estimar el consumo promedio de agua por vivienda con el fin de racionalizar dicho recurso.

Selecciona al azar y sin reemplazo n = 180 viviendas y observa el medidor de agua durante un día. Se obtiene de esta muestra un consumo promedio 19.6 galones con una desviación estándar de 2.4 galones. El último censo en dicha localidad reportó 2350 viviendas.

Esto significa que podemos estimar un consumo promedio de agua por

vivienda entre 19.26 y 19.94 galones con una confiabilidad ≈ 95%.

Page 42: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

TAMAÑO DE LA MUESTRALlamemos B el error máximo que podemos admitir al estimar la media µ tomando una muestra de tamaño n. El error máximo se encuentra en los extremos del intervalo en otras palabras, con una probabilidad de 0.95 si la población tiene una distribución normal o aproximadamente normal.

Despejamos n

En la práctica, generalmente se desconoce . A veces es posible conocer la varianza mediante alguna investigación anterior o estimarla mediante una muestra piloto.

En este caso, reemplazamos por .

Page 43: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

TAMAÑO DE LA MUESTRA

Ejemplo: Un investigador está interesado en estimar el peso promedio ganado por pollo entre 0 y 4 semanas, alimentados con una ración nueva. Se tienen 1000 pollos y se desea establecer el tamaño de la muestra para estimar µ con un error no mayor que 1 gramo.

Usando estudios similares sobre nutrición de pollos, el investigador encontró que era aproximadamente 36.

Según la fórmula el número de pollos que debe pesar es 126

Page 44: ESTADÍSTICA BÁSICA II PROFESOR FRANCISCO JAVIER RODRÍGUEZ Matemático Universidad de Antioquia.

GRACIAS