Estadística Descriptiva: 1. Muestreo y Presentación de los Datos.

Post on 21-Jan-2016

50 views 0 download

description

Estadística Descriptiva: 1. Muestreo y Presentación de los Datos. Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María. Estadística: Dos conceptos fundamentales: muestra y población. Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones - PowerPoint PPT Presentation

Transcript of Estadística Descriptiva: 1. Muestreo y Presentación de los Datos.

Estadística Descriptiva:1. Muestreo y Presentación de los Datos.

Ricardo Ñanculef AlegríaUniversidad Técnica Federico Santa María

Estadística: Dos conceptos fundamentales: muestra y población

• Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones• Muestra: subconjunto de la población que se extrae para ser estudiado

Estadística: ¿Porqué una muestra? • Imposibilidad o costo excesivo de realizar un censo en que se mide toda la población

Estadística: Herramientas con dos Objetivos Básicos • Describir la muestra: Estadística Descriptiva:• Obtener conclusiones de la población a partir de la muestra: Inferencia Estadística.

Qué es la Estadística? Dos conceptos fundamentales: muestra y población• Marco Muestral: conjunto de elementos de la población suceptible de ser muestreada. Ejemplo: Domingo 24 Agosto en La Tercera

Qué es la Estadística? Dos conceptos fundamentales: muestra y población

¿Porqué candidato votaría usted?

Qué es la Estadística? Dos conceptos fundamentales: muestra y población

Si la elección tuviera que definir entre ellos dos¿Por cuál votaría usted?

Qué es la Estadística? Dos conceptos fundamentales: muestra y población

• Población Objetivo?• Marco Muestral?• Muestra?

Técnicas de Muestreo¿Cómo recolectar los datos?

• Muestreo No-Aleatorizado (o No-Probabilista)• Se basa en el juicio personal del investigador.• Puede generar buenas muestras pero no permite una evaluación estadística de confianza.

• Muestreo Aleatorizado (o Probabilista)• Se controla la probabilidad de seleccionar un determinado individuo del marco muestral.• Permite estudiar objetivamente la confianza de las generalizaciones hacia la población objetivo.

Técnicas de Muestreo¿Cómo recolectar los datos?

• Muestreo Aleatorizado o Probabilista: • Muestreo aleatorio simple• Muestreo sistemático • Muestreo estratificado• Muestreo clusterizado

• Muestreo no-Aleatorizado o no-Probabilista• Muestreo por convenciencia • Muestreo por juicio• Muestreo por cuota• Muestreo tipo “bola de nieve” (snowball)

Técnicas de MuestreoMuestreo por Conveniencia

• Los elementos de la muestra se eligen por estar en el lugar o en el momento adecuado para la investigación.• El criterio de selección (lugar, tiempo y demases) es completamente dependiente del investigador, sin reglas predeterminadas.

Técnicas de MuestreoMuestreo por Conveniencia

• Ejemplos: encuestas en la calle, encuestas a estudiantes, encuestas web

Técnicas de MuestreoMuestreo por Juicio• Un tipo de muestreo por conveniencia• Se selecciona de acuerdo a alguna característica especifica del encuestado juzgada por el encuestador

• Clientes/Consumidores de un cierto tipo• Expertos en un tema o aspecto de la organización • Personajes “líderes de opinión”

Técnicas de MuestreoMuestreo por Juicio

Técnicas de MuestreoMuestreo por Cuota• Intenta mejorar la representatividad de la muestra separando a la población de acuerdo a variables de control: edad, sexo, raza, nivel socio-económico• A casa subgrupo o estrato se le asigna una cuota o proporción de muestreo, típicamente % de la población• Otros criterios: varianza. • Dentro del grupo se muestrea por conveniencia

Técnicas de MuestreoMuestreo tipo bola de nieve• Se selecciona un grupo inicial (usualmente de forma probabilista aunque el resultado final no lo sea)• Los nuevos encuestados se seleccionan en base a las referencias de los encuestados anteriores, explotando sus “redes sociales”• Muy utilizado en ciencias sociales, cuando la característica a estudiar es rara o escasa y cuando es difícil conseguir encuestados.

Técnicas de MuestreoMuestreo tipo bola de nieve (ejemplo)

Técnicas de MuestreoMuestreo Aleatorio Simple• Cada elemento del marco muestral tiene la misma probabilidad de ser seleccionado y cada elemento se selecciona de manera independiente de los otros

• con reemplazo: se pueden repetir elementos• sin reemplazo: no se pueden repetir elementos

• Procedimiento: se indexa a la población y luego se elige un índice de manera aleatoria hasta completar el tamaño deseado de la muestra.

Técnicas de MuestreoMuestreo Aleatorio Simple• Para muchos estudios se siguen utilizando tablas de números aleatorios aunque existen muchos algoritmos generadores de los mismos. • ¿cómo usar una tabla de números aleatorios?

Técnicas de MuestreoMuestreo Aleatorio Simple

Técnicas de MuestreoMuestreo Aleatorio Sistemático

• Se elige un elemento de partida aleatoriamente y el resto se elige en sucesión hasta completar la muestra• Regla de sucesión: Si n es el tamaño de la muestra y N el de la población muestral se determina s = floor(N/n)

• El genera un número aleatorio x. El k-ésimo seleccionado es (x+k·s) mod N

• Se elige el x-ésimo• Luego el (x+s)-ésimo• Luego el (x+2s)-ésimo• etc

Técnicas de MuestreoMuestreo Aleatorio Sistemático

• ¿Tiene cada elemento la misma probabilidad de ser seleccionado? ¿tiene cada subconjunto la misma probabilidad de ser seleccionado?• Importante: el registro de donde se selecciona no debe presentar sesgo periódico, sino se reduce la representatividad de la muestra. • Si el registro está ordenado de acuerdo a lo que se estudia se puede aumentar la representatividad.• Se puede prescindir de identificar exactamente el tamaño del marco muestral

Técnicas de MuestreoMuestreo Aleatorio Estratificado

• Antes de seleccionar los elementos, se agrupa la población muestral en estratos de acuerdo a una variable importante: edad, sexo, • Objetivo: reducir la variabilidad que se puede observar dentro de cada estrato• Dentro de cada estrato se puede proceder con muestreo simple o sistemático• El número de elementos a elegir puede ser proporcional al tamaño o inversamente proporcional a la variabilidad del estrato

Técnicas de MuestreoMuestreo Aleatorio ór Grupos

• Se divide a la población en grupos lo más homogéneos entre ellos y lo más heterogéneos internamente• Se seleccionan aleatoriamente los grupos a encuestar ya sea de manera simple o sistemática• Cada grupo seleccionado se muestrea completamente: se toman todos sus elementos. • En ocasiones sólo se conocen los grupos y no los elementos que componen cada grupo.

Técnicas de MuestreoMuestreo Aleatorio por Grupos

• Ejemplo: Encuesta a los espectadores de una película: se muestrean los horarios a encuestar.

En el muestreo aleatorizado se elige controlando la probabilidad de selección de los elementos. Mejorable segmentando.

En el muestreo no aleatorizado se elige de acuerdo al criterio del investigador: por conveniencia o juicio.Mejorable segmentando.

Técnicas de Muestreo

Técnica Fortalezas Debilidades

Muestreo NO

probabilístico

Muestreo por conveniencia

Menos costoso, toma menos tiempo, más conveniente.

Tendencias en la selección, muestra no representativa, *no se recomienda para la investigación descriptiva o causal.

Muestreo por juicio

Costo bajo, conveniente, no toma mucho tiempo.Puede a aumentar la representatividad del muestreo por conveniencia

No permite la generalización, es subjetivo.Puede generar una muestra para avalar pre-juicios del investigador.

Muestreo por cuota

La muestra puede controlarse para ciertas características.

Tendencias en la selección, no asegura la representatividad.

Muestreo de bola de nieve

Puede estimar características poco comunes.

Toma mucho tiempo.

Técnicas de Muestreo

Técnica Fortalezas Debilidades

Muestreo probabilístico

Muestreo aleatorio

simple

Se entiende con facilidad, resultados proyectables.

Es difícil construir el marco de la muestra, costoso, menor precisión, no asegura la representatividad.

Muestreo sistemático

Puede aumentar la representatividad, más fácil de poner en práctica que el MAS, no es necesario el marco exacto de la muestra.

Puede reducir la representatividad.

Muestreo estratificado

Incluye todas las sub-poblaciones importantes, precisión.

Es difícil seleccionar las variables de estratificación relevantes, no es factible estratificar conforme a muchas variables, costoso.

Muestreo de grupo

Fácil de poner en práctica, costo efectivo.

Inexacto, es difícil calcular e interpretar los resultados.

Técnicas de MuestreoTamaño de la Muestra (n)

• Problema duro de la Estadística Inferencial• Criterios Generales

• Qué se va a medir• Qué se quiere determinar• Nivel máximo de error admisible• Nivel de confianza con qué se quiere obtener la estimación del tamaño muestral• Variabilidad de las características a medir

Estadística Descriptiva¿Cómo organizar y presentar los datos?

Estadística DescriptivaExperimento, Medición y Tipos de Datos

• El muestreo se realiza con el objetivo de llevar a cabo un experimento: observación, medición o registro de características o atributos de la población de las cuáles se tiene incertidumbre.

• Lo último es lo que define un experimento• Se conocen los posibles valores, pero• No se sabe a-priori cuáles van a ser los resultados• Es repetible bajo condiciones esencialmente equivalentes

Estadística DescriptivaExperimento, Medición y Tipos de Datos

• Producto del muestreo y la medición obtenemos datos • Para propósitos estadísticos es útil distinguir entre los siguientes tipos de datos:

• Numéricos o Cuantitativos• Cualitativos• Estructurados: formados por conjuntos de los anteriores, pero correspondientes a una misma medición (ejemplo: grafos, matrices)

Estadística DescriptivaExperimento, Medición y Tipos de Datos

• Numéricos o Cuantitativos: operables aritméticamente• Escala Intervalar: Tienen sentido las diferencias.• Escala de Razón: Tienen sentido los cuocientes.• Discretos/Continuos.

• Cualitativos:• Categóricos: Son sólo nombres de referencia.• Ordinales: Se pueden jerarquizar u ordenar.

Estadística DescriptivaExperimento, Medición y Tipos de Datos

• Ejercicio: Deseamos estudiar los hábitos de estudio de un conjunto de sansanos y su impacto sobre el rendimiento académico

• Sugiera variables a medir en cada una de las categorías definidas anteriormente

Estadística DescriptivaConcepto Fundamental: Frecuencia

• La frecuencia de un suceso en la muestra es el número de veces que éste se repite en la muestra (valor de una característica o de un subconjunto de valores).

• Llamaremos frecuencia relativa a la fracción de veces que éste aparece en la muestra.

• Si la frecuencia del suceso es k y la muestra es de tamaño n llamaremos: k/n

Estadística DescriptivaPresentación de los Datos

• Datos Categóricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles

• Diagramas de sectores (“de torta”)• Diagramas de barras

Estadística DescriptivaPresentación de los Datos

• Datos Categóricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles

• Diagramas de Pareto: diagrama de barras ordenado descendentemente por frecuencia. Se suele incluir la frecuencia acumulada hasta cada elemento.

Estadística DescriptivaPresentación de los Datos

Estadística DescriptivaPresentación de los Datos

• Datos Ordinales: Los diagramas de barras se suelen ordenar de acuerdo a la jerarquía natural de los valores posibles. Ejemplo: estratos económicos:

Estadística DescriptivaPresentación de los Datos

• Datos Cualitativos: Cuando son muchos es posible agruparlos en subconjuntos, pero generados en gral. por criterios no-estadísticos.

Estadística DescriptivaPresentación de los Datos

• Datos Cuantitativos: En universo de posibles valores es infinito o muy grande. En la muestra puede no repetirse ningún valor. ¿Cómo presentarlos?

Estadística DescriptivaPresentación de los Datos

• Datos Cuantitativos. Tabligrama: El último dígito se expresa separado de los más significativos. • Consideremos los siguientes datos

Estadística DescriptivaPresentación de los Datos

• Datos Cuantitativos: Tabligrama

15 455677888888 16 000000122333345556677799 17 001233344456788 18 05

Estadística DescriptivaPresentación de los Datos

• Datos Cuantitativos. Tablas de frecuencias: Agrupar los valores en intervalos y registrar la frecuencia (relativa o absoluta) de ese grupo de valores en la muestra

Estadística DescriptivaPresentación de los Datos

•Tablas de frecuencias. ¿Cuántos intervalos K considerar? ¿Cómo deben estar estos distribuidos?• Histograma: Los intervalos son todos del mismo tamaño y cubren uniformemente el rango de los datos.

• Rango = máximo – mínimo• Amplitud de cada clase: A = (Rango+1)/K• 1er Intervalo: [a1,b1]=[(min – 0.5), (min – 0.5)+A]• 2do Intervalo: [a2,b2]=[b1, b1 + A]• …• k-ésimo: [ak,bk]=[bk-1, bk-1 + A]

Estadística DescriptivaPresentación de los Datos

K := N° Clases R := Rango = máx { xi } - mín { xi } = 162 - 107 = 55A := Amplitud = ( R + 1 ) / K = ( 55 + 1 ) / 7 = 8

Límites

106,5-114,5114,5-122,5122,5-130,5130,5-138,5138,5-146,5146,5-154,5154,5-162,5

Marca

110,5118,5126,5134,5142,5150,5158,5

FrecuenciasABS - REL - REL. AC. 5 0,125 0,125 3 0,075 0,2 5 0,125 0,325 8 0,2 0,525 6 0,15 0,675 7 0,175 0,85 6 0,15 1

Estadística DescriptivaPresentación de los Datos

0

1

2

3

4

5

6

7

8

9

110,5 118,5 126,5 134,5 142,5 150,5 158,5

Histograma

Estadística DescriptivaPresentación de los Datos

0

1

2

3

4

5

6

7

8

9

110.5 118,5 126,5 134,5 142,5 150,5 158,5102,5 166,5

Polígono de Frecuencias

Estadística DescriptivaPresentación de los Datos

110,5 118,5 126,5 134,5 142,5 150,5 158,5102,5 166,5

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

OJIVA