Introduccion a La Estadistica Descriptiva

71
Prof. Ximena N. Villarreal

description

introduciion estadistica descrptiva

Transcript of Introduccion a La Estadistica Descriptiva

Page 1: Introduccion a La Estadistica  Descriptiva

Prof. Ximena N. Villarreal

Page 2: Introduccion a La Estadistica  Descriptiva

UNIDAD N°1: ESTADISTICA

UNIDAD N°2: PRESENTACIÓN DE DATOS

ESTADÍSTICOS

UNIDAD N°3: MEDIDAS DE RESUMEN

UNIDAD N° 4: NOCIONES ELEMENTALES DE

PROBABILIDAD

UNIDAD N° 5: TABLAS DE CONTINGENCIA

UNIDAD N° 6: INFERENCIA ESTADÍSTICA

Page 3: Introduccion a La Estadistica  Descriptiva

CONCEPTOS IMPORTANTES.

ESTADÍSTICA: Proviene del latín status (estado). Es considerada como una disciplina perteneciente a la Matemática Aplicada que se dedica al estudio cuantitativo de fenómenos colectivos. Proporciona métodos para:

- La recolección de datos

- Su ordenamiento, resumen y presentación

- Su análisis e interpretación y

- Posterior enunciado de conclusiones

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 4: Introduccion a La Estadistica  Descriptiva

Si las conclusiones se refieren

exclusivamente a los datos de

los que se dispone

Estadística

Descriptiva

Si las se conclusiones van más

allá de los datos que se

dispone y se refieren a un

conjunto mayor, del cual se

extrajeron

Estadística

Inferencial

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 5: Introduccion a La Estadistica  Descriptiva

CONCEPTOS IMPORTANTES.

POBLACIÓN: Es el conjunto de individuos u objetos

que comparten una característica común, en la

que el investigador está interesado.

Puede ser finita o infinita

MUESTRA: Es un subconjunto de la población.

Debe ser representativa, es decir se deben

mantener las mismas características de la

población de estudio.

EJEMPLO: una población puede ser definida como los alumnos de la escuela San Francisco.

Los alumnos pueden ser listados e individualizados a través de los registros áulicos –

POBLACIÓN FINITA.

Personas portadoras de una enfermedad determinada en Santiago del Estero – POBLACIÓN

INFINITA

Page 6: Introduccion a La Estadistica  Descriptiva

UNIDAD DE OBSERVACIÓN: es aquella sobre la cual se

efectúan las mediciones u observaciones.

DATO: es el valor que se obtiene de la medición, observación

o conteo efectuada en la unidad de observación o unidad de

muestreo.

Por ejemplo: si el objetivo de una investigación es el rendimiento

de los alumnos:

Unidad de observación

Dato

Alumno

Número de

materias rendidas

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 7: Introduccion a La Estadistica  Descriptiva

CONCEPTOS IMPORTANTES.

VARIABLE: Cualquier característica que varía

de una unidad de muestreo a otra en la

población o en la muestra.

Ejemplos: estado de salud de un alumno,

número de hermanos de cada alumno, medir

la altura de cada alumno, etc.

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 8: Introduccion a La Estadistica  Descriptiva

POBLACION

MUESTRA

INDIVIDUO

Posee características que toman

diferentes valores (VARIABLES)

Page 9: Introduccion a La Estadistica  Descriptiva

VARIABLES

CUANTITTIVA

CUALITATIVA

Los valores que asumen

pueden expresarse

mediante números

Los valores que puede

asumir son cualidades

DISCRETA

Toma sólo valores en el

intervalo que va de cero a n-

CONTINUA

Toma infinitos valores dentro

del intervalo

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Las variables pueden clasificarse de la siguiente manera:

Page 10: Introduccion a La Estadistica  Descriptiva

Otra forma de clasificación de las variables CUALITATIVAS es mediante el empleo de

cuatro niveles de medición:

NOMINAL: Los valores de las variables son nombres, etiquetas o categorías, y no se

puede establecer un orden entre ellos.

Ejemplos: lugar de nacimiento, colores de ojos, estado de salud, etc.

ORDINAL: Se puede establecer un orden entre las categorías de la variable.

Ejemplos: nivel de instrucción de un alumno, posición de corredores en una carrera, etc.

INTERVALO: En este nivel, la diferencia entre dos valores de datos tiene un

significado. En este nivel no hay un cero natural donde nada de la cantidad está

presente, sino que es convencional.

Ejemplos: escalas de medición de la temperatura

RAZÓN O COCIENTE: Es parecido al nivel de intervalo, pero este tiene un punto de

partida (cero inherente) , donde el cero indica que nada de la cantidad está presente.

Para los valores de este nivel, tanto las diferencias como los cocientes tienen significado.

Ejemplo: los precios de libros de texto ($0 representa ningún costo y un precio $60 es

dos veces más costoso que uno de $30

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 11: Introduccion a La Estadistica  Descriptiva

A TRABAJAR!! Hacemos la Actividad 1, pág. 35

Clasifique en base al siguiente listado las variables socieducativas, en cualitativas

nominales u ordinales y cuantitat. Discretas o continuas.

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

RELIGIÓN

N° DE ALUMNOS PROMOCIONADOS POR

SECCIÓN.

BARRIOS

NIVEL DE EDUCACIÓN ALCANZADO POR EL

TUTOR

EDAD DE LOS ALUMNOS

SEXO

N° DE INASISTENCIAS MENSUALES

ALTURA DE LOS ALUMNOS

LUGAR DE NACIMIENTO

PESO DE LOS ALUMNOS

HORAS DE JUEGO

N° DE MATERIAS QUE CURSAN

N° DE HERMANOS QUE TIENE CADA

ALUNMO

GRADO DE SATISFACCIÓN POR LA

ASIGNATURA

SUPERFICIE CONSTRUIDA POR ESCUELA

N° DE ESCUELAS POR DEPARTAMENTO

CATEGORÍAS DE ESCUELA

Page 12: Introduccion a La Estadistica  Descriptiva

SERIE DE DATOS

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 13: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

El conjunto de valores de una variableconstituye una serie de datos.Ejemplo: En el año 2004, se examinaron 30 niños de un Jardín de Infantes de Córdoba

y se denota su estado de salud (S = sano, E= enfermo)

Generalmente las variables se designan con las ultimas letras del abecedario en

mayúscula, por ej. X, y los valores que toma la variable con x minúscula; incluso se

coloca xi donde el índice i indica el número de individuo observado; de este modo las 30

observaciones son:

Xi= S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S, S, S, S, S, S.

El sub índice “i” varía de 1 a 30. Así, x1= S; x7=S; x14= E; …., x30=S.

Los datos en bruto, tal cual fueron obtenidos, sin agrupar constituye una serie simple de datos.

Se deja para el alumno, el análisis de los ejemplos 2 y 3 de la pág. 10

Page 14: Introduccion a La Estadistica  Descriptiva

ORGANIZACIÓN DE DATOS CATEGÓRICOS O CUALITATIVOS.

Cuando la masa de datos obtenidos es muy grande y estos están desordenados, no dan

información alguna; conviene por lo tanto ordenarlos y tabularlos, haciendo uso de tablas

estadísticas, que deben confeccionarse de tal modo que los datos resulten fáciles de ser leídos e

interpretados. Con los datos del ejemplo anterior, se puede construir una tabla de frecuencias.

TABLA DE FRECUENCIAS PARA UNA VARIABLE CUALITATIVA.

Es una tabla que asocia cada categoría de la variable con el número de veces que se repite la

categoría.

Siguiendo el ejemplo, sería la siguiente:

i Categorías: xi

(Estado de salud)

Frecuencias: fi

(n° de alumnos)

1 Sano 24

2 Enfermo 6

Total 30

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 15: Introduccion a La Estadistica  Descriptiva

Frecuencia Absoluta: Es el número de veces que se repite cada categoría de la variable. Se

la simboliza con fi.

La suma de las frecuencias absolutas es igual al número de observaciones, en este caso 30 :

Nótese que “i” ahora se refiere a las categorías x1= Sano, f1=24; x2= Enfermo, f2= 6.

Los datos organizados en tabla de simple entrada para variable cualitativa, pueden

presentarse mediante gráficos, que tiene la finalidad de que la información entre por los ojos.

El gráfico que puede usarse en éste caso es el gráfico de barras.

Con respecto al ejemplo:

2

1

30

i

fi

0

5

10

15

20

25

30

sano enfermo

Alumnos de un Jardín de Infantes de Córdoba

sano

enfermo

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 16: Introduccion a La Estadistica  Descriptiva

Para su construcción se utiliza el sistema de coordenadas ortogonales. Sobre el eje

horizontal se colocan las distintas categorías de la variable en estudio (estado de salud) y

sobre el vertical con una escala adecuada, se representan las frecuencia. Se dibujan barras

de ancho constante, una para cada valor de la variable, con una altura que representa el

valor de la frecuencia que corresponde a cada categoría. Es conveniente que la separación

entre las barras sea menor que le ancho de las mismas. Las barras pueden ser horizontales

o verticales.

0 5 10 15 20 25 30

sano

enfermo

Alumnos de un curso de EGB1, de la escuela San FRancisco

sano

enfermo

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 17: Introduccion a La Estadistica  Descriptiva

También es posible, y en algunos casos necesario, calcular frecuencias relativas.

FRECUENCIA RELATIVA: Es la proporción de veces que ocurre una categoría. Se la obtiene

dividiendo la frecuencia absoluta de cada categoría entre la suma de las frecuencias de todas las

categorías.

La suma, en el caso del ejemplo, es f1 + f2= 24+ 6= 30, y se expresa literalmente mediante el signo Sque se denomina sumatoria:

Así, a la frecuencia relativa de la clase i – ésima se la simboliza con fri y se la calcula de la siguiente

manera:

La suma de las frecuencias relativas es siempre igual a 1.

2

1

21 30624i

i fff

i

iri

f

ff

n

i

rif1

1

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 18: Introduccion a La Estadistica  Descriptiva

Si se multiplica las frecuencias relativas por 100, se obtienen los porcentajes, o también

conocida como la frecuencia relativa porcentual.

En este ejemplo, sería.:

i xi

(ESTADO DE

SALUD)

fi fri %

1 Sano 24 24/30=

0,80

80

2 Enfermo 6 6/30= 0,20 20

Total 30 1 100

Se pueden representar estos datos mediante un gráfico de barras, sólo que en el eje vertical van

los porcentajes.

Otro gráfico adecuado para representar series de frecuencias de variable cualitativa es el gráfico

de sectores circulares, llamado gráfico de tortas o pie charts.

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 19: Introduccion a La Estadistica  Descriptiva

Para su construcción, se elige un radio de por ejemplo 3cm (el valor del radio se elige según el

espacio que se disponga) y se grafica un círculo. La superficie de dicho círculo representa el total

de alumnos (30), que le corresponde un ángulo de 360°. Se puede discriminar mediante sectores

circulares la porción correspondiente a los alumnos sanos y a los enfermos. Los grados

correspondientes a los sectores se obtienen multiplicando la frecuencia relativa por 360°.

Siguiendo el ejemplo de estudio:

xi

(ESTADO DE SALUD)

fi fri 360°. fri

Sano 24 24/30= 0,80 360x0,80= 288°

Enfermo 6 6/30= 0,20 360x0,20= 72°

30 1 360°

80%

20%

sano

enfermo

Se deja como tarea

analizar el ejemplo

propuesto en el

apunte

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 20: Introduccion a La Estadistica  Descriptiva

TABLA DE FRECUENCIAS PARA UNA VARIABLE CUANTITATIVA DISCRETA

Si consideramos el ejemplo en el que tiene en cuenta el número de hermanos de los alumnos de

Preescolar de la escuela San Martín, los datos fueron los siguientes:

Xi= 4, 1, 6, 0, 0, 1, 2, 3, 1 0, 2, 5, 6, 4, 2, 0, 1, 2, 4, 3, 5, 6, 1, 3, 2, 4, 5, 2, 6, 0.

Esta es un caso de variable cuantitativa discreta, y la tabla de frecuencias se construye de la

siguiente manera: se ubica el valor mayor y el menor valor de la variable (0 y 6), se colocan todos los

valores correspondientes en la primera columna de la tabla, y luego se cuentan las veces que se

presentan dichos valores. Además de las frecuencias relativas, aquí se puede calcular también las

frecuencias acumuladas Fi. La Fi de una clase se obtiene sumándole a la frecuencia de la clase, la

frecuencia de las clases anteriores. La tabla resultante es:

xi fi fr Fi %

0 5 5/30=0,17 5 17

1 5 0,17 10 17

2 6 0,20 16 20

3 3 0,10 19 10

4 4 0,13 23 13

5 3 0,10 26 10

6 4 0,13 30 13

Total 30 1,0 100

Page 21: Introduccion a La Estadistica  Descriptiva

La tabla de frecuencias para variables discretas se representan mediante un gráfico de bastones.

En la abscisa se colocan los valores de la variable y se levanta para cada uno de ellos una línea de

altura igual a su frecuencia

1

2

3

4

5

6

1 2 3 4 5 6

Número de hermanos

Fre

cu

en

cia

INTERPRETACIÓN.

- El número 6 en la columna de fi significa que 6

alumnos tienen 2 hermanos.

- El número 19 en la columna de Fi significa que

19 alumnos tienen 3 hermanos o menos.

- El número 20 en la columna de porcentajes

significa que el 20% de los alumnos tienen 2

hermanos.

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 22: Introduccion a La Estadistica  Descriptiva

ACTIVIDAD 3 – PAG. 36A los padres de 50 alumnos de sección de 5 años de jardín de infantes

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

MC:muy conformeC: conformeI: indiferente

D: disconformeMD : muy disconforme

a. Indicar el tamaño de la

muestra

b. Presentar los datos en una

tabla de frecuencias:

absoluta, relativa y relativa

porcentual.

c. Presentar los datos en un

gráfico de barras

d. Realizar la conclusión

correspondiente.

Page 23: Introduccion a La Estadistica  Descriptiva
Page 24: Introduccion a La Estadistica  Descriptiva

TABLA DE FRECUENCIAS PARA UNA VARIABLE CUANTITATIVA CONTINUA

Para el caso de este tipo de variables, como los datos del ejemplo 3 (altura en cm de 25 alumnos

de una sección maternal de la Esc. San Francisco) que fueron obtenidos por medición, se

recomienda construir intervalos de clase, cuya amplitud depende de la cantidad de intervalos que

se deseen construir y la cantidad de datos que posee la serie simple. Es recomendable que los

intervalos de clase sean iguales, es decir, que la amplitud de los mismos sea constante. La técnica

a emplear para el agrupamiento de una serie simple de variable continua es sencilla.

Ejemplo: xi(cm) = 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79, 78, 95, 99, 97,

84, 86, 78, 74.

Pasos a seguir:

1) Se ubica el valor mayor (99cm) y el menor (70cm) que toma la variable.

2) Se obtiene la diferencia, la que se denomina Rango o amplitud de variación y se designa con la

letra R.

R = xmax – xmin = 99cm – 70cm = 29 cm

3) El número de intervalos aproximado se puede calcular con la siguiente fórmula:

)2log(

)1log( nn° de intervalos =

Donde

n:n° de valores de la serie o tamaño

de la muestra.

log: logaritmo decimal.

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 25: Introduccion a La Estadistica  Descriptiva

Siguiendo con el ejemplo y aplicando la fórmula:

)2log(

)1log(n

a =

57004,4)2log(

)125log(

intervalos

4) El rango se divide entre el n° de clases o intervalos de clases, 5 para este caso (se recomienda

que el número de intervalos no sea menor que 5 ni mayor que 15, pues en el primer caso se

reduce demasiado la información y el el segundo no se cumple con el objetivo del agrupamiento)

obteniéndose una idea aproximada de la longitud o amplitud del intervalo de clase.

68,55

29

int

ervalosden

Rango

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 26: Introduccion a La Estadistica  Descriptiva

5) Se delimitan las clases buscando preferentemente valores enteros para sus límites. Se debe

elegir el límite inferior del 1er intervalo de tal manera que contenga el menor valor de la serie

(70cm). La elección recae en el 70. El límite superior del 1er intervalo, se obtiene sumando al Li la

amplitud.

Li del 1er intervalo= 70

Ls del 1er intervalo= Li+a = 70+5 = 75

El límite inferior del 2do intervalo debe coincidir con el límite superior del primer intervalo.

Li del 2do intervalo =75

Ls del 2do intervalo= Li + a= 75 +5=80

Así sucesivamente, hasta que el último intervalo contenga el valor observado más alto de la

variable.

6) Una vez formadas las clases se procede al conteo, que consiste en determinar el número de

observaciones (frecuencias) de cada clase. Una manera sencilla de hacerlo es leyendo la serie

simple y ubicando mediante marcas cada valor de la variable en su clase correspondiente. De esta

manera cuando se termine de pasar lista a la serie simple, el agrupamiento ha sido efectuado.

70 - 75

75 - 80

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

Page 27: Introduccion a La Estadistica  Descriptiva

Serie simple del Ejemplo:

xi(cm) = 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79, 78, 95, 99, 97, 84, 86, 78, 74.

Intervalo de

clase

(altura en cm)

Xi

(marca de

clase)

fi fri

70 a 75 72,5 4 4/25= 0,16

75 a 80 77,5 5 0,20

80 a 85 82,5 4 0,16

85 a 90 87,5 5 0,20

90 a 95 92,5 1 0,04

95 a 100 97,5 6 0,24

Total 25 1,00

Pregunta… si uno de los alumnos mide exactamente 95cm, ¿dónde lo

ubicamos, en el quinto o en el sexto intervalo?

[75 ; 80)Cerrado, tomamos el Li Abierto, no tomamos el Ls

Los valores del intervalo van de 75 a 79, 99999…

Page 28: Introduccion a La Estadistica  Descriptiva

7) Se agrega una tercera columna, titulada marca de clase o punto medio de clase que se

designa con xi que contiene los valores correspondientes a los puntos medios de cada uno de los

intervalos y se calcula así:

5,772

8075

2

5,722

7570

2

222

111

LsLix

LsLix

Un gráfico adecuado para representar una serie de frecuencias de v.c.continua es el histograma. Su

construcción es sencilla: se utiliza el sistema de coordenadas cartesianas ortogonales, en el eje de las

ordenadas (vertical) se marcan las frecuencias fi y en el de las abscisas (horizontal) la variable según la

cual se efectuó la clasificación (altura). Consiste en rectángulos adyacentes (uno por cada clase) con

bases materializadas por la amplitud de clases. La altura está dada por la frecuencia correspondiente a

cada clase. Cuando las clases son iguales, el área del histograma es proporcional a la frecuencia total.

1

2

3

4

5

6

70 9085 Altura (cm)

alu

mn

os

75 80 95 100

72,5

77,5

82,5

87,5

92,5

97,5

POLÍGONO

DE

FRECUENCIA

Page 29: Introduccion a La Estadistica  Descriptiva

1

2

3

4

5

6

70 948876 82 100

7

8

106

HISTOGRAMA

El Histograma y el Polígono de frecuencia son dos gráficos que brindan la misma información. Si se

escogió la cantidad adecuada de intervalos, NO se produce lo que se denomina serrucho. En este

caso, como hay serrucho, debería reelegirse la cantidad de intervalos para obtener un histograma

adecuado

HISTOGRAMA

sin serrucho

Page 30: Introduccion a La Estadistica  Descriptiva

1

2

3

4

5

6

70 9488 Altura (cm)

alu

mn

os

76 82 100

73

79

85

96

91

POLÍGONO

DE

FRECUENCIA

7

8

106

POLIGONO DE FRECUENCIA

El polígono de frecuencia comienza un intervalo antes del primero de la tabla y finaliza uno

después.

Page 31: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2

a. Agrupar los datos en una tabla de frecuencias calculando la amplitud y la cantidad de intervalos con las fórmulas correspondientes.b. Calcular marca de clase, frecuencia absoluta, relativa, relativa porcentual y acumulada.c. Presentar los datos en el gráfico correspondiente.

Page 32: Introduccion a La Estadistica  Descriptiva

Lic. en EGB 1 y 2 - E.I.E - UNSE - UNIDAD 3

Page 33: Introduccion a La Estadistica  Descriptiva

Se conocen varias formas de determinar el centro de un

conjunto de datos. A continuación, se indicarán tres que

son las mas comúnmente utilizadas:

MEDIA, MEDIANA Y MODA

Existen medidas de dispersión, como el Desvío medio y

la Varianza que nos permiten calcular que tan dispersos

están los datos del promedio de la muestra.

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 34: Introduccion a La Estadistica  Descriptiva

La media es la medida de posición y tendencia central más empleada para describir los datos;

constituye lo que la mayoría de la gente denomina promedio.

A la media aritmética se la representa con: x

a) Cálculo de la media aritmética en una serie simple de datos.

Se la obtiene al dividir la suma de todos los valores de la variable entre la cantidad de valores sumados.

n

x

n

xxxx

n

i

i

n

121 ....

“n”: tamaño de la muestra

Ejemplo: Se registró los días de inasistencias en un año, de una muestra de cinco alumnos de la

sección maternal del jardín y se desea averiguar cual es el promedio de inasistencias de esa

muestra. La variable de estudio es:

X= n° de inasistencias de los alumnos

Los valores de la variable son: xi= 0, 16, 12, 5, 7.

85

40

5

7512160

x

Interpretación: Los alumnos tienen en promedio 8 inasistencias por año.

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 35: Introduccion a La Estadistica  Descriptiva

Algunas propiedades de la media aritmética

La media aritmética es reproductora del total.

La media aritmética se puede calcular cuando los valores de las variables son cuantitativos tanto

continuos como discretos.

Si llamamos desvío a la diferencia entre un valor y la media aritmética

0xxd iixi

0 0 – 8= -8

5 5 – 8 = -3

7 7 – 8 = -1

12 12 – 8= 4

16 16 – 8 = 8

total 0

xxd ii

Una desventaja de la media es su sensibilidad a valores extremos, de modo que un valor excepcional puede

afectarla de una manera drástica, en este caso no representa en forma adecuada al centro de dicho conjunto y

tiende a dirigirse a ese valor extremo.

Si por equivocación, en lugar de colocar 16 ponemos 66 veamos que ocurre:

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 36: Introduccion a La Estadistica  Descriptiva

X= inasistencias de alumnos

xi= 0, 66, 12, 5, 7.

185

90

5

7512660

x

La inasistencia promedio toma el valor 18, alejándose el promedio hacia

el valor extremo 66.

La media aritmética no representa el centro del conjunto de datos. Este

problema o desventaja se resuelve utilizando otra medida de resumen de

datos denominada MEDIANA.

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 37: Introduccion a La Estadistica  Descriptiva

La mediana de un conjunto de datos es una la medida de tendencia central que divide a la serie

ordenada de datos en dos partes iguales, de tal forma que el 50% de los datos so menores o iguales

a la mediana y el otro 50% mayores o iguales a ella. La mediana se designa con Me.

b) Cálculo de la mediana en una serie simple de datos.

Se consideran dos casos, cuando el tamaño de la muestra (n) es par o es impar.

Considerando el ejemplo anterior, se desea determinar el valor mediano de las inasistencias de los

alumnos:

El tamaño de la muestra “n” es impar

X= inasistencias de alumnos

xi= 0, 66, 12, 5, 7.

Para su cálculo, debemos ordenar primero los datos en forma ascendente o descendente.

0,5,7,12,66

Si el número de observaciones es impar, la mediana es el valor de la variable que se localiza

exactamente en la mitad de la lista.

0, 5, 7, 12, 66

Me= 7 inasistencias

Interpretación: el 50% de los alumnos tiene inasistencias menores o iguales a 7.

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 38: Introduccion a La Estadistica  Descriptiva

En caso de que el número de observaciones fuera par, el valor de la mediana se obtiene

promediando los dos valores centrales. Esos valores centrales se posicionan en el lugar:

2

1n

Considerando otro ejemplo, en el caso de que n sea par, supongamos que contamos las

inasistencias de 6 alumnos.

X= Inasistencias de los alumnos

Xi= 0, 66, 12, 5, 7, 10.

Primero ordenamos los datos: 0, 5, 7, 10, 12, 66.

La muestra posee tamaño n=6, o sea que la posición de los valores centrales es:

Los valores centrales ocupan el tercer y cuarto lugar, la mediana se obtiene como el promedio

de los dos valores centrales.

0, 5, 7, 10, 12, 66.

5,32

7

2

16

82

5,8

2

107

Interpretación: el 50% de los alumnos

tienen inasistencias menores o iguales a

8

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 39: Introduccion a La Estadistica  Descriptiva

Algunas propiedades de la mediana

La mediana no se ve influenciada por los valores extremos, ya que en su cálculo interviene el

orden y no la magnitud de los valores.

No es sensible a valores extremos.

Se puede determinar para variables cuantitativas continuas discretas y para variables cualitativas

que se miden en escala ordinal.

EL Modo es el valor de la variable que ocurre con mayor frecuencia. Se designa frecuentemente

como Mo.

Se debe hacer notar aquí que el Mo es un valor de variable y la frecuencia de este valor sugiere su

importancia estadística.

Cuando dos valores ocurren con la misma frecuencia y ésta es la más alta, ambos valores son

modas, por lo que el conjunto es BIMODAL. Cuando más de dos valores ocurren con la misma

frecuencia y ésta es la mas alta, todos los valores son modas, por lo que el conjunto es

MULTIMODAL.

Cuando ningún valor se repite, se dice que no hay moda.

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 40: Introduccion a La Estadistica  Descriptiva

EJEMPLO:

Calcular la/s moda/s para el siguiente conjunto de datos:

SERIE A:6, 7, 1, 0, 0, 0, 7, 4, 3, 2, 8, 0

¿Cuál es el número que más se repite (mayor frecuencia)? El 0

En realidad, la moda no se utiliza mucho con datos numéricos. Sin

embargo, entre las distintas medidas de tendencia central que

consideramos, la moda es la única que puede usarse cuando se trata

de variables cualitativas nominales.

Como tarea domiciliaria, leer el ejemplo que propone el apunte (Ejemplo 6)

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 41: Introduccion a La Estadistica  Descriptiva

CALCULO DE LAS MEDIDAS DE POSICIÓN EN SERIES DE FRECUENCIAS

MEDIA ARITMETICA PARA VARIABLES AGRUPADAS EN SERIE DE FRECUENCIAS SIMPLEComo en una serie de frecuencias, fi nos indica las veces que se repite el valor de la variable,

debemos considerarlas en el cálculo de la media aritmética.

Tomamos el siguiente ejemplo: Alumnos de la primera sección del Jardín Municipal N°1,

clasificados según el número de hermanos.

N° de hermanos

(xi)

N° de alumnos(fi)

0 1

1 9

2 7

3 5

4 3

Total 25

Si aplicamos la fórmula de promedio para series

simples, deberíamos sumar 1 vez cero, nueve veces

1 y así sucesivamente hasta sumar 3 veces; luego

dividir esa suma entre 25 que es el tamaño de la

muestra.

xi= n° de hermanos

fi= número de alumnos que poseen xi hermanos

225

50

25

4...44...33....22...110

25

25

1

i

ix

x

9 veces 7 veces 5 veces 3 veces

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 42: Introduccion a La Estadistica  Descriptiva

Pero, la fórmula de manera más sencilla es:

n

i

ii fxnfff

fxfxfxx

1521

552211 1

...

.... MEDIA

PONDERADA

Volviendo al ejemplo, y aplicando la fórmula recién vista, tenemos que:

N° de hermanos

(xi)

N° de alumnos

(fi)

xi*fi

0 1 0*1=0

1 9 1*9=9

2 7 2*7=14

3 5 3*5=15

4 3 4*3=12

Total 25 50

250.25

11

1

n

i

ii fxn

x

Podemos concluir diciendo que los alumnos en promedio

poseen 2 hermanos.

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 43: Introduccion a La Estadistica  Descriptiva

MEDIANA PARA VARIABLES AGRUPADAS EN SERIE DE FRECUENCIAS SIMPLEComo en la tabla de frecuencia los datos ya se encuentran ordenados, debemos seguir las

siguientes instrucciones:

1) Calcular la frecuencia a cumulada correspondientes a cada valor de la variable.

2) Calcular el orden de localización de la mediana efectuando el cociente:

3) Luego de ubicar la posición de la mediana, se busca en la columna de frecuencias

acumuladas el menor valor que contiene al resultado obtenido con la fórmula anterior. La

mediana será el valor de la variable q corresponde a la frecuencia acumulada elegida.

Veamos un ejemplo:

Alumnos de la primera sección del Jardín de una escuela rural, clasificados según el número de

hermanos..

2

1n “n” tamaño de la muestra

N° de hermanos

(xi)

N° de alumnos (fi)

Frecuenciasacumuladas

(Fi)

2 5 5

3 5 10

4 30 40

5 4 44

total 44

5,222

45

2

144

2

1

nPOSICIÓN

Ubicamos en la tabla el menor valor

que contiene a 22,5

Interpretación: el 50% de los alumnos de escuelas rurales tienen 4 hermanos

o menos.Lic. En Educac. Inicial - UNSE – UNIDAD 3

Me = 4

Page 44: Introduccion a La Estadistica  Descriptiva

MODA PARA VARIABLES AGRUPADAS EN SERIE DE FRECUENCIAS SIMPLE

Como en el caso de las series simples sin agrupar, la moda es el valor que más se repite, es

decir, con mayor frecuencia.

Por ejemplo, si tomamos nuevamente la tabla anterior:

N° de hermanos

(xi)

N° de alumnos (fi)

2 5

3 5

4 30

5 4

Total 44

El valor que más se repite es x=4 (fi=30), por lo que

la moda Mo=4

INTERPRETACIÓN: La mayoría de los alumnos

poseen 4 hermanos.

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 45: Introduccion a La Estadistica  Descriptiva

VARIABLE AGRUPADA EN SERIES DE FRECUENCIAS CON INTERVALOS DE CLASEPara el cálculo de las tres medidas de posición debemos trabajar con las marcas de clase, ya que

al organizar los datos en intervalos se pierde información al indicar que un valor se encuentra

entre los límites de dicho intervalo, pero no se conoce exactamente el valor del dato. Por ejemplo,

se indica que en una escuela hay 12 alumnos que pesan entre 30 y 40 kg, pero no se conoce el

peso exacto de cada uno de ellos.

Así, debemos encontrar un único valor que represente o resuma a todos los valores del intervalo:

ese valor es el promedio de los límites del intervalo y se denomina punto medio o marca de

clase.

Ejemplo: si el intervalo es [30; 40), la marca de clase es: 5,302

70

2

4030

La fórmula para encontrar la media aritmética es la siguiente:

n

i

ii fxn

x1

1 Donde en este casi, xi representa la marca de clase

“n” tamaño de la muestra

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 46: Introduccion a La Estadistica  Descriptiva

EJEMPLO: Consideremos el peso de los alumnos de un Jardín de una escuela rural.

Intervalo (kg)

N° alumnos fi

Marca de clase

xi

Xi*fi

[10;12) 12 11 132

[12;14) 19 13 247

[14;16) 7 15 105

[16;18) 6 17 102

[18;20) 6 19 114

Total 50 700

kgfxn

xn

i

ii 14700*1

501

1

INTERPRETACIÓN: Los alumnos pesan en promedio 14kg.

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 47: Introduccion a La Estadistica  Descriptiva

Para calcular esta medida de posición, utilizamos la siguiente fórmula:

af

Ff

LMMe

anteriorMe

i

e *2inf

Linf : límite inferior de la clase mediana

: Suma de la frecuencia entre dos

Fanterior Me : frecuencia acumulada anterior a la clase mediana

fMe : frecuencia absoluta de la clase mediana

a : Amplitud del intervalo a = Lsup - Linf

2

if

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 48: Introduccion a La Estadistica  Descriptiva

El procedimiento a realizar es:

1) En la tabla se agrega una columna para valores de frecuencia acumuladas.

2) Se calcula . El tamaño de la muestra se divide en 2 porque la mediana

divide a la serie ordenada de datos en dos partes iguales.

3) Se busca en la columna Fi el menor valor que contiene a al resultado obtenido en el ítem

anterior. Luego, con estos valores se aplica la fórmula para calcular la Me.

Continuando con el ejemplo anterior:

2

if

Intervalo (kg)

N°alumnos

fi

Fi

[10;12) 12 12

[12;14) 19 31

[14;16) 7 38

[16;18) 6 44

[18;20) 6 50

Total 50

252

50

2

if

kg

M

af

Ff

LM

e

Me

anteriorMe

i

e

37,1337,112

2*19

13122*

19

1225122*

19

122

50

12

*2inf

INTERPRETACIÓN: El 50% de los alumnos

pesan 13,37 kg

Page 49: Introduccion a La Estadistica  Descriptiva

La siguiente fórmula, nos permite calcular la Moda en una serie de datos:

Continuando con el ejemplo anterior:

aDD

DLMo Mo *

21

1inf

D1 = fMo – fanterior a la clase Modal

D2 = fMo – fposterior a la clase modal

a = amplitud del intervalo.

Intervalo (kg)

N°alumnos

fi

[10;12) 12

[12;14) 19

[14;16) 7

[16;18) 6

[18;20) 6

Total 50

La clase modal corresponde al intervalo [40;42), ya que su

frecuencia es la mayor. Luego, aplicamos la fórmula.

D1= 19 - 12=7

D2= 19 - 7=12

a = 14 – 12= 2

kgMo

aDD

DLMo Mo

74,1274,0122*19

7122*

712

712

*21

1inf

INTERPRETACIÓN: el peso más frecuente del grupo de alumnos es de 12,74kg

Page 50: Introduccion a La Estadistica  Descriptiva

MEDIAARITMETICA

MEDIANA MODO

V. CUALITATIVA ORDINAL

NO SI (en algunos

casos)

SI

V. CUALITATIVANOMINAL

NO NO SI

V. CUANTITATIVA

DISCRETA

SI SI SI

V. CUANTITATIVA

CONTINUA

SI SI SI

Page 51: Introduccion a La Estadistica  Descriptiva
Page 52: Introduccion a La Estadistica  Descriptiva

Teniendo en cuenta la Actividad 2 y la Actividad 5 de la unidad anterior, calcular

para cada una de ellas las medidas de tendencia central con la conclusión

correspondiente.

Lic. En Educac. Inicial - UNSE – UNIDAD 3

Page 53: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Page 54: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

INTRODUCCIÓN

La teoría de probabilidad tiene sus orígenes en la teoría de la

casualidad. Históricamente, la teoría de la Probabilidad comenzó

con el estudio de los juegos de azar, tales como la ruleta y las

cartas.

Por ejemplo, para tomar decisiones en cualquiera de nuestros

ámbitos cotidianos, analizamos todos los factores que puedan

incidir en dicha decisión, que certeza hay de que ocurran ciertos

eventos y cuales de que no ocurran. Sin darnos cuenta, aplicamos

conceptos “intuitivos de la probabilidad”.

Antes de estudiar la teoría de probabilidad, es importante conocer

el concepto de azar.

Page 55: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Cuando se selecciona una determinada muestra de la

población, para obtener valores significativos para el estudio

estadístico es necesario que dicha muestra sea

seleccionada al AZAR, es decir, que cada una de las

observaciones tiene la misma probabilidad de ser

seleccionada.

Cuando un suceso no puede predecirse, como por ejemplo

el número que va a salir en una ruleta o una determinada

carta de una baraja, se dice que es independiente. Si la

independencia existe, se puede hablar de sucesos

realmente al azar.

Page 56: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

La Probabilidad es la teoría que tiene que

ver con los posibles resultados de los

experimentos. Estos deben ser repetitivos,

es decir, debemos ser capaces de

reproducirlos bajo condiciones similares.

Page 57: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

EXPERIMENTOS ALEATORIOS. ESPACIO MUESTRAL. EVENTOS.

Los experimentos aleatorios son aquellos cuyos resultadosdependen del azar. Por ejemplo: el tiempo de espera en laparada del colectivo, el lanzamiento de un dado, etc.

EXPERIMENTOS ALEATORIOS: Son aquellos que , repetidos bajo idénticas condiciones, no arrojan un único resultado sino un conjunto de ellos.

Page 58: Introduccion a La Estadistica  Descriptiva

ESPACIO MUESTRAL: Es el conjunto de los resultados posibles de un experimento aleatorio y se denota con M.

Ejemplos.

Arrojar un dado. Espacio muestral M= {1, 2, 3, 4,5, 6}Arrojar una moneda. Espacio muestral M={C, S}Arrojar una moneda y un dado simultáneamente, el espacio muestral resultante es:M={ (cara,1) , (cara, 2), …., (seca, 1), (seca, 2), … , (seca, 6)}

SUCESO SEGURO: Es el conjunto total M (espacio muestral)

SUCESO IMPOSIBLE : Es el conjunto vacío.

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Page 59: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Consideremos un espacio muestral M, dos eventos cualesquiera A y B en el experimento. Definimos:

UNION DE EVENTOS A U B : Representa el evento que ocurre si o

sólo si ocurre A u ocurre B o ambos.

INTERSECCION DE VENTOS A ∩B : Representa el evento que ocurre

si y sólo si, ocurren A y B simultáneamente, esto es, si ocurren en la

misma ejecución del experimento en consideración.

EVENTOS MUTUAMENTE EXCLUYENTES: Son los eventos que no

ocurren simultáneamente. Este caso se representa solamente cuando

A∩B = ,el evento vacío, de tal manera que A y B no tienen puntos en

común.

Page 60: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Un experimento consiste en tirar un dado y observar el número de puntos que aparece en la cara superior. El espacio muestral se puede describir f{acilmente, ya que es finito. Las posibilidades para el dado son seis: 1, 2, 3, 4, 5, 6. por lo tanto:

M= {1, 2, 3, 4, 5, 6}ESPACIO

MUESTRAL

• Describir los siguientes eventos.

A = Sale un número par.B= Sale un número impar.C= Sale un número menor que 4.D = Sale un número mayor que 3.E= Sale un número impar o mayor que 3. F = Sale un número par y menor que 4.G = sale un número par y un impar.

Page 61: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

La Probabilidad de un evento A en un experimento aleatorio estádado por el cociente entre el número de casos favorables y elnúmero de casos igualmente posibles.

posibles igualmente casos de totalN

A a favorables casos )(

deNAP

Si los eventos son Mutuamente excluyentes, esto es si dos eventos no pueden ocurrir simultáneamente:

A∩B = , entonces la P() = 0

Page 62: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Ejemplos:La probabilidad de extraer un as de espada de

una baraja de 52 naipes, es iguala a 1/52.

La probabilidad de sacar un as de espadas rojoes cero, puesto que no hay figuras de espadasrojas en la baraja.

La probabilidad de extraer 6 manzanas de uncajón que trae 20 manzanas es 6 / 20

Page 63: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

1. SI ES EL CONJUNTO VACÍO, ENTONCES P() = 0. IMPOSIBILIDAD

2. SI E ES EL COMPLEMENTO DE UN EVENTO E, ENTONCES:P(E) = 1 – P(E)

3. SI A B, ENTONCES P(A) P(B)4. EL RESULTADO DE LA PROBABILIDAD DE UN EVENTO ES: 0≤ P(E) ≤ 1

EJEMPLO:La probabilidad de que ocurra el evento A, es decir que al lanzar un dado salga un número par, se calcula como: P(A) = 3/6 = ½

Donde:-El número de resultados favorables es 3, ya que A= { 2, 4, 6}, tiene tres elementos.-El número total de resultados es 6, ya que M= { 1, 2, 3, 4, 5, 6} tiene 6 elementos.

Page 64: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Muchas veces necesitamos encontrar la probabilidadde un evento B si se sabe que ha ocurrido un evento A.esta probabilidad se llama probabilidad condicional deB dado A y se representa como P(B/A) . Se define comosigue:

)(

)()/(

AP

BAPABP

)(

)()/(

BP

BAPBAP

Page 65: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Considerar el experimento aleatorio de arrojar un

dado.

a. Halle la probabilidad de que aparezca un número

menor que 4 dado que apareció un número mayor que

3.

b. Halle la probabilidad de que aparezca un número

impar dado que apareció un número mayor que 3.

Page 66: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Sean A y B dos eventos del espacio muestral M generado por un experimento aleatorio. El teorema se enuncia de la siguiente manera:

P(A∪B) = P(A) + P(B) – P( A ∩B)

Si los eventos son mutuamente excluyentes, el último término es igual a cero, por lo que se anula ya que A∩B = , entonces la P() = 0. entonces:

P(A∪B) = P(A) + P(B)

Ejemplo: Si consideramos el experimento de lanzar simultáneamente un dado y una moneda, calcular la probabilidad del evento “ sale cara o sale un número

par”

Page 67: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Sean A y B dos eventos del espacio muestral M, y P(A)> 0 y P(B)>0, entonces se cumple que:

P(A∩B) = P(A) * P(B/A) = P(B) * P(A/B)

Cuando los eventos son independientes, se representa simbólicamente como:

P(B/A) = P(B) y P(A/B) = P(A)

Cuando los eventos son independientes, la regla de multiplicación se simplifica a:

P(A∩B) = P(A) * P(B)

Page 68: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

A= salga un número parB = salga un número impar.

Para que sean independientes, debe ocurrir que P(A/B) = P(A) o bien que P(B/A) = P(B).En caso de NO ser independientes, se dice que son dependientes.

Page 69: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Consideremos el siguiente ejemplo: Para un estudio , se obtiene una muestra de

padres de alumnos de un jardín de infantes y se los clasifica según ocupación y

grado de compromiso con el mismo, obteniéndose los siguientes resultados:

Ocupación Grado de compromiso con el establecimiento

No comprometido

Poco comprometido

Comprometido Total

Desocupado 20 10 5 35

Trabajo permanente

10 15 10 35

Trabajo temporario

15 10 5 30

Total 45 35 20 100

Page 70: Introduccion a La Estadistica  Descriptiva

Lic. En Educac. Inicial - UNSE – UNIDAD 4

Suponga que se selecciona un padre al azar de este grupo.

Obtenga las probabilidades siguientes:

Que el padre no se comprometa con la institución.

Que el padre no se comprometa o se comprometa con la

institución.

Que el padre se comprometa poco con la institución .

Que el padre sea desocupado y no se comprometa.

Probabilidad que el padre sea poco comprometido dado

que tiene trabajo permanente.

Probabilidad que el padre tenga trabajo temporario o sea

poco comprometido

Page 71: Introduccion a La Estadistica  Descriptiva