Estadística Objetivo: Recordar elementos presentes en el estudio de la estadística.
-
Upload
luis-miguel-valdez-serrano -
Category
Documents
-
view
222 -
download
1
Transcript of Estadística Objetivo: Recordar elementos presentes en el estudio de la estadística.
Estadística
Objetivo: Recordar elementos presentes en el estudio de la estadística
Cantidad de palabras leídas por estudiantes de 1° medio
Cantidad de palabras
[201,300]
[301,400]
[401,500]
[501,600]
[601,700]
Tabla de frecuencias: tipo de representación que permite agrupar datos
Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras
[201,300]
[301,400]
[401,500]
[501,600]
[601,700]
Rango: Es la diferencia entre el dato máximo y el dato mínimo.
La amplitud de un intervalo es la diferencia entre el límite superior y el inferior. La amplitud (A) de intervalos puede calcularse de la siguiente manera:
Cantidad de palabras leídas por estudiantes de 1° medio Cantidad de palabras
[201,300]
[301,400]
[401,500]
[501,600]
[601,700]
Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras
Marca de clase
[201,300]
[301,400]
[401,500]
[501,600]
[601,700]
La Marca de clase de un intervalo corresponde al promedio entre el límite superior (LS) y el inferior (LI).
Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras
Marca de clase
f. Absoluta( f )
[201,300] 250,5 12
[301,400] 350,5 15
[401,500] 450,5 20
[501,600] 550,5 14
[601,700] 650,5 2
Frecuencia absoluta (f) : es el numero de veces que se repite un dato o el numero de datos incluidos en un determinado intervalo
Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras
Marca de clase
f. Absoluta
( f ) F
[201,300] 250,5 12
[301,400] 350,5 15
[401,500] 450,5 20
[501,600] 550,5 14
[601,700] 650,5 2
Frecuencia absoluta acumulada(F) : corresponde a la suma de las frecuencias absolutas menores o iguales al valor de la variable en cuestión. El ultimo valor debe ser igual al total de datos.
Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras
Marca de clase
f. Absoluta ( f ) F fr
[201,300] 250,5 12 12
[301,400] 350,5 15 27
[401,500] 450,5 20 47
[501,600] 550,5 14 61
[601,700] 650,5 2 63
Frecuencia relativa (fr): corresponde a la división entre la frecuencia absoluta de un dato o intervalo y la cantidad total de datos.
Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras
Marca de clase
f. Absoluta ( f ) F fr Fr
[201,300] 250,5 12 12 0,19
[301,400] 350,5 15 27 0,24
[401,500] 450,5 20 47 0,32
[501,600] 550,5 14 61 0,22
[601,700] 650,5 2 63 0,03
Frecuencia relativa acumulada (Fr): corresponde a la suma de las frecuencias relativas menores o iguales al valor de la variable en cuestión. El ultimo valor debe ser igual 1.
Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras
Marca de clase
f. Absoluta ( f ) F fr Fr fp
[201,300] 250,5 12 12 0,19 0,19
[301,400] 350,5 15 27 0,24 0,43
[401,500] 450,5 20 47 0,32 0,75
[501,600] 550,5 14 61 0,22 0,97
[601,700] 650,5 2 63 0,03 1
Frecuencia relativa porcentual (fp): corresponde a la frecuencia relativa multiplicada por 100 y expresada como porcentaje.
Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras
Marca de clase
f. Absoluta ( f ) F fr Fr fp Fp
[201,300] 250,5 12 12 0,19 0,19 19%
[301,400] 350,5 15 27 0,24 0,43 24%
[401,500] 450,5 20 47 0,32 0,75 32%
[501,600] 550,5 14 61 0,22 0,97 22%
[601,700] 650,5 2 63 0,03 1 3%
Frecuencia relativa porcentual acumulada (Fp): corresponde a la suma de las frecuencias relativas porcentuales menores o iguales al valor de la variable en cuestión. El ultimo valor debe ser igual a 100%.
Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras
Marca de clase
f. Absoluta ( f ) F fr Fr fp Fp
[201,300] 250,5 12 12 0,19 0,19 19% 19%
[301,400] 350,5 15 27 0,24 0,43 24% 43%
[401,500] 450,5 20 47 0,32 0,75 32% 75%
[501,600] 550,5 14 61 0,22 0,97 22% 97%
[601,700] 650,5 2 63 0,03 1 3% 100%
Frecuencia relativa porcentual acumulada (Fp): corresponde a la suma de las frecuencias relativas porcentuales menores o iguales al valor de la variable en cuestión. El ultimo valor debe ser igual a 100%.
Medidas de tendencia central para datos agrupados
• Una manera de representar características de un conjunto de datos en estadística es a través de tres medidas numéricas: media aritmética, mediana y moda. Cada una de ellas representa un tipo de promedio, el cual indica la tendencia central del conjunto de datos. En esta parte del curso veremos como calcularlos y que información nos brindan.
Media aritmetica
• La media aritmética es el promedio aritmético de los valores de la variable. Obviamente, al ser promedio, tiene sentido en variables de tipo cuantitativo. Se puede representar como o como .
• Para calcular la media de un conjunto de datos agrupados en intervalos se utiliza la siguiente formula:
X
1 1 2 2 ...
donde:
Mc marca de clase del intervalo i
frecuencia absoluta del intervalo i
N= Cantidad total de datos
i i n n
i
i
Mc f Mc f Mc f Mc fX
N N
f
Cantidad de palabras leídas por estudiantes de 1° medioCantidad de palabras
Marca de clase
f. Absoluta ( f ) F fr Fr fp Fp
[201,300] 250,5 12 12 0,19 0,19 19% 19%
[301,400] 350,5 15 27 0,24 0,43 24% 43%
[401,500] 450,5 20 47 0,32 0,75 32% 75%
[501,600] 550,5 14 61 0,22 0,97 22% 97%
[601,700] 650,5 2 63 0,03 1 3% 100%
i iMc fX
N
Mediana• La mediana de un conjunto de observaciones se define
como el valor que queda en la parte central de un grupo de observaciones arreglados en orden de magnitud.
• La definición de geométrica se refiere al punto que divide en dos partes a un segmento. Por ejemplo, la mediana del segmento AB es el punto C.
• Existen entonces dos segmentos iguales:• AC = CB• Se calcula de la siguiente forma:
1) Calculo de posición: se identifica en que intervalo se encuentra la mediana:
Cantidad de palabras
Marca de clase
f. Absoluta ( f ) F fr Fr fp Fp
[201,300] 250,5 12 12 0,19 0,19 19% 19%
[301,400] 350,5 15 27 0,24 0,43 24% 43%
[401,500] 450,5 20 47 0,32 0,75 32% 75%
[501,600] 550,5 14 61 0,22 0,97 22% 97%
[601,700] 650,5 2 63 0,03 1 3% 100%
63( ) 31.5 32 3 intervalo
2 2
NPos Md
2) Se calcula la mediana:
inf
inf
2
:
Limite inferior del intervalo
N= cantidad de datos
F frecuencia acumulada anterior al intervalo
A= amplitud del intervalo
ant
i
ant
NF
Md L Af
donde
L
Cantidad de palabras
Marca de clase
f. Absoluta ( f )
F fr Fr fp Fp
[201,300] 250,5 12 12 0,19 0,19 19% 19%
[301,400] 350,5 15 27 0,24 0,43 24% 43%
[401,500] 450,5 20 47 0,32 0,75 32% 75%
[501,600] 550,5 14 61 0,22 0,97 22% 97%
[601,700] 650,5 2 63 0,03 1 3% 100%
inf2 ant
i
NF
Md L Af
Moda
• Indica el valor que más se repite, o la clase que posee mayor frecuencia.
• En el caso de que dos valores presenten la misma frecuencia, decimos que existe un conjunto de datos bimodal. Para más de dos modas hablaremos de un conjunto de datos multimodal.
• Se calcula de la siguiente manera
1) Posición de la moda: se identifica en que intervalo se encuentra la mayor frecuencia absoluta y trabajamos en base a eso.
2) Calculamos:
1inf
1 2
inf
1 1
2 1
:
Limite inferior del intervalo modal
(frecuencia modal-frecuencia del intervalo anterior)
(frecuencia modal-frecuencia del intervalo siguiente)
A= a
i i
i i
dMo L A
d d
donde
L
d f f
d f f
mplitud del intervalo modal
Cantidad de palabras
Marca de clase
f. Absoluta ( f )
F fr Fr fp Fp
[201,300] 250,5 12 12 0,19 0,19 19% 19%
[301,400] 350,5 15 27 0,24 0,43 24% 43%
[401,500] 450,5 20 47 0,32 0,75 32% 75%
[501,600] 550,5 14 61 0,22 0,97 22% 97%
[601,700] 650,5 2 63 0,03 1 3% 100%
1inf
1 2
dMo L A
d d
• Los percentiles, entregan la idea de "posición" de los datos, es decir avisan a partir de que observación o intervalo de clase se ha acumulado un determinado porcentaje de observaciones
• Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales, o sea, dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
• Ejemplo: el percentil 50 coincide con la mediana.
inf
inf
100
limite inferior del intervalo
k=orden del percentil k=0,1,2,...,99
cantidad total de datos
frecuencia acumulada del intervalo anterior
amplitud del intervalo
ant
ki
ant
k NF
P L Af
L
N
F
A
Cantidad de palabras
Marca de clase
f. Absoluta ( f )
F fr Fr fp Fp
[201,300] 250,5 12 12 0,19 0,19 19% 19%
[301,400] 350,5 15 27 0,24 0,43 24% 43%
[401,500] 450,5 20 47 0,32 0,75 32% 75%
[501,600] 550,5 14 61 0,22 0,97 22% 97%
[601,700] 650,5 2 63 0,03 1 3% 100%
100k
k NPOS P
50
50 63 315031,5 32 3 intervalo
100 100POS P
1°. Calculamos la posición del percentil
Cantidad de palabras
Marca de clase
f. Absoluta ( f )
F fr Fr fp Fp
[201,300] 250,5 12 12 0,19 0,19 19% 19%
[301,400] 350,5 15 27 0,24 0,43 24% 43%
[401,500] 450,5 20 47 0,32 0,75 32% 75%
[501,600] 550,5 14 61 0,22 0,97 22% 97%
[601,700] 650,5 2 63 0,03 1 3% 100%
50 inf100 ant
i
k NF
P L Af
• 2°. Calculamos el percentil
• 1.- Calcule el percentil 10:
Cantidad de palabras
Marca de clase
f. Absoluta ( f )
F fr Fr fp Fp
[201,300] 250,5 12 12 0,19 0,19 19% 19%
[301,400] 350,5 15 27 0,24 0,43 24% 43%
[401,500] 450,5 20 47 0,32 0,75 32% 75%
[501,600] 550,5 14 61 0,22 0,97 22% 97%
[601,700] 650,5 2 63 0,03 1 3% 100%
• 2.- Calcule el percentil 75:
Cantidad de palabras
Marca de clase
f. Absoluta ( f )
F fr Fr fp Fp
[201,300] 250,5 12 12 0,19 0,19 19% 19%
[301,400] 350,5 15 27 0,24 0,43 24% 43%
[401,500] 450,5 20 47 0,32 0,75 32% 75%
[501,600] 550,5 14 61 0,22 0,97 22% 97%
[601,700] 650,5 2 63 0,03 1 3% 100%
Otras medidas de posición:
• Cuartiles: son los 3 valores que dividen a la muestra de datos en 4 intervalos iguales.
1 25C P 2 50C P 3 75C P
Otras medidas de posición:
• Quintiles: son los 4 valores que dividen a la muestra de datos en 5 intervalos iguales.
1 20Q P 2 40Q P 4 80Q P3 60Q P
Otras medidas de posición:
• Deciles: son los 9 valores que dividen a la muestra de datos en 10 intervalos iguales.
1 10D P 2 20D P 4 40D P
6 60D P 7 70D P 8 80D P 9 90D P
3 30D P
5 50D P
1. Construya la tabla de frecuencias:
2.Construya la tabla de frecuencias