DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf
-
Upload
estephania-calvo-carvajal -
Category
Documents
-
view
41 -
download
2
Transcript of DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf
1
2
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO TABLAS DE FRECUENCIA E INDICADORES
Ejemplo:
Se ha tomado una muestra de 20 cajas de fusibles de seguridad para determinado artefacto electrónico (1caja = 10 fusibles). Se ha examinado cada caja, determinando el número de fusibles defectuosos por caja, obtenido la siguiente información:
3-2-0-2-3-3-1-0-1-3-3-4-4-3-2-4-2-4-2-1
Variable X: Número de fusibles defectuosos por caja.
3
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
• Construir la tabla de frecuencias
Xi ni hi Ni Hi
0
1
2
3
4
Total
4
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Notación:
: Valor i-ésimo de la variable X
: Frecuencia absoluta del valor i-ésimo de la variable X
: Frecuencia relativa del valor i-ésimo:
: Frecuencia absoluta acumulada hasta el valor i-ésimo valor de la variable
X
: Frecuencia relativa acumulada hasta el i-ésimo valor de la variable X
in
iX
iX
in
ih
n
nh i
i
iN
iH
j
i
jij nnnnN1
21 ....
n
NnnnnH
jj
i
jij 1
21 ....
5
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Distribución de frecuencias de la variable
X: Número de fusibles defectuosos por caja
Interpretar algunos valores de la tabla
Xi ni hi Ni Hi
0 2 0.1 2 0.1
1 3 0.15 5 0.25
2 5 0.25 10 0.50
3 6 0.3 16 0.80
4 4 0.2 20 1.0
Total 20 1.0 * *
6
GRÁFICAS DE LA S DISTRIBUCIONES DE FRECUENCIAS
• Gráficas de frecuencias Simples
• Gráficas de Frecuencias acumuladas
n
nh i
i
ih
ix
in
ix
iN
ix
m
jjj
xxsin
xxxsiN
xxsi
xN
...............
............
...............0
)( 1
1
Rxmj ;,....3,2,1
iH
ix
m
jjj
xxsi
xxxsiH
xxsi
xH
...............1
............
...............0
)( 1
1
Rxmj ;,....3,2,1
7
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de centramiento
• Media aritmética
n: Tamaño de muestra
• Media aritmética (datos agrupados)
m: Número de valores diferentes de X
• Mediana para datos no agrupados
Los datos deben estar ordenados por magnitud
n
i
ixn
X1
1
m
i
ii
m
i
ii hxnxn
X11
..1
paresnsi
XX
imparesnsiX
Mnn
n
e
2
122
2
1
8
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de centramiento
• Mediana para datos agrupados
• Moda para datos no agrupados
• Moda para datos agrupados
repitesemásqueDatoM 0
22
2
1
1
1
nNsi
XX
nNsiX
M
j
jj
jj
e
ii hónfrecuenciamayordeDatoM 0
9
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de variabilidad
• Rango
• Varianza para datos no agrupados
• Varianza para datos agrupados
Nota: La raiz cuadrda de S2 tomada positiva se denomina “Desviación
estándar”
2
1
2
1
22 1)(
1Xx
nXx
nS
n
i
i
n
i
i
MINMAX XXR
m
i
m
i
iiii
m
i
ii XhxhXxnXxn
S1 1
222
1
22 ..)(.)(1
2SS
10
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de variabilidad
• Coeficiente de variación:
La anterior clasificación no se puede generalizar en todos los casos ya
que no funciona con datos cercanos a cero o negativos
100.)(X
SxCV
Variable
homogénea
Variable con
homogeneidad moderada
Variable con
heterogeneidad
%15)( xCV %30)(%15 xCV %30)( xCV
11
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de posicionamiento
• Percentiles
El p-ésimo percentil., es un valor (que se asume para X) tal que
cómo máximo un p por ciento de los elementos (unidades
observadas o medidas) tienen dicho valor o un valor menor y como
máximo, un (100-p) por ciento de las unidades tienen este valor ó
un valor mayor
Ejemplo
Hallar el percentil P = 40
Pasos:
1) Ordene el conjunto de datos en forma creciente y represénteles
por:
x1, x2, …..xn
100.)(X
SxCV
12
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de posicionamiento
• Percentiles
2) Calculamos el índice i de la siguiente manera:
3) Si i no es entero, se redondea. El valor entero inmediatamente
mayor a i indica la posición del p-ésimo percentil. Si i sí es entero,
el p-ésimo percentil es el el promedio de los valores de las unidades
ubicadas en los lugares i e i+1
100.)(X
SxCV
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
0 0 1 1 1 2 2 2 2 2
X11 X12 X13 X14 X15 X16 X17 X18 X19 X20
3 3 3 3 3 3 4 4 4 4
820.100
40.
n
n
pi
2
98
40
XXP
13
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO DISCRETO
Indicadores de posicionamiento
• Cuartiles
Con frecuencia se dividen los datos en cuatro partes, cada una con
aproximadamente la cuarta parte de n ( tamaño de muestra), o el
25% de los elementos. A los puntos de división se les llama
cuartiles y se definen como sigue:
Q1 : Primer cuartil ó 25% percentil
Q2 : Segundo cuartil ó 50% percentil (MEDIANA)
Q3: Tercer cuartil ó 75% percentil
100.)(X
SxCV
820.100
40.
n
n
pi
25%
25%
1Q 2Q 3Q
25%
25%
14
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Ejemplo
La siguiente información corresponde a mediciones de PH en 20 muestras de
una solución reguladora, redondeada a décimas:
3.1-4.0-4.1-3.4-3.6-3.5-3.6-4.2-3.7-2.6-3.5-4.7-1.6-3.8-2.4-3.0-4.0-4.5-3.3-3.9
X: variable medición de PH.
Obtener la tabla de frecuencias
Determine el rango de la variable
Determine el número de clases “Este está determinado por los objetivos que se
tengan para el análisis e interpretación de la información”. Por norma:
Supongamos que en éste caso m = 7.
100.)(X
SxCV
820.100
40.
n
n
pi
MINMAX XXR
clasesdeNúmeromm ;205
15
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Obtener la tabla de frecuencias
Calcule el ancho del intervalo: “Por norma el ancho de clase se
aproxima por encima y debe tener el mismo número de decimales que los
datos”
Calcule los límites de clase y las marcas de clase. “Por norma el límite
inferior de la primera clase, debe tomarse un poco menor a XMIN. En este
caso, tomaremos el valor 1.55. Note que en realidad, representa cualquier
dato comprendido en el siguiente intervalo:
La marca de clase (semisuma de los límites de clase). Se obtiene
mediante
100.)(X
SxCV
820.100
40.
n
n
pi
45.044.07
1.3
m
RC
05.06.1
iLL
M iii
,
2
1
16
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Distribución de 20 mediciones de PH
Observaciones:
• Al agrupar los datos se pierde información
• Pocas clases globalizan mucho la información (datos muy
diferentes serán representados por la misma marca de clase)
• Muchas clases hacen compleja la manipulación de la información
(Muchas de ellas tendrán la misma frecuencia o frecuencia cero)
• No deben existir clases en donde la frecuencia sea cero, para evitar
este hecho, debe reagruparse la información (recuerde que se quiere
explorar cómo es la distribución de frecuencias en la población y
éste hecho, distorsiona tal objetivo).
100.)(X
SxCV
820.100
40.
n
n
pi
17
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Nota:
Si el ancho de clase es constante, se facilitan los cálculos e interpretaciones ya
que la comparación entre clases es muy fácil). “Cuando el ancho de clase C, no
es el mismo para cada clase, estas no son comparables mirando ó . Para
hacerlas comparables se debe calcular la densidad de frecuencia ”
iC
hh
i
ii ,*
820.100
40.
n
n
pi
in ih
Clase Li-1-Li Mi ni hi Ni Hi
Total
18
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Distribución de 20 mediciones de PH
Interprete algunos valores de la tabla
820.100
40.
n
n
pi Clase Li-1-Li Mi ni hi Ni Hi
1 1.55-2.0 1.775 1 0.05 1 0.05
2 2.0-2.45 2.225 1 0.05 2 0.1
3 2.45-2.9 2.675 1 0.05 3 0.15
4 2.9-3.35 3.125 3 0.15 6 0.30
5 3.35-3.8 3.575 7 0.35 13 0.65
6 3.8-4.25 4.025 5 0.25 18 0.90
7 4.25-4.7 4.475 2 0.1 20 1.0
Total * * 20 1.0 * *
19
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Gráficas para la Distribución de 20 mediciones de PH
Histogramas de frecuencias simples
Histogramas de frecuencias acumuladas (Polígono de Frecuencias, Ojiva)
820.100
40.
n
n
pi
ihin
iM iM
iHiN
iMiM
20
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Estime el porcentaje de mediciones (muestras) que tienen un PH comprendido
entre 3.2 y 3.7 U
Calcule los siguientes indicadores
Media aritmética
Mediana para datos agrupados
820.100
40.
n
n
pi
m
i
m
i
iiii hMnMn
X1 1
..1
i
ii
ieh
CLHLM
.(5.0 )1
1
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
¿Cómo deducir la fórmula de la mediana?
820.100
40.
n
n
pi
i
ii
ieh
CLHLM
.(5.0 )1
1
1iL iL
5.0)( 1 iLH 5.0)( iLH5.0)( xH
¿Cuál es el valor de x?
x
22
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Percentiles, Deciles y Cuartiles
Con el mismo criterio utilizado para encontrar Me , encuentre el percentil 60
(P60), el cuartil 3 (Q3) y el decil 8 (D8). Interprete cada valor.
La Moda Mo para datos agrupados. En este caso la Mo, estará en el intervalo
mayor frecuencia de datos ( ni o hi) o mayor densidad de frecuencia
820.100
40.
n
n
pi
i
ii
C
hh *
1iL iL
1 2
ih
X
DISTRIBUCIONES UNIDIMENSIONALES DE
FRECUENCIA: CASO CONTINUO
Apoyándose en el gráfico anterior, deduzca la siguiente fórmula:
Encuentre la varianza de X
Calcule el Coeficiente de Variación
820.100
40.
n
n
pi
clasedeAnchoChhhh
CLM
iiii
i
,,
;.
1211
21
110
i
m
i
ii
m
i
iX hXMnXMn
S .)(.)(1
1
2
1
22
Profesor: Rafael Klinger
LA IMPORTANCIA DE LAS POSICIONES
RELATIVAS DE LA MEDIA, MEDIANA Y MODA
820.100
40.
n
n
pi
Media =20
Mediana =20
Moda =20
TOTALMENTE
SIMÉTRICA = SESGO =0
SESGADA A LA DERECHA
SESGO = +
Moda
300
Mediana
500
Media
700
SESGADA A LA IZQUIERDA
SESGO = -
Moda
700
Mediana
500
Media
300
Profesor: Rafael Klinger
x
Fre
qu
en
cy
1612840-4
20
15
10
5
0
Mean 6,619
StDev 4,063
N 100
Histogram of xNormal
¿Y LA VARIABILIDAD QUE?
820.100
40.
n
n
pi
x
Fre
qu
en
cy
5,845,825,805,785,765,74
25
20
15
10
5
0
Mean 5,801
StDev 0,01875
N 100
Histogram of xNormal
Descriptive Statistics: x Total
Variable Count Mean StDev Variance Minimum Median Maximum Range
x 100 5,8011 0,0188 0,000352 5,7403 5,8002 5,8514 0,1111
Descriptive Statistics: x Total
Variable Count Mean StDev Variance Minimum Median Maximum Range
x 100 6,619 4,063 16,512 -4,453 6,795 15,382 19,835
¿QUÉ DISTRIBUCIÓN
ES MÁS VARIABLE?
¿CÓMO SE SABE?
Profesor: Rafael Klinger
UN VIASTAZO RÁPIDO A LA RELACIÓN
ENTRE DOS VARIABLES
820.100
40.
n
n
pi
Ejemplo:
La siguiente información corresponde al registro de las variables X: Estatura (pulgadas) y
Y: peso (libras) en un grupo de 12 personas que desarrollan determinada actividad laboral
X Y X Y X Y
77 185 72 190 71 180
71 175 75 195 69 175
75 200 67 160 68 170
72 210 69 170 72 187
Encuentre la recta de regresión de la forma:
xBBy .10 S//
Algunos elementos teóricos
Profesor: Rafael Klinger 27
UN VIASTAZO RÁPIDO A LA RELACIÓN
ENTRE DOS VARIABLES
820.100
40.
n
n
pi
xBBy .10
Modelo solicitado
Hallar B0 y B1
n
i
n
i
n
i
iiii
n
i
n
i
ii
xBxBxy
xBBny
1 1 1
2
10
1 1
10
..
..
Ecuaciones normales
xByB
xx
xxyy
Bn
i
i
n
i
ii
.,
)(
)).((
10
1
2
1
1
Profesor: Rafael Klinger
UN VIASTAZO RÁPIDO A LA RELACIÓN
ENTRE DOS VARIABLES
820.100
40.
n
n
pi
Estatura (pulgadas)
Pe
so
(lib
ras)
78767472706866
200
190
180
170
160
S 5,73459
R-Sq 79,2%
R-Sq(adj) 77,2%
Ecuación de regresiónPe = - 70,19 + 3,525 Es
10
10
.61448.858156369
.858.122182
BB
BB
1865,70
5247,3
0
1
B
B
Recta de regresión
ajustada
¿Y que tan bueno es
el ajuste de dicha recta?
%23.797923.0
67,1583
85,3281
)(
)(
1
1
2
1
2*
2
n
i
i
n
i
ii
yy
yy
R
Profesor: Rafael Klinger
UN VIASTAZO RÁPIDO A LA RELACIÓN
ENTRE DOS VARIABLES
820.100
40.
n
n
pi
Nota:
10 2 R
02 RLa variable X no aporta información
para predecir el valor de Y
12 RAjuste perfecto: El valor de Y está
plenamente determinado por el valor
de X