DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

29
1

Transcript of DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

Page 1: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

1

Page 2: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

2

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO TABLAS DE FRECUENCIA E INDICADORES

Ejemplo:

Se ha tomado una muestra de 20 cajas de fusibles de seguridad para determinado artefacto electrónico (1caja = 10 fusibles). Se ha examinado cada caja, determinando el número de fusibles defectuosos por caja, obtenido la siguiente información:

3-2-0-2-3-3-1-0-1-3-3-4-4-3-2-4-2-4-2-1

Variable X: Número de fusibles defectuosos por caja.

Page 3: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

3

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO

• Construir la tabla de frecuencias

Xi ni hi Ni Hi

0

1

2

3

4

Total

Page 4: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

4

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO

Notación:

: Valor i-ésimo de la variable X

: Frecuencia absoluta del valor i-ésimo de la variable X

: Frecuencia relativa del valor i-ésimo:

: Frecuencia absoluta acumulada hasta el valor i-ésimo valor de la variable

X

: Frecuencia relativa acumulada hasta el i-ésimo valor de la variable X

in

iX

iX

in

ih

n

nh i

i

iN

iH

j

i

jij nnnnN1

21 ....

n

NnnnnH

jj

i

jij 1

21 ....

Page 5: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

5

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO

Distribución de frecuencias de la variable

X: Número de fusibles defectuosos por caja

Interpretar algunos valores de la tabla

Xi ni hi Ni Hi

0 2 0.1 2 0.1

1 3 0.15 5 0.25

2 5 0.25 10 0.50

3 6 0.3 16 0.80

4 4 0.2 20 1.0

Total 20 1.0 * *

Page 6: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

6

GRÁFICAS DE LA S DISTRIBUCIONES DE FRECUENCIAS

• Gráficas de frecuencias Simples

• Gráficas de Frecuencias acumuladas

n

nh i

i

ih

ix

in

ix

iN

ix

m

jjj

xxsin

xxxsiN

xxsi

xN

...............

............

...............0

)( 1

1

Rxmj ;,....3,2,1

iH

ix

m

jjj

xxsi

xxxsiH

xxsi

xH

...............1

............

...............0

)( 1

1

Rxmj ;,....3,2,1

Page 7: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

7

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO

Indicadores de centramiento

• Media aritmética

n: Tamaño de muestra

• Media aritmética (datos agrupados)

m: Número de valores diferentes de X

• Mediana para datos no agrupados

Los datos deben estar ordenados por magnitud

n

i

ixn

X1

1

m

i

ii

m

i

ii hxnxn

X11

..1

paresnsi

XX

imparesnsiX

Mnn

n

e

2

122

2

1

Page 8: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

8

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO

Indicadores de centramiento

• Mediana para datos agrupados

• Moda para datos no agrupados

• Moda para datos agrupados

repitesemásqueDatoM 0

22

2

1

1

1

nNsi

XX

nNsiX

M

j

jj

jj

e

ii hónfrecuenciamayordeDatoM 0

Page 9: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

9

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO

Indicadores de variabilidad

• Rango

• Varianza para datos no agrupados

• Varianza para datos agrupados

Nota: La raiz cuadrda de S2 tomada positiva se denomina “Desviación

estándar”

2

1

2

1

22 1)(

1Xx

nXx

nS

n

i

i

n

i

i

MINMAX XXR

m

i

m

i

iiii

m

i

ii XhxhXxnXxn

S1 1

222

1

22 ..)(.)(1

2SS

Page 10: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

10

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO

Indicadores de variabilidad

• Coeficiente de variación:

La anterior clasificación no se puede generalizar en todos los casos ya

que no funciona con datos cercanos a cero o negativos

100.)(X

SxCV

Variable

homogénea

Variable con

homogeneidad moderada

Variable con

heterogeneidad

%15)( xCV %30)(%15 xCV %30)( xCV

Page 11: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

11

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO

Indicadores de posicionamiento

• Percentiles

El p-ésimo percentil., es un valor (que se asume para X) tal que

cómo máximo un p por ciento de los elementos (unidades

observadas o medidas) tienen dicho valor o un valor menor y como

máximo, un (100-p) por ciento de las unidades tienen este valor ó

un valor mayor

Ejemplo

Hallar el percentil P = 40

Pasos:

1) Ordene el conjunto de datos en forma creciente y represénteles

por:

x1, x2, …..xn

100.)(X

SxCV

Page 12: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

12

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO

Indicadores de posicionamiento

• Percentiles

2) Calculamos el índice i de la siguiente manera:

3) Si i no es entero, se redondea. El valor entero inmediatamente

mayor a i indica la posición del p-ésimo percentil. Si i sí es entero,

el p-ésimo percentil es el el promedio de los valores de las unidades

ubicadas en los lugares i e i+1

100.)(X

SxCV

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10

0 0 1 1 1 2 2 2 2 2

X11 X12 X13 X14 X15 X16 X17 X18 X19 X20

3 3 3 3 3 3 4 4 4 4

820.100

40.

n

n

pi

2

98

40

XXP

Page 13: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

13

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO DISCRETO

Indicadores de posicionamiento

• Cuartiles

Con frecuencia se dividen los datos en cuatro partes, cada una con

aproximadamente la cuarta parte de n ( tamaño de muestra), o el

25% de los elementos. A los puntos de división se les llama

cuartiles y se definen como sigue:

Q1 : Primer cuartil ó 25% percentil

Q2 : Segundo cuartil ó 50% percentil (MEDIANA)

Q3: Tercer cuartil ó 75% percentil

100.)(X

SxCV

820.100

40.

n

n

pi

25%

25%

1Q 2Q 3Q

25%

25%

Page 14: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

14

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO CONTINUO

Ejemplo

La siguiente información corresponde a mediciones de PH en 20 muestras de

una solución reguladora, redondeada a décimas:

3.1-4.0-4.1-3.4-3.6-3.5-3.6-4.2-3.7-2.6-3.5-4.7-1.6-3.8-2.4-3.0-4.0-4.5-3.3-3.9

X: variable medición de PH.

Obtener la tabla de frecuencias

Determine el rango de la variable

Determine el número de clases “Este está determinado por los objetivos que se

tengan para el análisis e interpretación de la información”. Por norma:

Supongamos que en éste caso m = 7.

100.)(X

SxCV

820.100

40.

n

n

pi

MINMAX XXR

clasesdeNúmeromm ;205

Page 15: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

15

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO CONTINUO

Obtener la tabla de frecuencias

Calcule el ancho del intervalo: “Por norma el ancho de clase se

aproxima por encima y debe tener el mismo número de decimales que los

datos”

Calcule los límites de clase y las marcas de clase. “Por norma el límite

inferior de la primera clase, debe tomarse un poco menor a XMIN. En este

caso, tomaremos el valor 1.55. Note que en realidad, representa cualquier

dato comprendido en el siguiente intervalo:

La marca de clase (semisuma de los límites de clase). Se obtiene

mediante

100.)(X

SxCV

820.100

40.

n

n

pi

45.044.07

1.3

m

RC

05.06.1

iLL

M iii

,

2

1

Page 16: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

16

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO CONTINUO

Distribución de 20 mediciones de PH

Observaciones:

• Al agrupar los datos se pierde información

• Pocas clases globalizan mucho la información (datos muy

diferentes serán representados por la misma marca de clase)

• Muchas clases hacen compleja la manipulación de la información

(Muchas de ellas tendrán la misma frecuencia o frecuencia cero)

• No deben existir clases en donde la frecuencia sea cero, para evitar

este hecho, debe reagruparse la información (recuerde que se quiere

explorar cómo es la distribución de frecuencias en la población y

éste hecho, distorsiona tal objetivo).

100.)(X

SxCV

820.100

40.

n

n

pi

Page 17: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

17

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO CONTINUO

Nota:

Si el ancho de clase es constante, se facilitan los cálculos e interpretaciones ya

que la comparación entre clases es muy fácil). “Cuando el ancho de clase C, no

es el mismo para cada clase, estas no son comparables mirando ó . Para

hacerlas comparables se debe calcular la densidad de frecuencia ”

iC

hh

i

ii ,*

820.100

40.

n

n

pi

in ih

Clase Li-1-Li Mi ni hi Ni Hi

Total

Page 18: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

18

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO CONTINUO

Distribución de 20 mediciones de PH

Interprete algunos valores de la tabla

820.100

40.

n

n

pi Clase Li-1-Li Mi ni hi Ni Hi

1 1.55-2.0 1.775 1 0.05 1 0.05

2 2.0-2.45 2.225 1 0.05 2 0.1

3 2.45-2.9 2.675 1 0.05 3 0.15

4 2.9-3.35 3.125 3 0.15 6 0.30

5 3.35-3.8 3.575 7 0.35 13 0.65

6 3.8-4.25 4.025 5 0.25 18 0.90

7 4.25-4.7 4.475 2 0.1 20 1.0

Total * * 20 1.0 * *

Page 19: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

19

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO CONTINUO

Gráficas para la Distribución de 20 mediciones de PH

Histogramas de frecuencias simples

Histogramas de frecuencias acumuladas (Polígono de Frecuencias, Ojiva)

820.100

40.

n

n

pi

ihin

iM iM

iHiN

iMiM

Page 20: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

20

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO CONTINUO

Estime el porcentaje de mediciones (muestras) que tienen un PH comprendido

entre 3.2 y 3.7 U

Calcule los siguientes indicadores

Media aritmética

Mediana para datos agrupados

820.100

40.

n

n

pi

m

i

m

i

iiii hMnMn

X1 1

..1

i

ii

ieh

CLHLM

.(5.0 )1

1

Page 21: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO CONTINUO

¿Cómo deducir la fórmula de la mediana?

820.100

40.

n

n

pi

i

ii

ieh

CLHLM

.(5.0 )1

1

1iL iL

5.0)( 1 iLH 5.0)( iLH5.0)( xH

¿Cuál es el valor de x?

x

Page 22: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

22

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO CONTINUO

Percentiles, Deciles y Cuartiles

Con el mismo criterio utilizado para encontrar Me , encuentre el percentil 60

(P60), el cuartil 3 (Q3) y el decil 8 (D8). Interprete cada valor.

La Moda Mo para datos agrupados. En este caso la Mo, estará en el intervalo

mayor frecuencia de datos ( ni o hi) o mayor densidad de frecuencia

820.100

40.

n

n

pi

i

ii

C

hh *

1iL iL

1 2

ih

X

Page 23: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

DISTRIBUCIONES UNIDIMENSIONALES DE

FRECUENCIA: CASO CONTINUO

Apoyándose en el gráfico anterior, deduzca la siguiente fórmula:

Encuentre la varianza de X

Calcule el Coeficiente de Variación

820.100

40.

n

n

pi

clasedeAnchoChhhh

CLM

iiii

i

,,

;.

1211

21

110

i

m

i

ii

m

i

iX hXMnXMn

S .)(.)(1

1

2

1

22

Page 24: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

Profesor: Rafael Klinger

LA IMPORTANCIA DE LAS POSICIONES

RELATIVAS DE LA MEDIA, MEDIANA Y MODA

820.100

40.

n

n

pi

Media =20

Mediana =20

Moda =20

TOTALMENTE

SIMÉTRICA = SESGO =0

SESGADA A LA DERECHA

SESGO = +

Moda

300

Mediana

500

Media

700

SESGADA A LA IZQUIERDA

SESGO = -

Moda

700

Mediana

500

Media

300

Page 25: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

Profesor: Rafael Klinger

x

Fre

qu

en

cy

1612840-4

20

15

10

5

0

Mean 6,619

StDev 4,063

N 100

Histogram of xNormal

¿Y LA VARIABILIDAD QUE?

820.100

40.

n

n

pi

x

Fre

qu

en

cy

5,845,825,805,785,765,74

25

20

15

10

5

0

Mean 5,801

StDev 0,01875

N 100

Histogram of xNormal

Descriptive Statistics: x Total

Variable Count Mean StDev Variance Minimum Median Maximum Range

x 100 5,8011 0,0188 0,000352 5,7403 5,8002 5,8514 0,1111

Descriptive Statistics: x Total

Variable Count Mean StDev Variance Minimum Median Maximum Range

x 100 6,619 4,063 16,512 -4,453 6,795 15,382 19,835

¿QUÉ DISTRIBUCIÓN

ES MÁS VARIABLE?

¿CÓMO SE SABE?

Page 26: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

Profesor: Rafael Klinger

UN VIASTAZO RÁPIDO A LA RELACIÓN

ENTRE DOS VARIABLES

820.100

40.

n

n

pi

Ejemplo:

La siguiente información corresponde al registro de las variables X: Estatura (pulgadas) y

Y: peso (libras) en un grupo de 12 personas que desarrollan determinada actividad laboral

X Y X Y X Y

77 185 72 190 71 180

71 175 75 195 69 175

75 200 67 160 68 170

72 210 69 170 72 187

Encuentre la recta de regresión de la forma:

xBBy .10 S//

Algunos elementos teóricos

Page 27: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

Profesor: Rafael Klinger 27

UN VIASTAZO RÁPIDO A LA RELACIÓN

ENTRE DOS VARIABLES

820.100

40.

n

n

pi

xBBy .10

Modelo solicitado

Hallar B0 y B1

n

i

n

i

n

i

iiii

n

i

n

i

ii

xBxBxy

xBBny

1 1 1

2

10

1 1

10

..

..

Ecuaciones normales

xByB

xx

xxyy

Bn

i

i

n

i

ii

.,

)(

)).((

10

1

2

1

1

Page 28: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

Profesor: Rafael Klinger

UN VIASTAZO RÁPIDO A LA RELACIÓN

ENTRE DOS VARIABLES

820.100

40.

n

n

pi

Estatura (pulgadas)

Pe

so

(lib

ras)

78767472706866

200

190

180

170

160

S 5,73459

R-Sq 79,2%

R-Sq(adj) 77,2%

Ecuación de regresiónPe = - 70,19 + 3,525 Es

10

10

.61448.858156369

.858.122182

BB

BB

1865,70

5247,3

0

1

B

B

Recta de regresión

ajustada

¿Y que tan bueno es

el ajuste de dicha recta?

%23.797923.0

67,1583

85,3281

)(

)(

1

1

2

1

2*

2

n

i

i

n

i

ii

yy

yy

R

Page 29: DISTRIBUCIONES UNIDIMENSIONALES-CASO DISCRETO CONTINUO-CLASE-3.pdf

Profesor: Rafael Klinger

UN VIASTAZO RÁPIDO A LA RELACIÓN

ENTRE DOS VARIABLES

820.100

40.

n

n

pi

Nota:

10 2 R

02 RLa variable X no aporta información

para predecir el valor de Y

12 RAjuste perfecto: El valor de Y está

plenamente determinado por el valor

de X