T-Student

60
Aplicaciones de la T de Student

Transcript of T-Student

Page 1: T-Student

Aplicaciones de la T de Student

Page 2: T-Student

Distribución t- de -Student

2

Antecedentes

• Propuesta por William Sealy Gosset (1908)

• Se emplea cuando se trabaja con muestras pequeñas

• Se utiliza para estimar el valor esperado de una distribución normal de población

Page 3: T-Student

Distribución t- de -Student

3

¿ Cuándo se utiliza?• Para muestras pequeñas

• Para estimar el valor esperado de una distribución normal de población

• Estimación de la media cuando se desconoce la varianza

• Comparación entre dos poblaciones

• Contraste de hipótesis

Page 4: T-Student

Distribución t- de -Student

4

¿Cuál es la distribución exacta del

estadístico ?s

X

conocida la de insesgadoestimador un es

den distribucó la de media la es

X

X

Page 5: T-Student

Distribución t- de -Student

5

Supuestos de la inferencia para la media

• Los datos son una muestra (n) aleatoria

• Población con distribución normal N(μ,σ)

Page 6: T-Student

Distribución t- de -Student

6

Características de Ẋ• La media muestral tiene una distribución

normal con media μ y desviación típica

• σ se estima a partir de la desviación típica muestral s

• La desviación típica de Ẋ se estima por

n

ns

Error típico de la muestra

Page 7: T-Student

Distribución t- de -Student

7

Error típico de la muestra

• Es la estimación de la desviación típica del estadístico a partir de los datos

• El error típico de la media muestral Ẋ es:

ns

Page 8: T-Student

Distribución t- de -Student

8

Propiedades

• La distribución t–Student es diferente para los distintos tamaños de la muestra

• Es generalmente en forma de campana

• Para n≥30 se comporta como la normal

• La media es cero

• La distribución es simétrica en torno a la media

Page 9: T-Student

Distribución t- de -Student

9

Propiedades

• La varianza es igual a uno cuando t→∞

• La población es esencialmente normal

• Es una distribución continua

• Par n=1 no existe media (Distribución de Cauchy)

• Para n=2,3,... μ=0

• Para n=1 y 2 la distribución t no tiene varianza

Page 10: T-Student

Distribución t- de -Student

10

• Varianza para n=2,3...

22

nn

Page 11: T-Student

Distribución t- de -Student

11

Grados de libertad

• Número de valores que se pueden variar después de imponer ciertas restricciones

• Número de valores que se pueden escoger libremente al calcular un estadístico

• Libertad de movimiento

Page 12: T-Student

Distribución t- de -Student

12

Grados de libertad

Page 13: T-Student

Distribución t- de -Student

13

10 yx

Num. Variables=2Num. Restricciones=1

Grados de libertad =r= Num. Variables- Num. de restriccionesGrados de libertad=r=2-1r=1

Page 14: T-Student

Distribución t- de -Student

14

10 yx

x

y

-30 -25 -20 -15 -10 -5 0 5 10 15 20 25 30

-15

-10

-5

0

5

10

15

Page 15: T-Student

Distribución t- de -Student

15

x

y

-14 -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 12 14

-10

-5

0

5

10

(1)

(2)

3

42

yx

yx

Page 16: T-Student

Distribución t- de -Student

16

x

y

-3 -2 -1 0 1 2 3

-2

0

2

(1)

(2)

(2) 12

(1) 124

2

xxy

xy

Page 17: T-Student

Distribución t- de -Student

17

cX i

n

i

1r=N-1

n

i

i

n

XX

1

Page 18: T-Student

Distribución t- de -Student

18

Page 19: T-Student

Distribución t- de -Student

19

DefiniciónSe Z una variable aleatoria con N(0,1) y si U es una variable aleatoria que se distribuye en forma χ2(r), con la condición de que Z y U sean independientes.

Por lo tanto:

Se tiene una distribución T con rr grados de libertad

ns

X

rU

ZT

población la deestándar desviación la deestimador el es y

muestra la de media la es y lpoblaciona media la es donde

s

X

ns

X

rUZT

Page 20: T-Student

Distribución t- de -Student

20

DefiniciónEstimador de la desviación estándar de la población:

n

ii Xx

ns

1

22

1

1

normalón distribuci laen

a transformseón distribuci la ,y Si z ts

Es un estimador insesgado de μX

Page 21: T-Student

Distribución t- de -Student

21

DefiniciónComo N aumenta, entonces la distribución t se aproxima cada vez más a la distribución normal

Page 22: T-Student

Distribución t- de -Student

22

DefiniciónEntonces la distribución t se puede obtener mediante la transformación:

sX

Z

y t se define entonces como:

1 nzt

Page 23: T-Student

Distribución t- de -Student

23

DefiniciónFunción de densidad de probabilidad:

2

12

12

21

)(

r

rtrr

r

tf

Page 24: T-Student

Distribución t- de -Student

24

r=25r=5r=1

Page 25: T-Student

Distribución t- de -Student

25

DefiniciónDistribución acumulativa de probabilidad:

rt

rrt

itB

tF

trtr

rIrItF

21

2

121

121

,21

;2

21

)(

sgn21

,21

,21

,21

;121

21

)(

2

2

daregulariza BetaFunción

,,;

,;*

BetaFunción ,*

GammaFunción *

*

1*

baBbazB

baZI

baB

z

t

nr

Page 26: T-Student

Distribución t- de -Student

26

r=1r=25 r=5

Page 27: T-Student

Distribución t- de -Student

27

Pruebas de significación: hipótesis“Pruebas de una cola o de dos colas”

• H0 regularmente afirma la ausencia de efectos

• Ha establece que un determinado parámetro difiere del valor que le otorga la hipótesis nula en una dirección concreta

Page 28: T-Student

Distribución t- de -Student

28

Estadístico de contraste

• P este valor es la probabilidad calculada suponiendo que H0 sea cierta, de que el estadístico de contraste tome un valor al menos tan extremo como el valor observado

• Valores P pequeños indican la existencia de una fuerte evidencia en contra de H0

• Si el valor P es pequeño, o más pequeños que un valor concreto α, los datos son estadísticamente significativos a un nivel de significación α.

Page 29: T-Student

Distribución t- de -Student

29

¿cuánto debe ser el valor de P?

• Nivel de significación más utilizado : 5% (α=.05)

Page 30: T-Student

Distribución t- de -Student

30

Errores tipo I y tipo II

• Tipo I: Se presenta cuando se rechaza H0 cuando en realidad es cierta.

• Tipo II: Se da cuando no se rechaza H0 cuando en realidad Ha es cierta

Page 31: T-Student

Distribución t- de -Student

31

Escenarios posibles :

Error tipo I Decisión correcta

Decisión correcta

Error tipo II

H0 es cierta Ha es cierta

Certeza sobre la población

Decisión basada

en la muestra

Rechazo H0

Aceptación H0

No rechazo h0

Page 32: T-Student

Distribución t- de -Student

32

Ejemplo 1

Refrescos light: los fabricantes de refrescos prueban nuevas fórmulas para evitar la pérdida de dulzor de los refrescos light durante el almacenamiento. Uno de los catadores experimentados evalúan el dulzor de los refrescos antes y después del almacenamiento. He aquí las pérdidas de dulzor ( dulzor antes del almacenamiento menos dulzor después del almacenamiento) hallados por 10 catadores para una nueva fórmula del refresco.

Page 33: T-Student

Distribución t- de -Student

33

Datosx Antes-

después

X1 2.0

X2 0.4

X3 0.7

X4 2.0

X5 -0.4

x6 2.2

X7 -1.3

X8 1.2

X9 1.1

x10 2.3

¿Estos datos constituyen una buena evidencia de que el refresco perdió dulzura durante el almacenamiento?

Page 34: T-Student

Distribución t- de -Student

34

• Paso 1: Hipótesis Existen diferencias sobre la percepción de la pérdida de dulzura por parte de los catadores

Hipótesis: Pérdida media de dulzor μ

H0: μ=0

Ha: μ>0

Page 35: T-Student

Distribución t- de -Student

35

• Paso 2: Estadístico de contraste:

10

3.21.12.13.13.24.00.27.04.00.21

n

i

i

n

XX

02.1X

n

ii Xx

ns

1

22

1

1

1961.14306.1 s

ns

Xt 0

6967.2101961.1

002.1 t

Page 36: T-Student

Distribución t- de -Student

36

2XX i iX

2 0.96040.4 0.38440.7 0.1024

2 0.9604-0.4 2.01642.2 1.3924

-1.3 5.38241.2 0.03241.1 0.00642.3 1.6384

Ẋ= 1.02 S2= 1.43066667S= 1.19610479

Page 37: T-Student

Distribución t- de -Student

37

2.69672.2622 2.814

• Paso 3: Valor P: t=2.6967 (Tabla)

Page 38: T-Student

Distribución t- de -Student

38

2 2.05 2.1 2.15 2.2 2.25 2.3 2.35 2.4 2.45 2.5 2.55 2.6 2.65 2.7 2.75 2.8 2.85 2.9 2.95 3

0.005

0.01

0.015

0.02

0.025

0.03

t=2.69672.2622 2.8214

(t1,p1)

(t2,p2)

(t, p)

T

P

¿p?

Page 39: T-Student

Distribución t- de -Student

39

t=2.6967p=?

En tablas

t1=2.2622 p1=.025t2=2.8214 p2=.01

1

21

21

1xx

xxyy

yy

1

21

21

1tt

ttpp

pp

01334.02622.26967.2

8214.22622.2

01.025.025.

p

Page 40: T-Student

Distribución t- de -Student

40

Conclusión del cambio de dulzor

• Como P=0.01334 ,existe evidencia bastante fuerte a favor de que se produce una pérdida de dulzor.

Page 41: T-Student

Distribución t- de -Student

41

Ejemplo 2• La tasa actual de producir fusibles de 5 amp en

DFEletric, es 250 por hora. Se compro e instaló una máquina nueva que según el proveedor aumentará la tasa de producción. Una nuestra de 10 horas seleccionadas al azar el mes pasado indica que la producción media por hora en la nueva máquina es 256, con desviación estándar muestral de 6 por hora. Con 0.05 de nivel de significancia. ¿Puede DFElectric concluir que la nueva máquina es más rápida?

Page 42: T-Student

Distribución t- de -Student

42

solución

• Paso 1:

H0:μ≤250

Ha:μ≥250

• Paso 2: H0 se rechaza si t>1.833

Page 43: T-Student

Distribución t- de -Student

43

Solución

16.3

106

250256

6

256

250

ns

Xt

s

X

• Paso 3:

Page 44: T-Student

Distribución t- de -Student

44

H0 se rechaza y por lo tanto la nueva máquina es más rápida

Page 45: T-Student

Distribución t- de -Student

45

Ejemplo 3: Comparación de dos media poblacionales

• Un estudio EPA reciente compara la economía de combustible en carretera de los automóviles nacionales e importados. Una nuestra de 15 autos nacionales reveló una media de 33.7 mpg con desviación estándar de 2.4 mpg. Una muestra de 12 autos importados indicó una media de 35.7 mpg con desviación estándar de 3.9 mpg.

Page 46: T-Student

Distribución t- de -Student

46

• Para un nivel de significancia de 0.05, ¿puede EPA concluir que el consumo de las mpg para los autos importados es mayor?

• Paso1:

H0:μ2≤μ1

Ha:μ2>μ1

Page 47: T-Student

Distribución t- de -Student

47

• Paso 2: H0 se rechaza si t<-1.708

• Paso 3:

21

2

21

11nn

s

XXt

p

2

11

21

222

2112

nn

snsnsp

Page 48: T-Student

Distribución t- de -Student

48

918.9

25

95.247

25

31.16764.80

25

9.3114.214

21215

9.31124.2115

2

11

2

222

22

21

222

2112

p

p

p

s

s

nn

snsns

8037.12197.1

2.24877.1

2.2

203

918.9

2.2

121

151

918.9

7.357.33

11

21

2

21

t

nns

XXt

p

Page 49: T-Student

Distribución t- de -Student

49

• Paso 4: H0 se rechaza. Entonces el consumo de mpg en los autos importados es más alto.

Page 50: T-Student

Distribución t- de -Student

50

Ejemplo 4: Pruebas de hipótesis con observaciones por pares

• Una empresa de pruebas independientes estadísticas compara el precio diario de renta de un auto compacto en Eclipse Rent y Avis. Se obtiene una muestra aleatoria de 8 ciudades con la información dada. Con 0.05 de nivel de significancia, ¿puede la empresa concluir que existe una diferencia en los costos de la renta?

Page 51: T-Student

Distribución t- de -Student

51

Ciudad Eclipse Rent ($) Avis ($)

Acapulco

Los Cabos

420

560

400

520

D.F.

Cancún

450

480

430

480

Guadalajara

Monterrey

370

450

320

480

Puebla 410 390

Tijuana 460 500

Page 52: T-Student

Distribución t- de -Student

52

Solución:

Paso 1: H0:μd=0H1:μd≠0

Paso 2: H0 se rechaza si: t<-2.365 y t>2.365

Page 53: T-Student

Distribución t- de -Student

53

• Paso 3: Cálculo del estadístico t mediante la expresión:

as)(diferenci pares de número el Es

sdiferencia las deestándar Desviación

sdiferencia las de Promedio

n

s

d

ns

dt

d

d

Page 54: T-Student

Distribución t- de -Student

54

Ciudad Eclipse Rent ($)

Avis ($) Diferencias

($)

Acapulco

Los Cabos

420

560

400

520

20

40

D.F.

Cancún

450

480

430

480

20

0

Guadalajara

Monterrey

370

450

320

480

50

-30

Puebla 410 390 20

Tijuana 460 500 -40

Page 55: T-Student

Distribución t- de -Student

55

Ciudad Eclipse Rent ($)Avis ($) Diferencias ($) (di-d)2

Acapulco 420 400 20 20 100Los Cabos 560 520 40 40 900D.F. 450 430 20 20 100Cancún 480 480 0 0 100Guadalajara 370 320 50 50 1600Monterrey 450 480 -30 -30 1600Puebla 410 390 20 20 100Tijuana 460 500 -40 -40 2500

μ= 10 ∑ 7000s= 31.6227766

Page 56: T-Student

Distribución t- de -Student

56

8944.01803.1110

86227.3110

ns

dt

d

6227.3110007

7000

700018

1

11

10

1

2

d

d

n

iid

s

s

ddn

s

d

Page 57: T-Student

Distribución t- de -Student

57

• Paso 4: H0 no se rechaza. No existe diferencia en los costos.

Page 58: T-Student

Distribución t- de -Student

58

Page 59: T-Student

Distribución t- de -Student

59

Page 60: T-Student

Distribución t- de -Student

60

Referencias[1] Meyer PL. Probabilidad y aplicaciones estadísticas: Addison-Wesley Iberoamericana 1986.[2] Montgomery DC. Probabilidad y estadística aplicadas a la ingeniería. México: MzGraw-Hill Interamericana Editores 1996.[3] More DS. Estadística aplicada básica. 2 ed. España: Antoni Bosch editor 2004.[4] Technology M. WolframMathWorld. Student's t-Distribution 2009 [ciado Mayo 15 2009]; Disponoble en: http://mathworld.wolfram.com/Studentst-Distribution.html[5] University A. Statistical Probabilities and Distributions 2009 [citado Mayo 15 2009]; Disponible en: http://www.andrews.edu/~calkins/math/webtexts/prod12.htm[6] Whitmore GA. Problemas de estadística Método autododáctico. México: Compañía Editorial Continental S.A. 1970.[7] Walpole Ronad E., Myers Raymond H. Probabilidad y Estadística. México: McGraw-Hill. Junio 2005.