T-Student

Post on 01-Jul-2015

326 views 1 download

Transcript of T-Student

Aplicaciones de la T de Student

Distribución t- de -Student

2

Antecedentes

• Propuesta por William Sealy Gosset (1908)

• Se emplea cuando se trabaja con muestras pequeñas

• Se utiliza para estimar el valor esperado de una distribución normal de población

Distribución t- de -Student

3

¿ Cuándo se utiliza?• Para muestras pequeñas

• Para estimar el valor esperado de una distribución normal de población

• Estimación de la media cuando se desconoce la varianza

• Comparación entre dos poblaciones

• Contraste de hipótesis

Distribución t- de -Student

4

¿Cuál es la distribución exacta del

estadístico ?s

X

conocida la de insesgadoestimador un es

den distribucó la de media la es

X

X

Distribución t- de -Student

5

Supuestos de la inferencia para la media

• Los datos son una muestra (n) aleatoria

• Población con distribución normal N(μ,σ)

Distribución t- de -Student

6

Características de Ẋ• La media muestral tiene una distribución

normal con media μ y desviación típica

• σ se estima a partir de la desviación típica muestral s

• La desviación típica de Ẋ se estima por

n

ns

Error típico de la muestra

Distribución t- de -Student

7

Error típico de la muestra

• Es la estimación de la desviación típica del estadístico a partir de los datos

• El error típico de la media muestral Ẋ es:

ns

Distribución t- de -Student

8

Propiedades

• La distribución t–Student es diferente para los distintos tamaños de la muestra

• Es generalmente en forma de campana

• Para n≥30 se comporta como la normal

• La media es cero

• La distribución es simétrica en torno a la media

Distribución t- de -Student

9

Propiedades

• La varianza es igual a uno cuando t→∞

• La población es esencialmente normal

• Es una distribución continua

• Par n=1 no existe media (Distribución de Cauchy)

• Para n=2,3,... μ=0

• Para n=1 y 2 la distribución t no tiene varianza

Distribución t- de -Student

10

• Varianza para n=2,3...

22

nn

Distribución t- de -Student

11

Grados de libertad

• Número de valores que se pueden variar después de imponer ciertas restricciones

• Número de valores que se pueden escoger libremente al calcular un estadístico

• Libertad de movimiento

Distribución t- de -Student

12

Grados de libertad

Distribución t- de -Student

13

10 yx

Num. Variables=2Num. Restricciones=1

Grados de libertad =r= Num. Variables- Num. de restriccionesGrados de libertad=r=2-1r=1

Distribución t- de -Student

14

10 yx

x

y

-30 -25 -20 -15 -10 -5 0 5 10 15 20 25 30

-15

-10

-5

0

5

10

15

Distribución t- de -Student

15

x

y

-14 -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 12 14

-10

-5

0

5

10

(1)

(2)

3

42

yx

yx

Distribución t- de -Student

16

x

y

-3 -2 -1 0 1 2 3

-2

0

2

(1)

(2)

(2) 12

(1) 124

2

xxy

xy

Distribución t- de -Student

17

cX i

n

i

1r=N-1

n

i

i

n

XX

1

Distribución t- de -Student

18

Distribución t- de -Student

19

DefiniciónSe Z una variable aleatoria con N(0,1) y si U es una variable aleatoria que se distribuye en forma χ2(r), con la condición de que Z y U sean independientes.

Por lo tanto:

Se tiene una distribución T con rr grados de libertad

ns

X

rU

ZT

población la deestándar desviación la deestimador el es y

muestra la de media la es y lpoblaciona media la es donde

s

X

ns

X

rUZT

Distribución t- de -Student

20

DefiniciónEstimador de la desviación estándar de la población:

n

ii Xx

ns

1

22

1

1

normalón distribuci laen

a transformseón distribuci la ,y Si z ts

Es un estimador insesgado de μX

Distribución t- de -Student

21

DefiniciónComo N aumenta, entonces la distribución t se aproxima cada vez más a la distribución normal

Distribución t- de -Student

22

DefiniciónEntonces la distribución t se puede obtener mediante la transformación:

sX

Z

y t se define entonces como:

1 nzt

Distribución t- de -Student

23

DefiniciónFunción de densidad de probabilidad:

2

12

12

21

)(

r

rtrr

r

tf

Distribución t- de -Student

24

r=25r=5r=1

Distribución t- de -Student

25

DefiniciónDistribución acumulativa de probabilidad:

rt

rrt

itB

tF

trtr

rIrItF

21

2

121

121

,21

;2

21

)(

sgn21

,21

,21

,21

;121

21

)(

2

2

daregulariza BetaFunción

,,;

,;*

BetaFunción ,*

GammaFunción *

*

1*

baBbazB

baZI

baB

z

t

nr

Distribución t- de -Student

26

r=1r=25 r=5

Distribución t- de -Student

27

Pruebas de significación: hipótesis“Pruebas de una cola o de dos colas”

• H0 regularmente afirma la ausencia de efectos

• Ha establece que un determinado parámetro difiere del valor que le otorga la hipótesis nula en una dirección concreta

Distribución t- de -Student

28

Estadístico de contraste

• P este valor es la probabilidad calculada suponiendo que H0 sea cierta, de que el estadístico de contraste tome un valor al menos tan extremo como el valor observado

• Valores P pequeños indican la existencia de una fuerte evidencia en contra de H0

• Si el valor P es pequeño, o más pequeños que un valor concreto α, los datos son estadísticamente significativos a un nivel de significación α.

Distribución t- de -Student

29

¿cuánto debe ser el valor de P?

• Nivel de significación más utilizado : 5% (α=.05)

Distribución t- de -Student

30

Errores tipo I y tipo II

• Tipo I: Se presenta cuando se rechaza H0 cuando en realidad es cierta.

• Tipo II: Se da cuando no se rechaza H0 cuando en realidad Ha es cierta

Distribución t- de -Student

31

Escenarios posibles :

Error tipo I Decisión correcta

Decisión correcta

Error tipo II

H0 es cierta Ha es cierta

Certeza sobre la población

Decisión basada

en la muestra

Rechazo H0

Aceptación H0

No rechazo h0

Distribución t- de -Student

32

Ejemplo 1

Refrescos light: los fabricantes de refrescos prueban nuevas fórmulas para evitar la pérdida de dulzor de los refrescos light durante el almacenamiento. Uno de los catadores experimentados evalúan el dulzor de los refrescos antes y después del almacenamiento. He aquí las pérdidas de dulzor ( dulzor antes del almacenamiento menos dulzor después del almacenamiento) hallados por 10 catadores para una nueva fórmula del refresco.

Distribución t- de -Student

33

Datosx Antes-

después

X1 2.0

X2 0.4

X3 0.7

X4 2.0

X5 -0.4

x6 2.2

X7 -1.3

X8 1.2

X9 1.1

x10 2.3

¿Estos datos constituyen una buena evidencia de que el refresco perdió dulzura durante el almacenamiento?

Distribución t- de -Student

34

• Paso 1: Hipótesis Existen diferencias sobre la percepción de la pérdida de dulzura por parte de los catadores

Hipótesis: Pérdida media de dulzor μ

H0: μ=0

Ha: μ>0

Distribución t- de -Student

35

• Paso 2: Estadístico de contraste:

10

3.21.12.13.13.24.00.27.04.00.21

n

i

i

n

XX

02.1X

n

ii Xx

ns

1

22

1

1

1961.14306.1 s

ns

Xt 0

6967.2101961.1

002.1 t

Distribución t- de -Student

36

2XX i iX

2 0.96040.4 0.38440.7 0.1024

2 0.9604-0.4 2.01642.2 1.3924

-1.3 5.38241.2 0.03241.1 0.00642.3 1.6384

Ẋ= 1.02 S2= 1.43066667S= 1.19610479

Distribución t- de -Student

37

2.69672.2622 2.814

• Paso 3: Valor P: t=2.6967 (Tabla)

Distribución t- de -Student

38

2 2.05 2.1 2.15 2.2 2.25 2.3 2.35 2.4 2.45 2.5 2.55 2.6 2.65 2.7 2.75 2.8 2.85 2.9 2.95 3

0.005

0.01

0.015

0.02

0.025

0.03

t=2.69672.2622 2.8214

(t1,p1)

(t2,p2)

(t, p)

T

P

¿p?

Distribución t- de -Student

39

t=2.6967p=?

En tablas

t1=2.2622 p1=.025t2=2.8214 p2=.01

1

21

21

1xx

xxyy

yy

1

21

21

1tt

ttpp

pp

01334.02622.26967.2

8214.22622.2

01.025.025.

p

Distribución t- de -Student

40

Conclusión del cambio de dulzor

• Como P=0.01334 ,existe evidencia bastante fuerte a favor de que se produce una pérdida de dulzor.

Distribución t- de -Student

41

Ejemplo 2• La tasa actual de producir fusibles de 5 amp en

DFEletric, es 250 por hora. Se compro e instaló una máquina nueva que según el proveedor aumentará la tasa de producción. Una nuestra de 10 horas seleccionadas al azar el mes pasado indica que la producción media por hora en la nueva máquina es 256, con desviación estándar muestral de 6 por hora. Con 0.05 de nivel de significancia. ¿Puede DFElectric concluir que la nueva máquina es más rápida?

Distribución t- de -Student

42

solución

• Paso 1:

H0:μ≤250

Ha:μ≥250

• Paso 2: H0 se rechaza si t>1.833

Distribución t- de -Student

43

Solución

16.3

106

250256

6

256

250

ns

Xt

s

X

• Paso 3:

Distribución t- de -Student

44

H0 se rechaza y por lo tanto la nueva máquina es más rápida

Distribución t- de -Student

45

Ejemplo 3: Comparación de dos media poblacionales

• Un estudio EPA reciente compara la economía de combustible en carretera de los automóviles nacionales e importados. Una nuestra de 15 autos nacionales reveló una media de 33.7 mpg con desviación estándar de 2.4 mpg. Una muestra de 12 autos importados indicó una media de 35.7 mpg con desviación estándar de 3.9 mpg.

Distribución t- de -Student

46

• Para un nivel de significancia de 0.05, ¿puede EPA concluir que el consumo de las mpg para los autos importados es mayor?

• Paso1:

H0:μ2≤μ1

Ha:μ2>μ1

Distribución t- de -Student

47

• Paso 2: H0 se rechaza si t<-1.708

• Paso 3:

21

2

21

11nn

s

XXt

p

2

11

21

222

2112

nn

snsnsp

Distribución t- de -Student

48

918.9

25

95.247

25

31.16764.80

25

9.3114.214

21215

9.31124.2115

2

11

2

222

22

21

222

2112

p

p

p

s

s

nn

snsns

8037.12197.1

2.24877.1

2.2

203

918.9

2.2

121

151

918.9

7.357.33

11

21

2

21

t

nns

XXt

p

Distribución t- de -Student

49

• Paso 4: H0 se rechaza. Entonces el consumo de mpg en los autos importados es más alto.

Distribución t- de -Student

50

Ejemplo 4: Pruebas de hipótesis con observaciones por pares

• Una empresa de pruebas independientes estadísticas compara el precio diario de renta de un auto compacto en Eclipse Rent y Avis. Se obtiene una muestra aleatoria de 8 ciudades con la información dada. Con 0.05 de nivel de significancia, ¿puede la empresa concluir que existe una diferencia en los costos de la renta?

Distribución t- de -Student

51

Ciudad Eclipse Rent ($) Avis ($)

Acapulco

Los Cabos

420

560

400

520

D.F.

Cancún

450

480

430

480

Guadalajara

Monterrey

370

450

320

480

Puebla 410 390

Tijuana 460 500

Distribución t- de -Student

52

Solución:

Paso 1: H0:μd=0H1:μd≠0

Paso 2: H0 se rechaza si: t<-2.365 y t>2.365

Distribución t- de -Student

53

• Paso 3: Cálculo del estadístico t mediante la expresión:

as)(diferenci pares de número el Es

sdiferencia las deestándar Desviación

sdiferencia las de Promedio

n

s

d

ns

dt

d

d

Distribución t- de -Student

54

Ciudad Eclipse Rent ($)

Avis ($) Diferencias

($)

Acapulco

Los Cabos

420

560

400

520

20

40

D.F.

Cancún

450

480

430

480

20

0

Guadalajara

Monterrey

370

450

320

480

50

-30

Puebla 410 390 20

Tijuana 460 500 -40

Distribución t- de -Student

55

Ciudad Eclipse Rent ($)Avis ($) Diferencias ($) (di-d)2

Acapulco 420 400 20 20 100Los Cabos 560 520 40 40 900D.F. 450 430 20 20 100Cancún 480 480 0 0 100Guadalajara 370 320 50 50 1600Monterrey 450 480 -30 -30 1600Puebla 410 390 20 20 100Tijuana 460 500 -40 -40 2500

μ= 10 ∑ 7000s= 31.6227766

Distribución t- de -Student

56

8944.01803.1110

86227.3110

ns

dt

d

6227.3110007

7000

700018

1

11

10

1

2

d

d

n

iid

s

s

ddn

s

d

Distribución t- de -Student

57

• Paso 4: H0 no se rechaza. No existe diferencia en los costos.

Distribución t- de -Student

58

Distribución t- de -Student

59

Distribución t- de -Student

60

Referencias[1] Meyer PL. Probabilidad y aplicaciones estadísticas: Addison-Wesley Iberoamericana 1986.[2] Montgomery DC. Probabilidad y estadística aplicadas a la ingeniería. México: MzGraw-Hill Interamericana Editores 1996.[3] More DS. Estadística aplicada básica. 2 ed. España: Antoni Bosch editor 2004.[4] Technology M. WolframMathWorld. Student's t-Distribution 2009 [ciado Mayo 15 2009]; Disponoble en: http://mathworld.wolfram.com/Studentst-Distribution.html[5] University A. Statistical Probabilities and Distributions 2009 [citado Mayo 15 2009]; Disponible en: http://www.andrews.edu/~calkins/math/webtexts/prod12.htm[6] Whitmore GA. Problemas de estadística Método autododáctico. México: Compañía Editorial Continental S.A. 1970.[7] Walpole Ronad E., Myers Raymond H. Probabilidad y Estadística. México: McGraw-Hill. Junio 2005.