Ejemplos de Chi Cuadrado

download Ejemplos de Chi Cuadrado

of 16

Transcript of Ejemplos de Chi Cuadrado

CHI CUADRADO TEMA: REGRESIN Y CORRELACIN SIMPLE 32. Ajustar una recta de mnimos cuadrados a los datos de la tabla adjunta tomando (a) X como variables independiente. (b) X como variable dependiente. Representa los datos y las rectas de mnimos cuadrados en el mismo sistema de ejes coordenados. Parte a: X y 3 2 5 3 6 4 8 6 9 5 11 8 Estadsticas de la regresin Coeficiente de correlacin mltiple 0,958314847 Coeficiente de determinacin R^2 0,918367347 R^2 ajustado 0,897959184 Error tpico 0,690065559 Observaciones 6 ANLISIS DE VARIANZA Grados de Suma de Promedio de libertad cuadrados los cuadrados 1 21,4285714 21,42857143 4 1,9047619 0,476190476 5 23,3333333 F 45 Valor crtico de F 0,002570261

9 8 7 6 5

y = 0.7143x - 0.3333 R = 0.9184

Y

4 3 2 1 0 0 5X

10

15

Regresin Residuos Total

Intercepcin Variable X 1

Coeficientes Error tpico Estadstico t -0,333333 0,796819 -0,418330 0,714286 0,106479 6,708204

Probabilidad Inferior 95% 0,697189 -2,545658 0,002570 0,418651

Superior 95% Inferior 95,0% Superior 95,0% 1,878991 -2,545658 1,878991 1,009920 0,418651 1,009920

Parte b:12 10 8 6 4 2 0 0 5 Y 10 X y = 1.2857x + 1 R = 0.9184

Estadsticas de la regresin Coeficiente de correlacin mltiple 0,958314847 Coeficiente de determinacin R^2 0,918367347 R^2 ajustado 0,897959184 Error tpico 0,9258201 Observaciones 6

ANLISIS DE VARIANZA Grados de Suma de libertad cuadrados 1 38,57142857 4 3,428571429 5 42 Promedio de los cuadrados 38,57142857 0,857142857 F 45 Valor crtico de F 0,002570261

Regresin Residuos Total

Intercepcin Variable X 1

Coeficientes 1,0000000 1,2857143

Error tpico 0,9710083 0,1916630

Estadstico t Probabilidad 1,0298573 0,3612731 6,7082039 0,0025703

Inferior 95% -1,6959513 0,7535726

Superior 95% Inferior 95,0% 3,6959513 -1,6959513 1,8178560 0,7535726

Superior 95,0% 3,6959513 1,8178560

33. Para los datos del problema anterior, hallar, (a) los valores de Y para X=5 y X=12, (b) el valor de X para Y=7. (a) Si X = 5 Si X = 12 Y= - 0,333 + 0,714X Y = 3,24 Y = 8,24 (b) X = 1 + 1,285Y Si Y = 7 X = 10

34. (a) Mediante el mtodo libre obtener la ecuacin de una recta de ajuste de los datos del problema 32. (b) Contestar al problema 33 mediante el resultado de (a). Y = aX + b X= aY + b (b) (3,2) (3,2) (11,8) (11,8) a = 0,75 a = 1,333 b = -0,25 b = 0,333 Y = 0,75X 0,25 X = 1,333Y + 0,333

Y= - 0,25 + 0,75X Si X = 5 Si X = 12 X = 0,333 + 1,333Y Si Y = 7 X = 9,664 Y = 3,5 Y = 8,75

35. La tabla siguiente muestra las puntuaciones finales de algebra y fsica de 10 estudiantes elegidos al azar entre un gran nmero de ellos. (a) Representar los datos. (b) Hallar la recta de mnimos cuadrados que se ajuste a los datos, tomando X como variable independiente. (c) igual que en (b), pero tomando Y como variable independiente. (d) Si un estudiante tiene una puntuacin de 75 en algebra, Cul es su puntuacin en fsica esperada?. (e) Si un estudiante tiene una puntuacin de 95 en fsica, Cul es su puntuacin en algebra esperada?. a) Algebra X Fsica Y 75 82 80 78 93 86 65 72 87 91 71 80 98 95 68 72 84 89 77 74

b)

Y = 29,13 + 0,661X

Estadsticas de la regresin Coeficiente de correlacin mltiple 0,872098413 Coeficiente de determinacin R^2 0,760555642 R^2 ajustado 0,730625098 Error tpico 4,233840246 Observaciones 10

c)

X = - 14,39 + 1,15Y

Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones

0,872098413 0,760555642 0,730625098 5,583516398 10

d) e)

Y = 29,13 + 0,661X X = - 14,39 + 1,15Y

Si X = 75 Si Y = 95

Y = 78,71 X = 94,35

36. La siguiente tabla muestra el nmero de trabajadores agrcolas en Estados Unidos (en millones) durante los aos 1949 1957. (a) Representar los datos. (b) Hallar una recta de mnimos cuadrados que se ajuste a esta serie de tiempo y construir su grafico. (c) Calcular los valores de tendencia y comparar con los valores reales. (d) Estimar el nmero de trabajadores agrcolas en 1948 y comparar con el valor real (10,36 millones). (e) Predecir el nmero de trabajadores agrcolas en 1958 (el verdadero valor es (7,53 millones). Discutir las posibles fuentes de error en tal prediccin. Parte a: Ao Nmero de trabajadores agrcolas en millones 1949 9,96 1950 9,93 1951 9,55 1952 9,15 1953 8,86 1954 8,84 1955 8,36 1956 7,82 1957 7,58

Parte b:

Y = 618,859 - 0,312X Parte c:

Nmero de trabajadores en millones12

108 6 4 2 0 1948 1950 1952 1954 1956 1958 y = -0.3123x + 618.86 R = 0.9867 # de trabajadores (en millones) Linear (# de trabajadores (en millones))

X (Aos) 1949 1950 1951 1952 1953 1954 1955 1956 1957

Y (Calculado) 10,771 10,459 10,147 9,835 9,523 9,211 8,899 8,587 8,275

Parte d: Si Parte e: Si

Y = 618,859 - 0,312X X = 1948 Y = 11,083 mayor que el valor real (10,36 millones).

Y = 618,859 - 0,312X X = 1958 Y = 7,963 mayor que el valor real (7,53 millones).

37. El ndice de coste al usuario por el cuidado mdico en Estados Unidos viene dado por la tabal adjunta para los aos 1950 1957(Al periodo de referencia o periodo base 1947 1949 se le asigno el valor 100, el cual realmente significa el 1000 por ciento. El ndice para 1952, por ejemplo, es 117.2 y muestra que durante 1952 el promedio del precio del cuidado mdico fue 117,2% del que rigi en el periodo base, es decir, se incremento en un 17,2%. a) representar los datos. b) Hallar la recta de mnimos cuadrados que se adjunte a los datos y construir su grafico. c) Calcular los valores de tendencia y comparar con los valores reales. d) Predecir el ndice de costo para el cuidado mdico durante 1958 y comparar con el valor verdadero (144,4). e) En qu ao se puede esperar que el ndice de consto medico sea el doble de 1947 1949 suponiendo que la tendencia se mantiene? Parte a: Ao ndice de coste al usuario por el cuidado mdico (19471949 = 100) Parte b: Y = 4,3786x - 8431,1 1950 106,0 1951 111,1 1952 117,2 1953 121,3 1954 125,2 1955 128,0 1956 132,6 1957 138,0

160 140 120 100 80 60 40 20 0 1948 1950 1952 1954 1956 1958 y = 4.3786x - 8431.1 R = 0.9923 Series1 Linear (Series1) Linear (Series1)

Parte c: x 1950 1951 1952 1953 1954 1955 1956 1957 Parte e: y calculado 105,98571 110,36371 114,74171 119,11971 123,49771 127,87571 132,25371 136,63171

Parte d:

Y = 4,378X 8431, 1142 Durante x = 1958 Y = 4,378*(1958)-8431,1142 Y = 141,0098 Valor generado Valor Real 144,4

r2 = 0,992 r = 0,997 >= 0,8

Y = 4,378X 8431, 1142 200 = 4,378*X 8431, 1142 X = 1971 En este ao la tendencia seria el doble. a los datos de la tabla adjunta. 4 9,3 5 14,6 6 21,9

38) Ajustar una parbola de mnimos cuadrados, X Y 0 2,4 1 2,1 2 3,2 3 5,6

Estadsticas de la regresin Coeficiente de correlacin mltiple 0,92922863 Coeficiente de determinacin R^2 0,86346584 R^2 ajustado 0,83615901 Error tpico 3,01121712 Observaciones 7

ANLISIS DE VARIANZA Valor crtico de Grados de libertad Suma de cuadrados Promedio de los cuadrados F F 1 286,72 286,72 31,6208722 0,002462807 5 45,33714286 9,067428571 6 332,0571429

Regresin Residuos Total

Intercepcin Variable X 1

Coeficientes -1,1571429 3,2000000

Error tpico 2,0517986 0,5690665

Estadstico t -0,5639651 5,6232439

Probabilidad Inferior 95% 0,5971341 -6,4314591 0,0024628 1,7371679

Superior 95% Inferior 95,0% 4,1171734 -6,4314591 4,6628321 1,7371679

Superior 95,0% 4,1171734 4,6628321

25 20 y = 0.7333x2 - 1.2x + 2.5095 R = 0.9995

1510 5

00 -5 2 4 6 8

39. El tiempo total necesario para detener un automvil despus de percibir un peligro se compone del tiempo de reaccin (tiempo entre el conocimiento del peligro y la aplicacin del freno) mas el tiempo de frenado (tiempo para detener el vehculo despus de aplicar el frenado). La tabla adjunta de las distancias D parada (en pies) de un automvil que marcha a las velocidades V (millas por hora) desde el instante en que se observa el peligro. a) Representar los datos. b) Ajustar una parbola de mnimos cuadrados de la forma D = a0 +a1V + a2V2 a los datos. c) Estimar D cuando V= 45 millas/h. y 80 millas/h Velocidad V (millas/h) Distancia de parada D (pies)450 Distancia de parada D (pies) 400 350 300 250 200 150

Parte a: 50 206 60 292 70 396

20 54

30 90

40 138

10050 0 0 20 40 Velocidad V (millas/h) 60 80

Parte b:

Y=a0+a1x+ a2x2

D = 41,77-1,095V+ 0,087V2 Parte c: V= 45 millas/h D = 41,77-1,095(45)+ 0,087(45)2 D = 170 pies r = 0,999 >= 0,8 40) La tabla adjunta muestra la natalidad por cada 1000 individuos en Estados Unidos durante los aos 1915-1955 con intervalo de 5 aos. a) Representar los datos. b) Hallar la parbola de mnimos cuadrados que se ajuste a los datos. c) Calcular los valores de tendencia y compararlos con los reales. AO 1915 NATALIDAD 25,0 POR CADA 1000 HABITANTES 1920 23,7 1925 21,3 1930 18,9 1935 16,9 1940 17,9 1945 19,5 1950 23,6 1955 24,6 Estimar D V= 80 millas/h D = 41,77-1,095(45)+ 0,087(45)2 D = 516 pies

Estadsticas de la regresin Coeficiente de correlacin mltiple 0,09654932 Coeficiente de determinacin R^2 0,00932177 R^2 ajustado -0,13220369 Error tpico 3,26968398 Observaciones 9

ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F Regresin 1 0,704166667 0,704166667 0,0658664 0,804832834 Residuos 7 74,83583333 10,69083333 Total 8 75,54

Intercepcin Variable X 1

Coeficientes 63,1916667 -0,0216667

Error tpico 163,3619034 0,0844229

Estadstico t Probabilidad 0,3868201 0,7103799 -0,2566445 0,8048328

Inferior 95% Superior 95% Inferior 95,0% -323,0978519 449,4811852 -323,0978519 -0,2212950 0,1779617 -0,2212950

Superior 95,0% 449,4811852 0,1779617

30 y = 0.0186x2 - 72.044x + 69742 25 R = 0.8919 20 15 10 5 Series1 Poly. (Series1)

x 1915 1920 1925 1930 1935 1940 1945 1950 1955

Y calculado -11,875 -15,44 -18,075 -19,78 -20,555 -20,4 -19,315 -17,3 -14,355

0 1900

1920

1940

1960

41. El numero Y de bacterias por unidad de volumen presentes en un cultivo despus de X horas esta dado en la tabla adjunta. a) Representar los datos en un papel grafico semi-logaritmico, donde la escala logartmica se utiliza para Y y la escala aritmtica para X. b) Ajustar una curva de mnimo cuadrados de la forma Y = abx a los datos y explicar porque esta ecuacin particular da buenos resultados. c) Comprara los valores Y obtenidos de esta ecuacin con los valores reales. d) Estimar el valor de Y cuando X=7. Parte a: Nmero de horas ( X) Numero de bacterias por unidad de volmenes (Y) 0 32 1 47 2 65 3 92 4 132 5 190 6 275

160 ndice de coste al usuario por el cuidado mdico 140 120 100 80 60 40 20 0 1948 1950 1952 Ao 1954 1956 1958 Y

Parte c: x 0 1 2 3 4 5 6 y calculado 32,147 87,375546 237,486734 645,488943 1754,43895 4768,56506 12960,9598

Parte d:

35227,88882

12.2 En Applied Spectroscopy se estudian las propiedades de reflectancia infrarroja de un lquido viscoso utilizando en la industria electrnica como lubricante. El experimento que se diseo consisti en el efecto de frecuencia de banda X1 y el espesor de pelcula X2 sobre la densidad ptica y usando un espectroscopio infrarrojo Perkin-Elmer modelo 621. [Fuente: Pachansky, J., England, C.D.. y Wattman, R. Infrarred sprectoscopis studies of poly (perfrouropropylenexide) on gold substrate. A classical dispersion analysis for the refractive index. Applied Spectroscopy, vol. 40, num. 1, enero de 1986,p. 9, table 1.] Y 0,231 0,107 0,053 0,129 0,069 0,030 1,005 0,559 0,321 2,948 1,633 0,934 X1 740 740 740 805 805 805 980 980 980 1235 1235 1235 X2 1,10 0,62 0,31 1,10 0,62 0,31 1,10 0,62 0,31 1,10 0,62 0,31 Estadsticas de la regresin Coeficiente de correlacin mltiple 0,90710716 Coeficiente de determinacin R^2 0,82284339 R^2 ajustado 0,78347526 Error tpico 0,4063014 Observaciones 12

1500

X2

1000 500 0 1000-1500 500-1000

X1y = 3.3727 + 0.0036x1 + 0.9476x2.

0-500

Y

ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total Suma de cuadrados 2 6,900792767 9 1,485727483 11 8,38652025 Promedio de los cuadrados F 3,450396383 20,90125397 0,165080831 Valor crtico de F 0,00041458

Intercepcin Variable X 1 Variable X 2

Coeficientes Error tpico Estadstico t Probabilidad -3,372673 0,635996 -5,302976 0,000492 0,003617 0,000612 5,908318 0,000227 0,947599 0,360894 2,625696 0,027552

Inferior 95% Superior 95% Inferior 95,0% Superior 95,0% -4,811397 -1,933950 -4,811397 -1,933950 0,002232 0,005001 0,002232 0,005001 0,131199 1,763999 0,131199 1,763999

12.3 Se efectu un conjunto de ensayos experimentales para determinar una forma de predecir el tiempo de coccin y a diferentes niveles de ancho del horno X1 y a temperaturas de la chimenea X2. Los siguientes son los datos registrados: Estime la ecuacin de regresin lineal mltiple Ux1,x2 = Bo + B1 X1 + B2 X2 y = 0.58 + 2.7122x1 + 2.0497x2 Y 6,4 15,05 18,75 30,25 44,85 48,94 51,55 61,5 100,44 111,42 X1 1,32 2,69 3,56 4,41 5,35 6,2 7,12 8,87 9,8 10,65 X2 1,15 3,4 4,1 8,75 14,82 15,15 15,32 18,18 35,19 40,4

Estadsticas de la regresin Coeficiente de correlacin mltiple 0,99986211 Coeficiente de determinacin R^2 0,99972424 R^2 ajustado 0,99964545 Error tpico 0,65697115 Observaciones 10

ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F Regresin 2 10953,20257 5476,601286 12688,7407 3,4822E-13 Residuos 7 3,021277663 0,431611095 Total 9 10956,22385

Intercepcin Variable X 1 Variable X 2

Coeficientes Error tpico 0,57998789 0,606853464 2,71223758 0,202086444 2,04970749 0,048081813

Estadstico t 0,955729726 13,42117522 42,62958013

Probabilidad 0,371041828 2,99026E-06 1,02001E-09

Inferior 95% Superior 95% Inferior 95,0% Superior 95,0% -0,854992523 2,014968313 -0,854992523 2,014968313 2,234379072 3,190096087 2,234379072 3,190096087 1,936012067 2,163402907 1,936012067 2,163402907

y = 0.58 + 2.7122x1 + 2.0497x2

50 40 30 20 10 0 6.4 15.05 18.75 30.25 44.85 48.94 51.55 61.5 100.44 111.42

X2

40-50 30-40 20-30

X1

10-20 0-10

Y