ESTADISTICA ADMNISTRATIVA 2

68
UNIDAD 2 PRUEBA DE LA BONDAD DEL AJUSTE Y ANÁLISIS DE VARIANZA 2.1 ANALISIS Ji-CUADRADA 2.1.1 PRUEBA DE INDEPENDENCIA Cuando cada individuo de la población a estudio se puede clasificar según dos criterios A y B, admitiendo el primero a posibilidades diferentes y b el segundo, la representación de las frecuencias observadas en forma de una matriz a x b recibe el nombre de Tabla de contingencia. Siendo n ij el número de individuos que presentan simultáneamente la i-ésima modalidad del carácter A y la j- ésima del B. La hipótesis nula a contrastar admite que ambos caracteres, A y B, se presentan de forma independiente en los individuos de la población de la cual se extrae la muestra; siendo la alternativa la dependencia estocástica entre ambos caracteres. La realización de esta prueba requiere el cálculo del estadístico son las frecuencias absolutas marginales y el tamaño muestral total. El estadístico L se distribuye como una con (a - 1)(b - 1) grados de libertad. El contraste se realiza con un nivel de significación del 5%. Ejemplo de Aplicación Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes resultados:

description

estadistica administrativa

Transcript of ESTADISTICA ADMNISTRATIVA 2

Page 1: ESTADISTICA ADMNISTRATIVA 2

UNIDAD 2

PRUEBA DE LA BONDAD DEL AJUSTE Y ANÁLISIS DE VARIANZA

2.1 ANALISIS Ji-CUADRADA

2.1.1 PRUEBA DE INDEPENDENCIA

Cuando cada individuo de la población a estudio se puede clasificar según dos criterios A y B, admitiendo el primero a posibilidades diferentes y b el segundo, la representación de las frecuencias observadas en forma de una matriz a x b recibe el nombre de Tabla de contingencia.

Siendo nij el número de individuos que presentan simultáneamente la i-ésima modalidad del carácter A y la j-ésima del B.

La hipótesis nula a contrastar admite que ambos caracteres, A y B, se presentan de forma independiente en los individuos de la población de la cual se extrae la muestra; siendo la alternativa la dependencia estocástica entre ambos caracteres. La realización de esta prueba requiere el cálculo del estadístico

son las frecuencias absolutas marginales y el tamaño muestral total.

El estadístico L se distribuye como una con (a - 1)(b - 1) grados de libertad. El contraste se realiza con un nivel de significación del 5%.

Ejemplo de Aplicación

Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes resultados:

  Sin depresión Con depresión  

Deportista 38 9 47

No deportista 31 22 53

  69 31 100

L = (38 – 32,43)2/32,43 + (31 – 36,57)2/36,57 + (9 – 14,57)2/14,57 + (22 – 16,43)2/16,43 = 0,9567 + 0,8484 + 2,1293 + 1,8883 = 5,8227

Page 2: ESTADISTICA ADMNISTRATIVA 2

El valor que alcanza el estadístico L es 5,8227. Buscando en la tabla teórica de Chi Cuadrado para 1 grado de libertad se aprecia Lt = 3,84146 < 5,8227 lo que permite rechazar la hipótesis de independencia de caracteres con un nivel de significación del 5%, admitiendo por tanto que la práctica deportiva disminuye el riesgo de depresión.

http://www.monografias.com/trabajos15/prueba-de-independencia/prueba-de-independencia.shtml#PRINDEPEND

2.1.3 TABLA DE CONTINGENCIAS

Las tablas de contingencia están compuestas por filas (horizontales) y columnas (verticales)que delimitan celdas donde se vuelcan la frecuencia de cada categoría analizada. En el ejemplo siguiente, efectuado con el programa SPSS 7.5, se observa la tabla de contingencia de dos variables en una población de pacientes críticos hipotéticos: la evolución (SV/NS) y la presencia o ausencia de coma al ingreso. Las celdas delimitadas por estas dos variables comprenden cuatro tipos:

Frecuencia de pacientes sin coma sobrevivientes Frecuencia de pacientes sin coma no sobrevivientes Frecuencia de pacientes con coma sobrevivientes Frecuencia de pacientes con coma No Sobrevivientes

La pregunta es ¿es el coma al ingreso un factor de riesgo para la mortalidad?

Para contestarnos esa pregunta debemos apelar al uso de la prueba de Chi Cuadrado de Independencia. Esta prueba contrasta la hipótesis: ¿las categorías de las dos variables son independientes entre sí o no?. El análisis del chi cuadrado arroja un valor de p determinado, que si es inferior a 0.05, indica que existe una relación entre las categorías estudiadas, o sea que las variables no son independientes entre sí.

En general la prueba de chi cuadrado presenta ciertos puntos a tener en cuenta:

Page 3: ESTADISTICA ADMNISTRATIVA 2

Si el N casos es pequeño, se utiliza la prueba exacta de Fisher para obtener el valor de chi cuadrado (X2).

Si el N 40 casos se puede utilizar la corrección de continuidad de Yates para obtener el X2.

Para hallar correctamente el valor de X2, la tabla de 2x2 debe estar integrada por valores de una muestra aleatoria, con distribución multinomial y los valores esperados no deben ser < 5.

Los métodos estadísticos más usados para hallar el valor del X2 son el método de Pearson y el de razón de verosimilitud, funcionan muy bien para muestras grandes.

Según el análisis el valor del estadístico chi cuadrado es de 133, 353 correspondiendo a un valor de p = 0.000 (según el test de Fisher), es decir una p < 0.001, sumamente significativa, lo cual indica que existe una relación entre coma al ingreso y sobrevida en pacientes críticos. El valor de gl representa los grados de libertad de la muestra estudiada.

Para determinar si la presencia de coma al ingreso empeora la sobrevida o no, debemos determinar el Riesgo Relativo del cruce de las dos variables. El valor sería 3,604, por lo cual la presencia de coma al ingreso determina un mayor riesgo de mortalidad.

Page 4: ESTADISTICA ADMNISTRATIVA 2

http://www.medal.org.ar/stadhelp/Std00011.htm

UNIDAD 3

ANÁLISIS DE REGRESIÓN, CORRELACION LINEAL SIMPLE Y MÚLTIPLE

3.1 ESTIMACION MEDIANTE LA LINEA DE REGRESIÓN

3.1.1 DIAGRAMA DE DISPERSIÓN

Supongamos una muestra de tamaño n sobre una población multivariante de

dimensión , cuyos datos se disponen en una matriz de n filas y m columnas de la forma

.

Entendemos por población multivariante de dimensión m aquella en la que a cada individuo muestral se le observan exactamente m características o variables.

Podemos estar interesados en cada una de las m variables de forma independiente, en cuyo caso no necesitaremos el diagrama de dispersión. Pero lo más común en este tipo de muestras es estudiar si unas variables se relacionan con otras de algún modo, o si existe dependencia entre ellas.

En un diagrama de dispersión se escogen dos variables distintas entre las m posibles, numeradas por a y b, tales que

,y se representan en el plano cartesiano los pares ( (x1a, x1b), (x2a, x2b), ..., (xna, xnb)),es decir, se asocia a al eje horizontal o de abscisas y b al vertical o de ordenadas.

Page 5: ESTADISTICA ADMNISTRATIVA 2

Si los puntos forman una nube más o menos amorfa, podemos suponer que ambas variables no se interrelacionan, o lo que es lo mismo, el conocimiento de una no aporta información sobre la otra. Pero si ambas variables tienen un patrón de comportamiento conjunto, esto se verá en el diagrama de dispersión. El siguiente ejemplo pretende dar luz sobre lo recién comentado.

CasoA continuación se transcribe una muestra simulada de tamaño 12 en la que a cada individuo muestral se le midieron 3 variables.

Variable 1 Variable 2 Variable 3102 32 5.0220 75 5.8300 115 5.3210 81 5.8180 60 5.8260 83 5.2117 40 5.4200 49 5.9143 60 5.697 39 5.2261 99 5.4220 60 5.5

En la fase exploratoria se quiere obtener una apreciación sobre cómo se relacionan estas tres variables entre sí.

El diagrama de dispersión de las dos primeras variables sugiere una relación lineal y positiva entre ambas; ya que al aumentar una lo hace también la otra y de forma proporcional. Haciendo a = 1 y b = 3, tomando la primera y la tercera, parece que el comportamiento es del tipo cuadrático; la tercera variable va aumentando conforme lo hace la primera, pero luego disminuye mientras la otra sigue aumentando. Finalmente, interprete el lector lo que ocurre cuando a = 2 y b = 3.

http://www.telefonica.net/web2/biomates/explora/explora_disper2/explora_disper2.htm

3.1.2 METODO DE MINIMOS CUADRADOS

Cuando se trata de aproximación polinomial se establecen los métodos de interpolación de Newton y La Grange. Para encontrar la ecuación de la cuna que

Page 6: ESTADISTICA ADMNISTRATIVA 2

contiene a todos y cada uno de los n puntos que definen a una fusión tabular dada, como la que se presenta en la tabla siguiente y que se representa con todos los puntos de la figura también siguiente. Esta ecuación resulta ser algebraica de grado (n-1). r ,.j-0.

Obsérvese que en la tabla aparecen n puntos y que en la figura curva continua representa la aproximación polinomial de estos; es decir, la representación geométrica de los métodos de

interpolación. Ahora se trata de encontrar la ecuación de una curva que, aunque no pase por todos los puntos, tenga pocas variaciones (sea suave, como la curva de los trazos de la figura anterior). y pase lo mas ceca posible de todos. Generalmente" lo mas cerca posible se obtiene imponiendo el criterio de los mínimos cuadrados. Antes de aplicar este criterio, debe de escogerse la forma de curva más suave que se va a ajustar al conjunto de puntos dados. La ecuación de esa curva puede obtenerse por conocimiento previo del problema, es decir, o la interpretación física del fenómeno, o en forma arbitraria observando que ecuación conocida describe aproximadamente a esta curva. En lo que sigue, la curva que se va a ajustar, es la gráfica de un polinomio de grado conocido m.

METODO DE LOS MÍNIMOS CUADRADOS

Dada la función tabular definida por la tabla anterior se trata de obtener los valores de los coeficientes de la función:

Y=F(x)=ao+a1X+a2X2+a3X3+ amxn-1........(1)

Cuya gráfica es una curva que se acerca a la mayoría de los puntos (curva de trazos de la figura anterior).

Se llama residuos a la diferencia de ordenadas de la curva para x=xi menos la del punto xi, yi representado por Ri a este residuo, se tiene Ri=f(xi)-yi..t2),es decir:

Ri= a0+a1X+a2X2+a3X3+.....amxn-yi ........ (3) ,donde i=1 ,2,3,..n.

El método de los mínimos cuadrados consiste en determinar los valores de los parámetros a0,a1 ,a2,a3,.....am; de manera que haga mínima la suma de Ios cuadrados de los residuos. Esta suma vale Re= ( o+Xj+Xi+Xi+... +mXi-Yi)...... (4)

Se tiene el mínimo de esta igualdad a cero sus primeras derivadas parciales con .

respecto a todo y cada uno de sus parámetros .Derivando con respecto a ai, donde

j=0,1,2,3,...m; se obtiene :

Page 7: ESTADISTICA ADMNISTRATIVA 2

Ri= (a0+a1X+ a2X2+a3X3+.....amxn-yi )2............ (4)

Ri = 2(a0+a1X+ a2X2+a3X3+.....amxn-yi ) Xi

igualando con cero esta derivada a:

a0+a1Xj+1+ a2Xj+2+a3Xj+3+.....amxyi+m ............ (5)

Finalmente, considerando j=0,1,.2,3,....,m; se obtiene el siguiente sistema de ecuaciones normales.

na0+a1X+a2X2+a3X3+.....+amxm = y

a0x+a1X2+a2X3+a3X4+.....+amxm = xy

a0X2+a1X3+a2X4+a3X5+.....+amxm = x2y

a0X3+a1X4+a2X5+a3X6+.....+amxm = x3y

a0Xm+ a1Xm+1+a2Xm+2+ a3Xm+3 +..…+amxm = xmy.......... (6)

en donde, por simplicidad se ha omitido los índices de X y Y, y los limites de las sumatorias , pero debe de entenderse que estas son sobre todo los valores de X y Y dados la tabla inicial.

http://html.rincondelvago.com/ajuste-de-funciones_metodo-de-minimos-cuadrados.html

3.1.3 INTERPRETACION DEL ERROR ESTANDAR DE LA ESTIMACIÓN

Si se utilizaron muestras, ¿valoraron los autores el error muestral intrínseco, es decir, calcularon los intervalos de confianza? Interprete los intervalos.

Si se utilizaron muestras, exponga brevemente cómo se seleccionaron. ¿Cree que se introdujo algún sesgo en el método de muestreo?. Explique brevemente.

Si se utilizaron muestras, ¿fue suficiente el tamaño de las muestras o pudo haberse introducido una gran variación a causa de su pequeño tamaño? Haga un comentario sobre la amplitud del intervalo de confianza.

En este caso no se han utilizado muestras de la población, sino a toda la población que se quería estudiar. En caso de que se hubieran usado, habría que tener en cuenta el posible efecto aleatorio asociado a dicho proceso (error muestral intrínseco). En caso de usar muestras no podemos hablar de tasa en sentido estricto, sino de "estimación muestral" de dicha tasa. Además deberíamos acompañar dicha estimación de su correspondiente "error estándar". Este error

Page 8: ESTADISTICA ADMNISTRATIVA 2

estándar de la tasa de incidencia se calcularía como cualquier error estándar de una proporción o porcentaje, mediante la fórmula:

Error estándar = Raiz cuadrada [(Tasa)2/ n], donde Tasa, se refiere a la tasa estimada y "n" es el número de casos. Si trabajamos con un Intervalo de Confianza al 95% (IC-95%), entonces habrá que multiplicar por 1.96 el error estándar, para obtener los límites del mencionado IC-95%, según la fórmula:

IC-95% = Estimación muestral de la Tasa de Incidencia ± (1.96 Error estándar).

Como ocurre con cualquier IC-95%, cuanto más estrecho sea mayor precisión denota. Es decir, tenemos mayor seguridad de que el parámetro poblacional estimado (en este caso la tasa de incidencia de cáncer de pulmón en la comunidad de Castilla-León), no será muy diferente del correspondiente estimador muestral que hemos obtenido. Como sabemos que el número "0" no debe estar contenido en el IC, el error estándar debe ser inferior a la mitad del estimador muestral correspondiente. De lo contrario, al multiplicarlo por 1.96 (o sea, aproximadamente por 2), superará a la "Estimación muestral de la Tasa de incidencia" y en ese caso el IC-95% incluiría el número "0".

Respecto a la interpretación de los IC-95%, es la siguiente: Si hubiéramos extraído 100 muestras de tamaño "n" de la población diana correspondiente, y calculado sus IC-95%, 95 de dichos IC-95% contendrían el verdadero parámetro poblacional (en este caso la Tasa de incidencia de Cáncer de pulmón) y sólo 5 de ellos no lo contendrían. Por tanto tenemos un "nivel de confianza" del 95% de que el IC-95% de nuestra muestra sea uno de los 95, que sí contienen al verdadero parámetro poblacional.Si realizamos 100 estudios en una población con similares características y con el mismo tamaño poblacional, en 95 estudios el estimador estaría comprendido entre los valores del IC95% y en 5 estudios no.

De haber utilizado muestras, habría que haber usado algún procedimiento (por ejemplo, muestreo aleatorio simple) que asegurara que las características de nuestra muestra no difirieran de las de la población a la que quiere representar (Es decir, que nuestra muestra no estuviera sesgada).

Si se hubieran utilizado muestras, habría que haber tenido en cuenta el efecto del tamaño muestral (designado habitualmente como "n") sobre la amplitud del Intervalo de Confianza (IC), habitualmente al 95% (IC-95%). Esto queda muy patente examinando las siguientes fórmulas:

IC-95% = Estimación muestral de la Tasa de Incidencia ± (1.96 Error estándar).

Para simplificar la expresión previa, designaré la "Estimación muestral de la Tasa de Incidencia" como "Tasa", por lo que expresión anterior queda así:

IC-95% = Tasa ± (1.96 Error estándar).

Page 9: ESTADISTICA ADMNISTRATIVA 2

Veamos ahora la fórmula del Error Estándar:

Error estándar = raiz cuadrada [(Tasa)2/ n], donde Tasa, se refiere a la tasa estimada y "n" es el tamaño muestral.

Sustituyendo el término "Error Estándar", por su valor correspondiente, la fórmula del IC-95% quedaría así:

IC-95% = Tasa ± (1.96 x Raiz cuadrada [(Tasa)2/ n]).

En la expresión previa queda claro que conforme aumenta "n", disminuye el segundo término de dicha expresión (o sea, disminuye 1.96 x raiz cuadrada [(Tasa)2/ n]). Por tanto obtendremos un IC-95% más "estrecho" (más preciso). Lo contrario es igualmente cierto: Con bajos valores de "n", los IC-95% son excesivamente amplios (poco precisos), denotando un gran componente de variabilidad achacable a error aleatorio, debido a un tamaño muestral insuficiente.

http://sameens.dia.uned.es/Trabajos/S8-14a/IAlfajeme/p3-5.htm

3.1.5 ANALISIS DE CORRELACION

Otra forma de análisis bivariado es la correlación y regresión de variables numéricas y discretas. El concepto de correlación y regresión se basa en el grado de relación que poseen dos variables numéricas entre si.

El coeficiente de correlación permite predecir si entre dos variables existe o no una relación o dependencia matemática.

Supongamos que queremos estudiar la correlación existente entre peso y altura de un grupo de personas tomadas al azar. Sometemos los datos recogidos de peso y altura al análisis de correlación y encontramos el coeficiente de correlación entre ambas, que se representa con la letra r. El r = 0.78. Esto significa que a mayor altura correspondería mayor peso.

Los coeficientes de correlación r siempre oscilan entre valores de 1 y –1. El valor cero 0 significa que no existe correlación entre ambas variables. Un valor positivo indica que a incrementos en la variable A se producen incrementos proporcionales en B y un valor negativo indica lo contrario.

Podemos graficar la correlación entre las dos variables a través de una gráfica de dos ejes (abscisas y ordenadas) cartesianos.

En el siguiente gráfico observamos la correlación entre potencia de motor de un automóvil y consumo en Litros por cada 100 Km. El r = 0.87 (correlación positiva). (SPSS). Evidentemente a mayor potencia se observa mayor consumo de

Page 10: ESTADISTICA ADMNISTRATIVA 2

combustible. El valor de significación para ese r es de una p < 0.01. Esto quiere decir que la correlación entre potencia y consumo no es aleatoria.

En el siguiente gráfico encontramos la relación existente entre peso del automóvil en kg. y aceleración 0 a 100 Km. / hora en segundos. El r = - 0.56 con una p < 0.05. Esto significa que existe una correlación negativa significativa, entre peso del auto y respuesta de la aceleración. Automóviles más pesados presentan una respuesta más tardía y viceversa. (SPSS)

Para interpretar el coeficiente de correlación, Colton a dado los siguientes lineamientos generales:

Page 11: ESTADISTICA ADMNISTRATIVA 2

Valor de r de 0 a 0.25 implica que no existe correlación entre ambas variables.

Valor de r de 0.25 a 0.50 implica una correlación baja a moderada. Valor de r de 0.50 a 0.75 implica correlación moderada a buena. Valor de r de 0.75 o mayor, implica una muy buena a excelente correlación. Estos rangos de valores se pueden extrapolar a correlaciones negativas

también.

Se debe tener cuidado al analizar la correlación entre dos variables, de que ambas varíen juntas permanentemente. Esto parece redundante, pero es importante. Por ejemplo, si correlacionamos edad y altura. La altura irá aumentando con la edad hasta un determinado punto en donde ya no aumentará más.

http://www.medal.org.ar/stadhelp/Std00014.htm

3.1.7 REGRESION MÚLTIPLE Y ANÁLISIS DE CORRELACION

La regresión múltiple es el método de análisis apropiado cuando el problema del investigador incluye una única variable métrica dependiente que se supone está relacionada con una o más variables métricas independientes. El objetivo del análisis de la regresión múltiple es predecir los cambios en la variable dependiente en respuesta a cambios en varias de las variables independientes. Este objetivo se consigue muy a menudo a través de la regla estadística de los mínimos cuadrados.

La regresión múltiple es útil siempre que el investigador esté interesado en predecir la cantidad o la magnitud de la variable dependiente. Por ejemplo, se puede hacer la predicción de los gastos mensuales de cenar fuera de casa (variables dependientes) con información referente a la renta familiar, su tamaño y la edad del cabeza de familia (variables independientes). De la misma forma. el investigador puede intentar predecir las ventas de una compañía a partir de información sobre sus gastos en publicidad, el número de vendedores y el número de tiendas que distribuyen sus productos.

La regresión multiple es quizás el método estadístico empleado con mayor frecuencia en las ciencias sociales. En este cuaderno se introducen los supuestos y técnicas báscias. El enfoque es aplicado con ejemplos prácticos y presentaciones gráficas. Se abordan también los últimos avances realizados en estadística tales como la regresión logística para variables categóricas y los modelos de riesgos proporcionales para datos longitudinales. A lo largo de toda la exposición se recalca la necesidad de conjugar la teoría, la imaginación sociologógica y la metodología para superar los numerosos problemas que se presentan en toda investigación empírica en ciencias sociales.

Page 12: ESTADISTICA ADMNISTRATIVA 2

http://www.prometeolibros.com/libros/8/analisisderegresionmultiple_847476163.asp

 http://www.virtual.unal.edu.co/cursos/sedes/manizales/4010059/docs_curso/Modulo%20Estadistica/tiposmulti.htm

3.1.8 USO DE VARIABLES FICTICIAS

En un estudio de panel puede que se desee construir variables ficticias de uno o ambos tipos descritos a continuación: (a) variables ficticias como identificadores de las unidades muéstrales, y (b) variables ficticias como identificadores de los periodos de tiempo. El primer método puede utilizarse para permitir que el intercepto de la regresión sea diferente en diferentes unidades, y el segundo para permitir lo mismo en diferente periodos.

Hay dos opciones especiales para crear estas variables ficticias. Se encuentran dentro del menú "Datos, Añadir variables" en el GUI, o en la instrucción genr en el modo lote de instrucciones, o gretlcli.

1. "variables ficticias periódicas" (lote de instrucciones: genr dummy). Esta instrucción normalmente se utiliza para crear variables ficticias periódicas hasta la frecuencia de datos en los estudios de series temporales (por ejemplo un conjunto de variables ficticias trimestrales para ser utilizado en corrección estacional). No obstante, también funciona con datos de panel. Nótese que la interpretación de las variables ficticias creadas mediante esta instrucción difiere dependiendo de si las filas de datos están agrupadas por unidad o por periodo. Si están agrupadas según unidades (frecuencia T) las variables resultantes son variables ficticias periódicas y habrá un número T de ellas. Por ejemplo, dummy_2 tendrá el valor 1 en cada fila de datos correspondiente a una observación del periodo 2, o 0 en caso contrario. Si están agrupadas según periodos (frecuencia n) entonces se generaran n variables ficticias unitarias: dummy_2 tendrá el valor 1 en cada fila de datos asociada con la unidad muestral 2, o 0 en caso contrario.

2. "Variables ficticias de panel" (en modo consola genr paneldum). Esta instrucción crea todas las variables ficticias, de cada unidad y periodo, de golpe. Se supone que por defecto, las filas de datos están agrupadas por unidades. Las variables ficticias de cada unidad se denominan du_1, du_2 y así sucesivamente, mientras que las variables ficticias periódicas se llaman dt_1, dt_2, etc. Es incorrecto utilizar la u (por unidad) y la t (por tiempo) en estos nombres si las filas de datos están agrupadas por periodos: su utilización correcta en este contexto se hace mediante genr paneldum -o (sólo en modo lote de instrucciones).

Si el conjunto de datos de panel contiene el año YEAR como una de las variables, es posible crear un periodo ficticio para de escoger algún año en particular como

Page 13: ESTADISTICA ADMNISTRATIVA 2

en este ejemplo genr dum = (YEAR=1960). También es posible crear variables ficticias periódicas utilizando el operador de módulo, %. Por ejemplo, para crear una variable ficticia con valor 1 para la primera observación y cada treinta observaciones y 0 en lo demás casos, se puede hacer lo siguiente

genr index genr dum = ((index-1)%30) = 0 http://www.bl.ehu.es/~etpdihei/manual-html/x860.html

3.1.9 RESIDUALES Y GRAFICAS RESIDUALES

Para un valor X dado de la variable independiente. al valor y frecuentemente se le denomina el valor ajustado de la variable dependiente. A la diferencia entre el valor observado y y el valor ajustado y se le denomina residual para esa observación, y se le denota mediante e:

e = Y- y

http://html.rincondelvago.com/estadistica-descriptiva_1.html

3.3.10 INTERPRETACION DEL INTERVALO DE CONFIANZA

Vamos a ilustrar el procedimiento de obtención de un intervalo de confianza, considerando una población normal X con varianza desconocida , siendo el parámetro a estimar  su  valor medio μ .  Para ello se deberá disponer de:

Una muestra aleatoria X1, X2 ,..., Xn de tamaño n extraída de la población X. Un estimador Θ del parámetro poblacional μ , que en este caso es la media

muestral pero que, debido al desconocimiento de la varianza de la población, tendremos que reemplazar este último parámetro por la varianza muestral. El  estadístico que emplearemos, relacionado con  el parámetro μ ,Será :

Este estadístico sigue una distribución T de Student con (n-1) grados de libertad.

Page 14: ESTADISTICA ADMNISTRATIVA 2

El nivel de confianza 1- , establecido a priori por el experimentador (los usuales son 0.95, 0.90 y 0.99).

Dada la distribución del estadístico y el nivel de confianza , se tiene la siguiente igualdad probabilística:

La expresión anterior es equivalente a:

que hace referencia a que con una probabilidad 1- el intervalo aleatorio

Page 15: ESTADISTICA ADMNISTRATIVA 2

contendrá el valor medio μ . El intervalo es aleatorio ya que sus extremos se determinan a partir de los estimadores media muestral y desviación típica muestral, tratándose de variables aleatorias. La probabilidad a que se refiere dicho intervalo aleatorio, puede interpretarse de manera informal pero quizás más clara:

"Si consideramos todas las muestras distintas de tamaño n que puedan ser extraídas  de la población X , y con las observaciones de cada una construimos los correspondientes intervalos, según la estructura anterior,  el (1- de estos intervalos contendrán el parámetro μ "

Por tanto, si extraemos una muestra de tamaño n y con los datos u observaciones, x1, x2 ,..., xn , calculamos los extremos del intervalo, dispondremos del concreto intervalo de confianza para el parámetro μ

que, en función de la interpretación informal anterior, contendrá dicho parámetro con una confianza  (1-

Observación: el nivel de confianza establece en alguna medida la longitud del correspondiente intervalo de confianza. Aumentando el nivel de confianza (mayor certeza) , aumenta la longitud (menor precisión).

http://e-stadistica.bio.ucm.es/glosario/def_intervalo_confianza.html

UNIDAD 4

SERIES DE TIEMPO

4.1 MODELO CLÁSICO DE SERIES DE TIEMPO

Toda institución, ya sea la familia, la empresa o el gobierno, tiene que hacer planes para el futuro si ha de sobrevivir y progresar. Hoy en día diversas instituciones requieren conocer el comportamiento futuro de ciertos fenómenos con el fin de planificar, prever o prevenir. La planificación racional exige prever los sucesos del futuro que probablemente vayan a ocurrir. La previsión, a su vez, se suele basar en lo que ha ocurrido en el pasado. Se tiene pues un nuevo tipo de inferencia estadística que se hace acerca del futuro de alguna variable o compuesto de variables basándose en sucesos pasados. La técnica más importante para hacer inferencias sobre el futuro con base en lo ocurrido en el pasado, es el análisis de series de tiempo.

Page 16: ESTADISTICA ADMNISTRATIVA 2

 Son innumerables las aplicaciones que se pueden citar, en distintas áreas del conocimiento, tales como, en economía, física, geofísica, química, electricidad, en demografía, en marketing, en telecomunicaciones, en transporte, etc. 

Series De Tiempo Ejemplos  1. Series económicas:

- Precios de un artículo- Tasas de desempleo- Tasa de inflación- Índice de precios, etc.

  2. Series Físicas:

- Meteorología- Cantidad de agua caída- Temperatura máxima diaria- Velocidad del viento (energía eólica)- Energía solar, etc.

3. Geofísica: 

- Series sismologías 

 4. Series demográficas: 

- Tasas de crecimiento de la población- Tasa de natalidad, mortalidad- Resultados de censos poblacionales

5. Series de marketing: 

- Series de demanda, gastos, ofertas 

6. Series de telecomunicación: 

- Análisis de señales 

7. Series de transporte: 

- Series de tráfico 

 Uno de los problemas que intenta resolver las series de tiempo es el de predicción. Esto es dado una serie {x(t1),...,x(tn)} nuestros objetivos de interés son describir el comportamiento de la serie, investigar el mecanismo generador de la serie temporal, buscar posibles patrones temporales que permitan sobrepasar la incertidumbre del futuro. En adelante se estudiará como construir un modelo para explicar la estructura y prever la evolución de una variable que observamos a lo largo del tiempo. La variables de interés puede ser macroeconómica (índice de precios al consumo, demanda de electricidad, series de exportaciones o importaciones, etc.), microeconómica (ventas de una empresa, existencias en un almacén, gastos en publicidad de un sector), física (velocidad del viento en una central eólica, temperatura en un proceso, caudal de un río, concentración en la atmósfera de un

Page 17: ESTADISTICA ADMNISTRATIVA 2

agente contaminante), o social (número de nacimientos, matrimonios, defunciones, o votos a un partido político).  DEFINICIÓN DE SERIE DE TIEMPO En muchas áreas del conocimiento las observaciones de interés son obtenidas en instantes sucesivos del tiempo, por ejemplo, a cada hora, durante 24 horas, mensuales, trimestrales, semestrales o bien registradas por algún equipo en forma continua. Llamamos Serie de Tiempo a un conjunto de mediciones de cierto fenómeno o experimento registradas secuencialmente en el tiempo. Estas observaciones serán denotadas por {x(t1), x(t2), ..., x(tn)} = {x(t) : t Î T Í R} con x(ti) el valor de la variable x en el instante ti. Si T = Z se dece que la serie de tiempo es discreta y si T = R se dice que la serie de tiempo es continua. Cuando ti+1 - ti = k para todo i = 1,...,n-1, se dice que la serie es equiespaciada, en caso contrario será no equiespaciada. En adelante se trabajará con series de tiempo discreta, equiespaciadas en cuyo caso asumiremos y sin perdida de generalidad que: {x(t1), x(t2), ..., x(tn)}= {x(1), x(2), ..., x(n)}.  

PRIMER PASO AL ANALIZAR CUALQUIER SERIE DE TIEMPO

 El primer paso en el análisis de series de tiempo, consiste en graficar la serie. Esto nos permite detectar las componentes esenciales de la serie.  El gráfico de la serie permitirá: a) Detectar Outlier: se refiere a puntos de la serie que se escapan de lo normal. Un outliers es una observación de la serie que corresponde a un comportamiento anormal del fenómeno (sin incidencias futuras) o a un error de medición. Se debe determinar desde fuera si un punto dado es outlier o no. Si se concluye que lo es, se debe omitir o reemplazar por otro valor antes de analizar la serie. 

Page 18: ESTADISTICA ADMNISTRATIVA 2

Por ejemplo, en un estudio de la producción diaria en una fabrica se presentó la siguiente situación ver figura 1.1:

Figura 1.1Los dos puntos enmarcados en un círculo parecen corresponder a un comportamiento anormal de la serie. Al investigar estos dos puntos se vio que correspondían a dos días de paro, lo que naturalmente afectó la producción en esos días. El problema fue solucionado eliminando las observaciones e interpolando. b) Permite detectar tendencia: la tendencia representa el comportamiento predominante de la serie. Esta puede ser definida vagamente como el cambio de la media a lo largo de un periodo (ver figura 1.2).

Figura 1.2 c) Variación estacional: la variación estacional representa un movimiento periódico de la serie de tiempo. La duración de la unidad del periodo es generalmente menor que un año. Puede ser un trimestre, un mes o un día, etc (ver figura 1.3). Matemáticamente, podemos decir que la serie representa variación estacional si existe un número s tal que x(t) = x(t + k×s).

 

Page 19: ESTADISTICA ADMNISTRATIVA 2

Las principales fuerzas que causan una variación estacional son las condiciones del tiempo, como por ejemplo:

1) en invierno las ventas de helado2) en verano la venta de lana3) exportación de fruta en marzo.

 Todos estos fenómenos presentan un comportamiento estacional (anual, semanal, etc.)

Figura 1.3 d) Variaciones irregulares (componente aleatoria): los movimientos irregulares (al azar) representan todos los tipos de movimientos de una serie de tiempo que no sea tendencia, variaciones estaciónales y fluctuaciones cíclicas.  http://ciberconta.unizar.es/LECCION/seriest/100.HTM#_Toc523661801

4.2 ANALISIS DE LA TENDENCIA

Análisis de tendencia.

Objetivo. Calcular las previsiones para años futuros dada una serie de datos con un modelo sencillo.

Los datos a utilizar son los siguientes y que se presentan de esta manera por economía de espacio.

t 1 2 3 4 5 6 7 8 9 10 11 12

X99,93 103 103,41 112,79 109,52 113,57 110,5 120,42 118,23 119 118,75 127,32

t 13 14 15 16 17 18 19 20 21 22 23 24

Xt 124,93 128,13 127,55 137,06 131,95 133,91 135,35 146,19 138,57 143,14 144,64 153,72

Se va a indicar la manera de hacer esta práctica paso a paso, por lo que no será necesario el conocimiento previo ni de análisis de series de datos ni del uso de la hoja de cálculo

Page 20: ESTADISTICA ADMNISTRATIVA 2

El primer paso sería introducir los datos de la tabla anterior en una columna que denominaremos X.

Segundo paso, representar la serie X en el tiempo. Para eso seleccionamos los datos de la columna X, y vamos a [Insertar] [Diagrama]. Seguiremos los pasos de la sección Gráficos en la página .

Supongamos:

Obtener el componente tendencial, . En la celda B1, ponemos t introducimos 1, en B3 escribimos =1+b2. Copiamos la celda B3 desde B4 hasta B25. En la celda C1 escribimos Tt. En C2, =100+2*b2 5.15. Y copiamos C2 desde C3 hasta C25.

Componente estacional, . Definimos las variables cualitativas:

Obteniendo las variables cualitativas estacionales. En D1 escribimos d1, en D2 ponemos 1, en las celdas D3, D4, D5 se escribe 0. En E1, d2, para E2, escribimos 1, y en E2, E4 y E5, 0. Para F1, d3, 1 en F4, 0 para F2, F3 y F5. En G1 ponemos d4, em G2, G3, G4 0, para G5 1. Se seleccionan las celdas D2 hasta G5 y se copian desde D6 hasta G25. En la celda H1 escribimos St, y en H2 =-1*d2-1*e2-2*f2+4*g2, copiaremos esta casilla desde H3 hasta H25.

Componente irregular, . En la celda I1 se escribe It. En la celda I2 =a2-c2-h2. Copiaremos I2 desde I3 hasta I25. Calculamos el valor medio de la serie: en I26 insertamos =suma(i2:125)/24.

El último paso que faltaría es representar gráficamente las series , e

frente al tiempo.

http://g.unsa.edu.ar/lucas/basico/node127.html

Page 21: ESTADISTICA ADMNISTRATIVA 2

4.8 PROMEDIOS MOVILES

La primera consideración que hacemos es la de la permanencia en nuestro pronóstico de observaciones que se encuentran muy alejadas del momento presente. En el ejemplo no se ve claramente esto, pero si hubiéramos tenido cien valores en la serie en lugar de doce, parecería extraño que los primeros 10 datos tuvieran ingerencia tan directa como los últimos 10, en el pronóstico. Es bueno que nuestro pronóstico tenga ``memoria'' ¡pero no tanta!

Por otra parte, al pasar el tiempo, la importancia de cada término en particular para el promedio disminuye notablemente. Esto quiere decir que el valor que observamos al tiempo t va teniendo menos importancia para el pronóstico y los valores previos (la historia) cobran tanta importancia que nuestro pronóstico le da un peso excesivo a la historia.

Los dos males anteriores (que en realidad son sólo uno) tienen como remedio el promedio móvil.

Este consiste en promediar sólo las últimas observaciones. Conforme avanza el tiempo dejamos fuera del promedio a los datos más viejos y vamos incorporando datos nuevos. Por eso recibe el nombre de promedio móvil.

Un promedio móvil tiene un parámetro que es la amplitud del promedio, es decir, cuántos datos ponemos en el promedio.

Si el valor de este parámetro es grande, el suavizado es mayor; si es pequeño el suavizado es menor.

Con nuestro pequeño ejemplo, podemos hacer promedios móviles de orden 3 y de orden 5. Como sigue

tiempo 1 2 3 4 5 6 7 8 9 10 11 valor 200 135 195 198 310 175 155 130 220 277 235 Prom.(3) *** *** 177 176 234 228 213 153 168 209 244 Prom.(5) *** *** *** *** 208 202 206 194 198 191 204

Las dos series de promedios móviles son más suaves que los datos originales y las podemos usar como pronóstico recorriéndolas hacia adelante de la misma forma que recorrimos para adelante a los promedios simples antes.

Page 22: ESTADISTICA ADMNISTRATIVA 2

Promedios móviles y estacionalidad.

También es adecuado que en este momento nos demos cuenta de otro fenómeno notable. Si tuviésemos una serie con estacionalidad de orden 4, por ejemplo, e hiciésemos con ella promedios móviles de longitud 4 (ú 8, o 12, o cualquier otro múltiplo de 4) la estacionalidad se perdería. La razón es que las desviaciones de un promedio que tipifican a la estacionalidad se cancelan al momento de hacer la suma que va en el numerador del promedio móvil.

Promedios móviles y tendencia.

El método de los promedios móviles está diseñado para una serie que tenga un patrón horizontal. Si la serie tiene alguna tendencia, el promóvil puede equivocarse por completo. Veamos un ejemplo para determinar cuales son los daños y descubrir como remediarlos.

Pensemos en una serie completamente artificial. Esta serie sigue en forma perfecta una línea recta.

tiempo 1 2 3 4 5 6 7 8 9 10 11 valor 5.1 7.8 10.5 13.2 15.9 18.6 21.3 24.0 26.7 29.4 32.1 pm(4) ** ** ** 9.1 11.8 14.5 17.2 19.9 22.6 25.3 28.0 pron ** ** ** ** 9.1 11.8 14.5 17.2 19.9 22.6 25.3 error ** ** ** ** 6.8 6.8 6.8 6.8 6.8 6.8 6.8

Podemos observar que los pronósticos siempre arriban ¡demasiado tarde! El error es sistemático: la serie de promedios móviles da valores consistentemente menores.

La forma de corregir el pronóstico es un poco sorprendente. Al menos, la primera vez que se la presentan a uno, es sorprendente.

Para pronosticar en este caso, hacemos lo siguiente:

Calculamos los promóviles de longitud 4: S't Calculamos los promóviles de los promóviles: S''t Calculamos los parámetros de un recta: ordenada al origen y pendiente,

como sigue

At = S't + ( S't - S''t )

Bt = 2 ( S't - S''t ) / (k - 1)

donde k es la longitud del promóvil.

Page 23: ESTADISTICA ADMNISTRATIVA 2

Pronosticamos siguiendo la línea recta:

F(t+m) = At + (m) Bt

Fíjese que el pronóstico se hace siguiendo una línea recta. m representa el número de periodos hacia adelante que queremos pronosticar. Lo usual será que busquemos el pronóstico sólo para un período adelante (el pronóstico para mañana) en cuyo caso m = 1 y F(t+1) = At + Bt.

La recta que sirve para pronosticar va cambiando en cada momento, tanto en su pendiente como en su ordenada al origen. Además el valor de los parámetros de la recta se basa principalmente en la diferencia del promedio móvil y del ``promedio móvil doble'' ( S''t ).

En nuestro ejemplo los números son:

t 1 2 3 4 5 6 7 8 9 10 11 Xt 5.1 7.8 10.5 13.2 15.9 18.6 21.3 24.0 26.7 29.4 32.1 S't ** ** ** 9.1 11.8 14.5 17.2 19.9 22.6 25.3 28.0 S''t ** ** ** ** ** ** 13.2 15.9 18.6 21.3 24.0 At ** ** ** ** ** ** 21.3 24.0 26.7 29.4 32.1 Bt ** ** ** ** ** ** 2.7 2.7 2.7 2.7 2.7 pron ** ** ** ** ** ** ** 24.0 26.7 29.4 32.1

Como partimos de una serie artificial, calculada con la ecuación de una recta, el pronóstico obtenido es perfecto. Con una serie real, no se espera que tengamos el mismo éxito. Por otra parte, notamos que la ordenada al origen recuperó los valores de Xt. También, en el ejemplo, se ve que la pendiente siempre resultó igual y con el valor ``correcto''.

A este método de pronóstico le llamamos PROMEDIO MÓVIL LINEAL

http://www.mor.itesm.mx/~cmendoza/cd841/cd2105.html

UNIDAD 5

Page 24: ESTADISTICA ADMNISTRATIVA 2

ESTADÍSTICA NO PARAMETRICA

5.1 ESCALA DE MEDICION

En cualquier análisis estadístico que se haga, se manejan datos que provienen de la medición de una variable o variables seleccionadas en el estudio. Las variables son las características que interesan en los sujetos u objetos que se estudian, por ejemplo podría ser la edad de los empleados de una empresa, el monto de las ventas de determinado artículo, la ocupación de los clientes de cierto negocio, etc. Para obtener los datos relativos a las variables de interés, se requiere hacer una medición, como podría ser preguntar las edades de los empleados o la ocupación de los clientes, pero como puede apreciarse, los datos que se obtendrían serían de diferente tipo, pues para la primera variable, serían números y para la segunda categorías. La medición la llevamos a cabo en el momento en que le asignamos un número correspondiente a la edad o una categoría correspondiente a la ocupación1. Resulta obvio que en este caso, no estamos midiendo de la misma manera ambas variables, pero además de que las mediciones nos arroja valores de estos dos tipos, es posible medir las variables con otras escalas diferentes, lo cual depende de sus características; a continuación se hará una breve explicación de las diferentes escalas con las que se pueden medir las variables.

1. Escala nominal

Las variables que solamente se pueden medir con esta escala, son los cualitativas, también llamados categóricas, en ellas se pueden encontrar diferentes categorías, como por ejemplo, la variable sexo puede tomar dos valores que son: masculino y femenino, para que las categorías de clasificación sean útiles, deben ser mutuamente excluyentes, complementarias y exhaustivas. En cada una de ellas se puede obtener la frecuencia.

2. Escala ordinal

Las variables que se pueden medir con esta escala, son de tipo cuantitativo y en ésta, las variables pueden tomar diferentes valores, de tal manera que es posible ordenar estos valores en forma ascendente o descendente, pero no se puede saber si la diferencia entre dos valores es la misma o diferente a la diferencia entre otros dos valores.

Se usa cuando se pueden detectar diferentes grados del valor de una variable y que los datos recopilados a partir de ella, se pueden ordenar por rangos. Por ejemplo, si se le presentan tres refrescos diferentes a una persona y se le pide que exprese su preferencia utilizando una escala del uno al tres, esto lo estamos evaluando en una escala ordinal, pues se puede suponer que hay un orden en los resultados, pero la diferencia en las puntuaciones no tiene importancia, pues no se puede saber si la diferencia entre un tres y un dos es la misma que entre un uno y un dos.

Page 25: ESTADISTICA ADMNISTRATIVA 2

Otro ejemplo lo tenemos cuando comparamos dureza de materiales y decimos que A es más duro que B si A raya a B.

3. Escala de intervalo

Cuando además de distinguir diferencias en grado, en la propiedad de un objeto, también se pueden distinguir diferencias iguales entre objetos, se tiene una medida de intervalo. Una forma de distinguir variables que se miden en esta escala, es que el cero no indica que hay ausencia de la variable. Un ejemplo típico de una variable que se mide en esta escala, es la temperatura cuando se mide en grados Fahrenheit o en grados Centígrados, pues éstas como es ya conocido, no son escalas absolutas, sino relativas. Sabemos que la diferencia entre 30º C y 35º C es la misma que entre 45º C y 50º C y si se dice que un líquido se encuentra a 0º C, no significa que no tiene temperatura.

4. Escala de razón o proporcional

En esta escala se cumplen todas las características que en las anteriores, además de que el cero sí indica una ausencia de la variable, por ejemplo, si la variable son los gastos semanales de una persona y nos dice que no tuvo gastos durante la semana, entonces es válido decir que sus gastos semanales fueron iguales a cero. Hay muchas variables de interés en la economía y administración que se evalúan en una escala de razón, otra podría ser la antigüedad de una persona en una empresa; si sabemos de alguien que apenas va a entrar a trabajar ahí y no tiene antigüedad se puede decir que su antigüedad es igual a cero años o meses.

http://www.uv.mx/iiesca/revista2/bety1.html

5.2 METODOS ESTADÍSTICOS NO PARAMETRICOS

Partiendo de la base de que algunos contrastes de hipótesis dependen del supuesto de normalidad, muchos de estos contrastes siguen siendo aproximadamente válidos cuando se aplican a muestras muy grandes, incluso si la distribución de la población no es normal. Sin embargo, muchas veces se da también el caso de que, en aplicaciones prácticas, dicho supuesto de normalidad no sea sostenible. Lo deseable entonces será buscar la inferencia en contrastes que sean válidos bajo un amplio rango de distribuciones de la población. Tales contrastes se denominan no paramétricos.

En este tema intentaré describir contrastes no paramétricos que son apropiados para analizar algunos de los problemas que hubiera podido encontrar antes. Los contrastes no paramétricos son generalmente, válidos cualquiera que sea la distribución de la población. Es decir, dichos contrastes pueden ser desarrollados de manera que tengan el nivel de significación requerido, sin importar la distribución de los miembros de la población.

Page 26: ESTADISTICA ADMNISTRATIVA 2

Mi objetivo, es dar una idea general de aquellos métodos que son mas utilizados. Así, en el presente tema trataré procedimientos no paramétricos para contrastar la igualdad de los parámetros de centralización de dos distribuciones poblacionales.

La mayor parte de las técnicas estudiadas hacen suposiciones sobre la composición de los datos de la población. Las suposiciones comunes son que la población sigue una distribución normal, que varias poblaciones tienen varianzas iguales y que los datos se miden en una escala de intervalos o en una escala de razón. Este tema presentará un grupo de técnicas llamadas no paramétricas que son útiles cuando estas suposiciones no se cumplen.

¿Porqué los administradores deben tener conocimientos sobre estadística no paramétrica?

La respuesta a esta pregunta es muy sencilla; las pruebas de ji cuadrada son pruebas no paramétricas. Tanto la prueba de la tabla de contingencia como la de bondad de ajuste analizan datos nominales u ordinales. Estas pruebas, se usan ampliamente en las aplicaciones de negocios, lo que demuestra la importancia de la habilidad para manejar datos categóricos o jerarquizados además de los cuantitativos.

Existen otras muchas pruebas estadísticas diseñadas para situaciones en las que no se cumplen las suposiciones críticas o que involucran datos cuantitativos o categóricos. Los analistas que manejan estos datos deben familiarizarse con libros que abordan tales pruebas, conocidas comúnmente como pruebas estadísticas no paramétricas. Se presentarán aquí unas cuantas de las pruebas no paramétricas que mas se usan.

¿Qué ocurre con las pruebas no paramétricas frente a las que si lo son?

Las pruebas no paramétricas no necesitan suposiciones respecto a la composición de los datos poblacionales. Las pruebas no paramétricas son de uso común:

1.- Cuando no se cumplen las suposiciones requeridas por otras técnicas usadas, por lo general llamadas pruebas paramétricas.

2.- Cuando es necesario usar un tamaño de muestra pequeño y no es posible verificar que se cumplan ciertas suposiciones clave.

3.- Cuando se necesita convertir datos cualitativos a información útil para la toma de decisiones.

Existen muchos casos en los que se recogen datos medidos en una escala nominal u ordinal. Muchas aplicaciones de negocios involucran opiniones o sentimientos y esos datos se usan de manera cualitativa.

Page 27: ESTADISTICA ADMNISTRATIVA 2

Las pruebas no paramétricas tienen varias ventajas sobre las pruebas paramétricas:

1.- Por lo general, son fáciles de usar y entender.

2.- Eliminan la necesidad de suposiciones restrictivas de las pruebas paramétricas.

3.- Se pueden usar con muestras pequeñas.

4.- Se pueden usar con datos cualitativos.

También las pruebas no paramétricas tienen desventajas:

1.- A veces, ignoran, desperdician o pierden información.

2.- No son tan eficientes como las paramétricas.

3.- Llevan a una mayor probabilidad de no rechazar una hipótesis nula falsa (incurriendo en un error de tipo II).

Las pruebas no paramétricas son pruebas estadísticas que no hacen suposiciones sobre la constitución de los datos de la población.

Por lo general, las pruebas paramétricas son mas poderosas que las pruebas no paramétricas y deben usarse siempre que sea posible. Es importante observar, que aunque las pruebas no paramétricas no hacen suposiciones sobre la distribución de la población que se muestrea, muchas veces se apoyan en distribuciones muéstrales como la normal o la ji cuadrada.

EL CONTRASTE DE SIGNOS

La prueba de los signos es quizá la prueba no paramétrica mas antigua. En ella está, basadas muchas otras. Se utiliza para contrastar hipótesis sobre el parámetro de centralización y es usado fundamentalmente en el análisis de comparación de datos pareados. Consideremos una muestra aleatoria de tamaño n tal que sus observaciones estén o puedan estar clasificadas en dos categorías: 0 y 1, + y -, ... etc.

Podemos establecer hipótesis acerca de la mediana, los centiles, cuartiles, etc. Sabemos que la mediana deja por encima de sí tantos valores como por debajo; Considerando que Xi - Mdn > 0 , darán signos positivos (+) y Xi - Mdn < 0 signos negativos (-) , en la población original tendremos tantos (+) como (-). Se tratara de ver hasta que punto el numero de signos (+) esta dentro de lo que cabe esperar

Page 28: ESTADISTICA ADMNISTRATIVA 2

que ocurra por azar si el valor propuesto como mediana es verdadero. Lo mismo se puede decir respecto a los cuartiles, centiles, o deciles.

Teniendo en cuenta que se trabaja con dos clases de valores, los que están por encima y los que están por debajo, es decir, los (+) y los (-) , los estadísticos de contraste seguirán la distribución binomial, si se supone independencia y constancia de probabilidad en el muestreo.

La mejor forma de entender este apartado es mediante un ejemplo practico; De modo que en la tabla que pondremos a continuación se pueden ver los resultados de un experimento sobre comparación de sabores. Un fabricante de alubias esta considerando una nueva receta para la salsa utilizada en su producto. Eligio una muestra aleatoria de ocho individuos y a cada uno de ellos le pedio que valorara en una escala de 1 a 10 el sabor del producto original y el nuevo producto. Los resultados se muestran en la tabla, donde también aparecen las diferencias en las valoraciones para cada sabor y los signos de estas diferencias. Es decir, tendremos un signo + cuando el producto preferido sea el original, un signo - cuando el preferido sea el nuevo producto y un 0 si los dos productos son valorados por igual. En particular en este experimento, dos individuos han preferido el producto original y cinco el nuevo; Uno los valoro con la misma puntuación.

La hipótesis nula es que ninguno de los dos productos es preferido sobre el otro. Comparamos las valoraciones que indican la preferencia por cada producto, descartando aquellos casos en los que los dos productos fueron valorados con la misma puntuación. Así el tamaño muestral efectivo se reduce a siete, y la única información muestral en que se basara nuestro contraste será la de los dos individuos de los siete que prefirieron el producto original.

La hipótesis nula puede ser vista como aquella en la que la media poblacional de las diferencias sea 0. Si esta hipótesis fuese cierta, nuestra sucesión de diferencias + y - podría ser considerada como una muestra aleatoria de una población en la que las probabilidades de + y - fueran cada una 0,5. En este caso, las observaciones constituirían una muestra aleatoria de una población con una distribución binomial, con probabilidad de + 0,5. Es decir, si p representa la verdadera proporción en la población de +,la hipótesis nula será:

H0: p = 0,5

Podemos querer contrastar esta hipótesis bien frente alternativas unilaterales, bien frente a alternativas bilaterales. Supongamos que en el ejemplo de preferencias por los sabores la hipótesis alternativa es que en la población, la mayoría de las preferencias son por el nuevo producto. Esta alternativa se expresa como:

H1: p < 0,5

Tabla:

Page 29: ESTADISTICA ADMNISTRATIVA 2

INDIVIDUO VALORACION DIFERENCIASIGNO DE LA DIFERENCIA

PRODUCTO ORIGINAL

PRODUCTO NUEVO

A 6 8 -2 -

B 4 9 -5 -

C 5 4 1 +

D 8 7 1 +

E 3 9 -6 -

F 6 9 -3 -

G 7 7 0 0

H 5 9 -4 -

Al contrastar la hipótesis nula frente a esta alternativa, nos preguntamos, ¿Cuál es la probabilidad de observar en la muestra un resultado similar a aquel que se observaría si la hipótesis nula fuese, de hecho, cierta? Si representamos por P(x) la probabilidad de observar x “Éxitos” (+) en una binomial de tamaño 7 con probabilidad de éxito 0,5, la probabilidad de observar dos o menos + es:

P(0)+P(1)+P(2) = 0,0078 + 0,0547 + 0,1641 = 0,2266

Por tanto, si adoptamos la regla de decisión “rechazar H0 si en la muestra tenemos dos o menos +” , la probabilidad de rechazar la hipótesis nula cuando en realidad de cierta será de 0,2266. Dicho contraste tiene un nivel de significación del 22,66 % y , en nuestro ejemplo, la hipótesis nula podrá ser rechazada a dicho nivel. Es importante también preguntarse a que nivel dejaremos de rechazar la hipótesis nula. Si hubiésemos tenido la regla de decisión “ningún + o un +” para rechazar, H0 no hubiera sido rechazada. El nivel de significación de este nuevo test es:

P(0)+P(1) = 0,0625

La hipótesis nula no será rechazada a un nivel de significación del contraste del 6,25 %. La hipótesis nula de que en la población las preferencias por un producto u otro son iguales es rechazada contra la hipótesis alternativa de que la mayoría de la población prefiere el nuevo producto utilizando un test con nivel de significación del 22,66% . Si embargo la hipótesis nula no puede ser rechazada utilizando el test con nivel de significación del 6,25%.

Por tanto, estos datos muestran una modesta evidencia contra la hipótesis nula de que la población tenga preferencias iguales por un producto u otro, aunque dicha evidencia no es muy grande. En nuestro caso, esto puede ser una consecuencia

Page 30: ESTADISTICA ADMNISTRATIVA 2

del pequeño tamaño muestral. Tenemos que considerar el caso en el que la hipótesis alternativa sea bilateral, es decir:

H1: p " 0,5

En nuestro ejemplo, esta hipótesis significa que la población puede preferir uno u otro producto. Si las alternativas a cada valor postulado por la hipótesis nula son tratados de forma simétrica, una regla de decisión que nos conduciría a rechazar la hipótesis nula para estos datos seria “rechazas Ho si la muestra contiene dos o menos, o cinco o mas +”. El nivel de significación para este contraste es:

P(0) + P(1) + P(2) + P(5) + P(6) + P(7) = 2 [P(0) + P(1) + P(2)] = 0.4532

Ya que la función de probabilidad de la distribución binomial es simétrica para p = 0,5. La hipótesis nula no será rechazada si no tomamos como regla de decisión “rechazar H0 si la muestra contiene dos o menos o seis o mas +s”.Este contraste tiene nivel de significación:

P(0) + P(1) + P(6) + P(7) = 2 [ P(0) + P(1)] = 0,1250

Por tanto, a un nivel de significación del contraste del 12,5 %, la hipótesis nula de que la mitad de los miembros de la población con alguna preferencia prefieren el nuevo producto no será rechazado frente a la hipótesis alternativa bilateral.

El contraste de signos puede ser utilizado para contrastarla hipótesis nula de que la mediana de una población es 0. Supongamos que tomamos una muestra aleatoria de una población y eliminamos aquellas observaciones iguales a 0, quedando en total n observaciones. La hipótesis nula a contrastar será que la proporción p de observaciones positivas en la población es 0,5 es decir:

H0 : p = 0,5

En este caso, el contraste estará basado en el hecho de que el numero de observaciones positivas en la muestra tiene una distribución binomial ( p = 0,5 bajo la hipótesis nula).

Si el tamaño muestral es grande, se podrá utilizar la aproximación de la distribución binomial a la normal para realizar el contraste de signos. Esta es una consecuencia del teorema central del límite.

Si el numero de observaciones no iguales a 0 es grande, el contraste de signos esta basado en la aproximación de la binomial a la normal. El contraste es:

H0 : p = 0,5

Page 31: ESTADISTICA ADMNISTRATIVA 2

EJEMPLO

A una muestra aleatoria de cien niños se les pidió que comparasen dos nuevos sabores de helados: vainilla y fresa. 56 de los niños prefirieron el sabor a vainilla, 40 prefirieron el sabor a fresa, y a 4 de ellos les daba igual. Se quiere contrastar frente a una alternativa bilateral la hipótesis nula de que no existe en la población una preferencia por un sabor u otro.

Si p es la proporción de niños en la población que prefieren el sabor a vainilla, lo que queremos contrastar es H0: p=0,5 frente a H1: p"0,5.

Como cuatro de los niños no han preferido un sabor a otro, tenemos un tamaño muestral de 96 niños. La proporción de niños que han preferido el sabor a vainilla es:

Px = 56 / 96 = 0,583

Para un nivel de significación , la regla de decisión es:

Px - 0,5

Rechazar H0 si -------------------- < -Z/2

"(0,5)(0,5) / n

ó

Px - 0,5

-------------------- > -Z/2

"(0,5)(0,5) / n

En nuestro caso

Px - 0,5 0,583 - 0,5

-------------------- = ------------------------ = 1,63

"(0,5)(0,5) / n "(0,5)(0,5) / 96

Vemos, que si Z/2 = 1,63, /2 = 0,0516, de manera que = 0,1032. Por tanto, la hipótesis nula podrá ser rechazada para todos los niveles de significación superiores al 10,32%. Si la hipótesis nula de que el mismo número de niños prefieren el sabor a vainilla que el sabor a fresa fuese cierta, la probabilidad de observar unos resultados maestrales tan extremos, o mas extremos que los

Page 32: ESTADISTICA ADMNISTRATIVA 2

actualmente obtenidos, será ligeramente superior a uno sobre diez. En nuestro caso, los datos muestran una modesta evidencia en contra de dicha hipótesis.

La figura muestra las probabilidades de las colas de una distribución normal correspondientes al 5,16% inferior y superior del área total bajo la función de densidad.

EJEMPLO 2

Como parte de un estudio sobre transferencia del aprendizaje entre tareas simples y complejas, se diseña un experimento en el que cada sujeto se le presentan 5 tareas simples y a continuación 1 tarea compleja. Al finalizar ésta se le pregunta a cada sujeto si le ha parecido mas fácil o mas difícil que las 5 anteriores. Si algún sujeto contestaba “ igualmente difícil”, se le seguía preguntando hasta decidirse por “ mas fácil “ o “ mas difícil “. Las respuestas dadas por los 10 sujetos fueron:

SUJETO 1 2 3 4 5 6 7 8 9 10

RESPUESTA D F F D F F F D F F

Page 33: ESTADISTICA ADMNISTRATIVA 2

¿ Podemos concluir que ha habido transferencia, a un nivel de significación de 0,01 ?

Siendo D (Mas difícil = - ) y F = +

H0: P (-) "½ (No ha habido transferencia)

H1: P (-) <½ (Ha habido transferencia)

Suponemos que las observaciones son independientes y que bajo H0 p (-) es constante por cada sujeto.

Estadístico de contraste t1 = 7, t2 = 3, t = 3.

(3 + 0,5) - (10 / 2)

Z = ---------------------------- = -0,949

" 10 / 4

Dado que = 0,01 y Z0,01 = -2,33:

P (T " 3) = 0,172 > 0,01, mantenemos H0.

-0,949 > -2,33, mantenemos H0.

No hay evidencia suficiente para concluir que ha habido transferencia. Sólo si T hubiera tomado valor 0, podríamos haber llegado a tal conclusión ya que P (T " 0) " 0,001 < 0,01.

http://www.itch.edu.mx/academic/industrial/estadistica1/cap04d.html

5.3 PRUEBA DE CORRIDAS PARA ALEATORIEDAD

Muchos métodos de tipo inferencial, se basan en el supuesto de que se manejan muestras aleatorias. Cuando se tiene una aplicación en la que es difícil saber si esta suposición se justifica o cuando no es posible seleccionar una muestra aleatoria por contar solamente con cierta información; se tienen dentro de las técnicas no paramétricas varios métodos que hacen posible juzgar la aleatoriedad sobre la base del orden o secuencia en el que se realizan las observaciones o en el que los puntajes u observaciones fueron obtenidos originalmente. Lo que se analiza es si aparecen patrones de los que se sospeche no sean aleatorios.

Page 34: ESTADISTICA ADMNISTRATIVA 2

En las variables de tipo nominal, una corrida es una sucesión de letras u otro símbolo idénticos que van seguidos o precedidos de otra letra, símbolo, diversas letras o de ninguna, si se encuentra en el inicio o al final de una sucesión.4 Por ejemplo, cuando se lanza una moneda diez veces y si representamos por A el águila y con S el sol, se puede presentar la siguiente sucesión de resultados:

A SS AAA S AA  S                                                                        1   2    3    4   5   6

Aquí se presentan seis corridas o rachas. Esta prueba puede aplicarse a variables de tipo cualitativo y cuantitativo, en el segundo caso, se utiliza la mediana como medida de referencia y a los valores que caigan arriba de ella se les asigna un signo positivo (+) o una letra como por ejemplo la A y a los que caigan abajo de ella, se les asigna el signo negativo (-) o una letra distinta, como por ejemplo la B y a partir de los signos o letras asignados, se identifican las rachas o corridas.

En estos casos, el número de corridas que se tiene es una buena indicación de una posible falta de aleatoriedad, que se presentaría con pocas o demasiadas corridas. Aquí se prueba aleatoriedad en el proceso de generación de una serie de observaciones de una variable aleatoria que sólo toma dos valores y la probabilidad de cada uno de ellos es 0.5, por lo cual la prueba se basa en una distribución binomial con probabilidad igual a 0.5. Se tiene una tabla realizada a partir de la distribución mencionada, mediante la que se hace la prueba de aleatoriedad de rachas en la que se encuentran los valores críticos del número de rachas tomando en cuenta el número de elementos de una clase (n1) y el número de elementos de la otra clase (n2). Cuando n1 y n2 son mayores que 20, la distribución muestral se puede determinar en forma muy aproximada con una distribución de probabilidad normal.

http://www.itch.edu.mx/academic/industrial/estadistica1/cap04d.html

5.4 UNA MUESTRA: PRUEBA DE SIGNOS

Se cree que esta prueba es la más antigua dentro de la estadística no paramétrica, pues se reporta en la literatura desde 1710 por Arbuthnott.2

Esta prueba corresponde a la prueba de media de una sola muestra y se recurre a ella cuando la muestra es de menos de 30 elementos y no se puede sostener el supuesto de normalidad de la población.

Se le llama prueba del signo porque la información contenida en la muestra seleccionada se puede transformar en un conjunto de signos más y menos; y cuando se hace la prueba no se hace uso de la magnitud de los valores de la muestra, sino solamente se consideran los signos.

Ésta se aplica cuando se muestrea una población simétrica continua de tal manera que la probabilidad de que una valor sea mayor que la media o menor que la media es de un medio. Para esta prueba se utiliza la distribución binomial.

Page 35: ESTADISTICA ADMNISTRATIVA 2

En esta prueba se tiene la hipótesis nula H0 : m = m0 contra la alternativa pertinente, pudiendo ser ésta de uno o dos extremos. Los supuestos que se deben tomar en cuenta para aplicarla, son los siguientes: se tiene una muestra aleatoria que proviene de una población con mediana desconocida, la variable de interés se mide en escala ordinal o más fuerte y esta misma variable es de naturaleza continua .Cuando la variable se mide en escala ordinal, las hipótesis se referirán a la mediana y no a la media.

http://www.itch.edu.mx/academic/industrial/estadistica1/cap04d.html

5.5 UNA MUESTRA: PRUEBA DE WILCOXON

PRUEBA DE WILCOXON

Sea X una variable aleatoria continua. Podemos plantear cierta hipótesis sobre la mediana de dicha variable en la población, por ejemplo, M=M0. Extraigamos una muestra de tamaño m y averigüemos las diferencias Di = X - M0. Consideremos únicamente las n diferencias no nulas (n " m). Atribuyamos un rango u orden (0i) a cada diferencia según su magnitud sin tener en cuenta el signo.

Sumemos por un lado los 0+i , rangos correspondientes a diferencias positivas y por otro lado los 0-i , rangos correspondientes a diferencias negativas.

La suma de los órdenes de diferencias positivas sería igual a la suma de los órdenes de diferencias negativas, caso que la mediana fuera el valor propuesto M0. En las muestras, siendo M0 el valor de la verdadera mediana, aparecerán por azar ciertas discrepancias, pero si la suma de los rangos de un ciclo es considerablemente mayor que la suma de los rangos de otro signo, nos hará concebir serias dudas sobre la veracidad de M0.

La prueba de Wilcoxon va a permitir contrastar la hipótesis de que una muestra aleatoria procede de una población con mediana M0. Además, bajo el supuesto de simetría este contraste se puede referir a la media, E(X). Esta prueba es mucho mas sensible y poderosa que la prueba de los signos; como se puede apreciar utiliza mas información, pues no solo tiene en cuenta si las diferencias son positivas o negativas, sino también su magnitud.

El contraste de Wilcoxon puede ser utilizado para comparar datos por parejas. Supongamos que la distribución de las diferencias es simétrica, y nuestro propósito es contrastar la hipótesis nula de que dicha distribución está centrada en 0. Eliminando aquellos pares para los cuales la diferencia es 0 se calculan los rangos en orden creciente de magnitud de los valores absolutos de las restantes diferencias. Se calculan las sumas de los rangos positivos y negativos, y la menor de estas sumas es el estadístico de Wilcoxon. La hipótesis nula será rechazada si T es menor o igual que el valor correspondiente.

Page 36: ESTADISTICA ADMNISTRATIVA 2

Si el número n de diferencias no nulas es grande y T es el valor observado del estadístico de Wilcoxon los siguientes contrastes tienen nivel de significación .

Si la hipótesis alternativa es unilateral, rechazaremos la hipótesis nula si

T - µT

--------- < -Z

T

Si la hipótesis alternativa es bilateral, rechazaremos la hipótesis nula si

T - µT

--------- < -Z/2

T

EJEMPLO

La salud mental de la población activa de sujetos de 60 años tiene

una mediana de 80 en una prueba de desajuste emocional (X). Un psicólogo cree que tras el retiro (jubilación) esta población sufre desajustes emocionales. Con el fin de verificarlo, selecciona al azar una muestra de sujetos retirados, les pasa la prueba de desajuste y se obtienen los siguientes resultados:

X: 69,70,75,79,83,86,88,89,90,93,96,97,98,99

¿Se puede concluir, con un nivel de significación de 0,05, que tras el retiro aumenta el promedio de desajuste emocional?

1.-

H0: M " 80 La población no incrementa su promedio de desajuste.

H1: M > 80 La población aumenta su nivel de desajuste tras el retiro.

2.- Suponemos que la muestra es aleatoria, la variable es continua y el nivel de medida de intervalo.

3.- Aunque la muestra es pequeña usemos los dos estadísticos:

Averigüemos Di = X - 80 y ordenemos las | Di |:

Page 37: ESTADISTICA ADMNISTRATIVA 2

Di = -11, -10, -5, -1, +3, +6, +8, +9, +10, +13, +16, +17, +18, +19

Oi = 9, 7,5, 3 , 1, 2, 5, 6, 7,5, 10, 11, 12, 13, 14

W= "Oi = 9+7,5+3+1 = 20,5

(20,5 + 0,5) - (14)(15)/4 21 - 52,5

Z = ---------------------------------- = --------------- = -1,98

"(14)(15)(28 + 1)/24 15,93

4.- Puesto que = 0,05:

W14,0,05 = 26 > 20,5, por lo que rechazamos H0.

Z0.05 = -1,64 > -1,98, por lo que se rechaza H0.

Hay evidencia suficiente para concluir que tras el retiro, aumenta el nivel de desajuste, medido por X.

Page 38: ESTADISTICA ADMNISTRATIVA 2

EJEMPLO 2

Un estudio comparó empresas que utilizaban o no procedimientos sofisticados de post-auditoria. Se examinó una muestra de 31 pares de firmas. Para cada empresa se utilizó una función determinada como medida de su rendimiento. En cada uno de los pares, una empresa utilizó procedimientos sofisticados post-auditoria y la otra no. Se calcularon las diferencias en los 31 casos y los rangos de las diferencias en valor absoluto. La mas pequeña de la suma de rangos, 189, fue la correspondiente a aquellas empresas que no utilizaron procedimientos sofisticados post-auditoria. Contrastamos la hipótesis nula de que la distribución de las diferencias está centrada en 0 frente a la alternativa de que el rendimiento de las empresas es menor cuando no utilizan procedimientos sofisticados post-auditoria.

Dada una muestra de n=31 pares de datos, la media del estadístico del Wilcoxon bajo la hipótesis nula es:

n (n + 1) (31)(32)

µT = ---------------- = -------------- = 248

4

T - µT

La distribución de Z = ---------- cuando la hipótesis nula de que la distribución

T

de las diferencias está centrada en 0 es cierta y la alternativa es unilateral, a nivel de significación 0,123.

Y varianza

Page 39: ESTADISTICA ADMNISTRATIVA 2

n (n + 1)(2n + 1) (31)(32)(63)

T2 = ------------------------- = ------------------ = 2.064

24

De manera que la desviación típica es

T = 51,03

Si T es el valor observado del estadístico, la hipótesis nula frente a la alternativa unilateral será rechazada si:

T - µT

--------- < -Z

T

Aquí, T = 198, y

T - µT 189 - 248

--------- = ---------------- = -1,16

T 51,03

El valor de correspondiente a Z = 1,16 es (1 - 0, 8760) = 0,123. Por tanto, la hipótesis nula será rechazada a niveles de significación superiores al 12,3%. Los datos sugieren una modesta evidencia de que las empresas sin un procedimiento sofisticado de post-auditoria tienen mejor rendimiento.

http://www.itch.edu.mx/academic/industrial/estadistica1/cap04d.html

5.6 DOS MUESTRAS: PRUEBA DE MANN –WHITNEY

La prueba U de Mann-Whitney esta diseñada para determinar si dos muestras se han obtenido de la misma población. Esta prueba se usa como alternativa para la prueba t para medias con muestras pequeñas. La prueba U de Mann-Whitney se usa para encontrar si dos muestras independientes proceden de poblaciones simétricas que tienen la misma media o mediana. La prueba se usa cuando no se puede verificar la suposición de 2 poblaciones normales con varianzas iguales.

Page 40: ESTADISTICA ADMNISTRATIVA 2

Los datos deben estar medidos al menos en una escala ordinal, haciendo que esta prueba sea útil para datos ordinales o categóricos.

El procedimiento da rangos a los datos como si los valores en ambas muestras pertenecieran todos a un solo grupo. El valor mas pequeño se asigna al rango 1 , el siguiente valor mas pequeño al rango 2 …, sin importar a que muestra pertenece el elemento. Si las medias de dos poblaciones son iguales, los rangos altos y bajos deben tener una distribución bastante pareja en las 2 muestras. Si las medias no son iguales, una muestra tendera a tener rangos mas altos o mas bajos que la otra. El análisis se concentra en la suma de los rangos de una de las muestras y la compara con la suma que se esperaría si las medias de la población fueran iguales.

Para una muestra combinada de 20 o menos, se usan tablas especiales para probar la hipótesis nula de los dos grupos; estas tablas se encuentran en libros especializados en métodos no parametritos. Si la muestra combinada es mayor que 20, se ha demostrado que la curva normal es una buena aproximación de la distribución muestral. Esta curva normal tiene parámetros que se encuentran en las ecuaciones que se presentaran a continuación. El estadístico U de Mann-Whitney:

n(n1+1)

U = n1 n2 + ------------------ - R1

2

Donde :

U = Estadístico de Mann Whitney

n1 = Numero de elementos en la muestra 1

n2 = Numero de elementos en la muestra 2

R1 = Suma de rangos en la muestra 1

Si las dos muestras son de diferentes tamaños, la muestra 1 debe respetar la que tiene menor numero de observaciones.

Los procedimientos de la curva normal estándar que se emplean para determinar si es razonable si el estadístico U se haya obtenido de una distribución normal con los parámetros específicos. Si así es, la hipótesis nula devengan de esta distribución, la hipótesis nula se rechaza.

Page 41: ESTADISTICA ADMNISTRATIVA 2

Si la hipótesis nula es cierta, el estadístico U tiene una distribución muestral con la siguiente media y desviación estándar:

n1n2

µu = ----------------------

2

" n1n2 (n1+n2+1)

u = ---------------------------

"12

Donde:

n1 = Numero de elementos en la muestra 1

n2 = Numero de elementos en la muestra 2

El valor Z es :

U - µu

Z= --------------

u

EJEMPLO

Dos dependientes, A y B , trabajan en el departamento de niños de una tienda. El gerente de la tienda piensa ampliar su negocio a otros locales desde que leyó un articulo en una revista sobre la creciente popularidad de las tiendas sobre niños. La comparación entre las ventas de los 2 dependientes parece ser una buena manera de determinar si uno de ellos puede dirigir la nueva tienda. La hipótesis nula y alternativa son :

H0: µ1 - µ2 = 0

H1: µ1 - µ2 " 0

Si se usa un nivel de significancia de 0,05 , la regla de decisión para esta prueba de hipótesis es: Si el valor Z calculado es menor que -1,96 o mayor que 1,96 se rechaza la hipótesis nula.

Page 42: ESTADISTICA ADMNISTRATIVA 2

El gerente registra las ventas semanales de los 2 dependientes para una muestra de varias semanas y quiere saber si ellos pueden considerarse iguales como vendedores. Se usara la prueba U de Mann-Whitney para probar esta hipótesis de que los 2 dependientes son iguales en este sentido, ya que el tamaño de la muestra es pequeño y hay evidencia de que la población de las ventas no es normal. En la siguiente tabla se numeran las ventas de cada dependiente junto con sus rangos.

El estadístico U se calcula con la ecuación antes expuesta, en esta ecuación, n1 es igual a 16 , n2 igual a 25 y R1 = 241. Este ultimo valor se calculo sumando todos los rangos para el dependiente a , el calculo de U es:

n1 (n1 + 1) 16(16+1)

U = n1 n2 + ----------------- - R1 = (16)(25)+ ---------------- - 241 = 295

TABLA Ventas por rangos para la prueba U de Mann Whitney

DEPENDIENTE A DEPENDIENTE B

VENTAS RANGO VENTAS RANGO

197 1 190 3

194 2 180 7

188 4 175 8

185 5 172 10

182 6 167 13

173 9 166 14

169 11 160 17

169 12 157 18

TABLA Ventas por Rangos para la prueba U de Mann - Whitney

DEPENDIENTE A DEPENDIENTE B

VENTAS RANGO VENTAS RANGO

164 15 155 19

166 16 150 21

154 20 146 23

149 22 145 24

Page 43: ESTADISTICA ADMNISTRATIVA 2

142 26 143 25

139 28 140 27

137 29 135 30

130 35 135 31

134 32

133 33

131 34

122 36

120 37

118 38

109 39

98 40

95 41

Los parámetros de la distribución muestral normal deben determinarse para ver si el valor U de 295 se puede considerar poco usual. La media y la desviación estándar de la distribución muestral normal se calculan a continuación.

n1n2 (16)(25)

µu = --------- = ------------- = 200

2 2

"n1n2 (n1+n2+1) "(16)(25) (16+25+1)

u = --------------------------------- = ----------------------------- = 37,4

"12 "12

El valor z del estadístico muestral se calcula:

U - µu 295 - 200

z = --------------------- = ---------------- = 2,54

u 37,4

El estadístico muestral (295) esta a los 2,54 desviaciones estándar a la derecha de la media (200) de la curva si la hipótesis nula de poblaciones iguales es cierta. Este es un valor poco probable para esta curva, ya que este valor z cubre 0,4945 del área bajo la curva, dejando solo 0,0055 en la cola superior. Se justifica que el

Page 44: ESTADISTICA ADMNISTRATIVA 2

gerente de la tienda rechace la hipótesis nula de que los dos dependientes son iguales en su habilidad para general ventas. El riego de un error tipo I al rechazar es solo 0,011 ( 2 * 0.0055).

http://www.itch.edu.mx/academic/industrial/estadistica1/cap04d.html

5.7 OBSERVACIONES PAREADAS: PRUEBA DE SIGNOS

Prueba del Signo para Muestras Pareadas

También se puede utilizar la prueba de signo para probar la hipótesis nula

para observaciones pareadas. Aquí se reemplaza cada diferencia, di, con un signo más o menos dependiendo si la diferencia ajustada, di-d0, es positiva o negativa. A lo largo de esta sección suponemos que las poblaciones son simétricas. Sin embargo, aun si las poblaciones son asimétricas se puede llevar a cabo el mismo procedimiento de prueba, pero las hipótesis se refieren a las medianas poblacionales en lugar de las medias.

Ejemplo:

1. Una compañía de taxis trata de decidir si el uso de llantas radiales en lugar de llantas regulares con cinturón mejora la economía de combustible. Se equipan 16 automóviles con llantas radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de conductores, se equipan los mismos autos con llantas regulares con cinturón y se manejan una vez más por el recorrido de prueba. Se registra el consumo de gasolina, en kilómetros por litro, de la siguiente manera:

Automóvil Llantas radialesLlantas con cinturón

1 4.2 4.1

2 4.7 4.9

3 6.6 6.2

4 7.0 6.9

5 6.7 6.8

6 4.5 4.4

Page 45: ESTADISTICA ADMNISTRATIVA 2

7 5.7 5.7

8 6.0 5.8

9 7.4 6.9

10 4.9 4.9

11 6.1 6.0

12 5.2 4.9

13 5.7 5.3

14 6.9 6.5

15 6.8 7.1

16 4.9 4.8

¿Se puede concluir en el nivel de significancia de 0.05 que los autos equipados con llantas radiales obtienen mejores economías de combustible que los equipados con llantas regulares con cinturón?

Solución:

Page 46: ESTADISTICA ADMNISTRATIVA 2

Regla de decisión:

Si zR 1.645 no se rechaza Ho.

Si zR> 1.645 se rechaza Ho.

Se procede ha realizar las diferencias entre de los kilómetros por litro entre llantas radiales y con cinturón:

Automóvil Llantas radialesLlantas con cinturón

d

1 4.2 4.1 +

2 4.7 4.9 -

3 6.6 6.2 +

4 7.0 6.9 +

5 6.7 6.8 -

6 4.5 4.4 +

7 5.7 5.7 0

8 6.0 5.8 +

9 7.4 6.9 +

10 4.9 4.9 0

11 6.1 6.0 +

12 5.2 4.9 +

13 5.7 5.3 +

14 6.9 6.5 +

15 6.8 7.1 -

16 4.9 4.8 +

Al observar las diferencias se ve que sólo existe una n=14, ya que se descartan los valores de cero. Se tiene r+ = 11

Page 47: ESTADISTICA ADMNISTRATIVA 2

Decisión y conclusión:

Como 2.14 es mayor a 1.645 se rechaza H0 y se concluye con un = 0.05 que las llantas radiales mejoran la economía de combustible.

http://www.itch.edu.mx/academic/industrial/estadistica1/cap04d.html

5.8 OBSERVACIONES PAREADAS: PRUEBA DE WILCOXON

Se puede notar que la prueba de signo utiliza sólo los signos más y menos de las diferencias entre las observaciones y 0 en el caso de una muestra, o los signos más y menos de las diferencias entro los pares de observaciones en el caso de la muestra pareada, pero no toma en consideración la magnitud de estas diferencias. Una prueba que utiliza dirección y magnitud, propuesta en 1945 por Frank Wilcoxon, se llama ahora comúnmente prueba de rango con signo de Wilcoxon. Esta prueba se aplica en el caso de una distribución continua simétrica. Bajo esta condición se puede probar la hipótesis nula 0. Primero se resta de cada valor muestral y se descarta todas las diferencias iguales a cero. Se asigna un rango de 1 a la diferencia absoluta más pequeña, un rango de 2 a la siguiente más pequeña, y así sucesivamente. Cuando el valor absoluto de dos o más diferencias es el mismo, se asigna a cada uno el promedio de los rangos que se asignarían si las diferencias se distinguieran. Por ejemplo, si la quinta y sexta diferencia son iguales en valor absoluto, a cada una se le asignaría un rango de 5.5. Si la hipótesis 0 es verdadera, el total de los rangos que corresponden a las diferencias positivas debe ser casi igual al total de los rangos que corresponden a las diferencias negativas. Se representan esos totales como w+ y w-, respectivamente. Se designa el menor de w+ y w- con w.

Al seleccionar muestras repetidas esperaríamos que variarían w+ y w-, y por tanto w. De esta manera se puede considerar a w+ y w-, y w como valores de las correspondiente variables aleatorias W+, W-, y W. La hipótesis nula 0 se puede rechazar a favor de la alternativa 0 sólo si w+ es pequeña y w- es grande. Del mismo modo, la alternativa 0 se puede aceptar sólo si w+ es grande y w- es pequeña. Para una alternativa bilateral se puede rechazar H0 a favor de H1 si w+ o w- y por tanto w son suficientemente pequeñas. No importa cuál hipótesis alternativa puede ser, rechazar la hipótesis nula cuando el valor de la estadística apropiada W+, W-, o W es suficientemente pequeño.

Dos Muestras con Observaciones Pareadas

Page 48: ESTADISTICA ADMNISTRATIVA 2

Para probar la hipótesis nula de que se muestrean dos poblaciones simétricas continuas con para el caso de una muestra pareada, se clasifican las diferencias de las observaciones paradas sin importar el signo y se procede como en el caso de una muestra. Los diversos procedimientos de prueba para los casos de una sola muestra y de una muestra pareada se resumen en la siguiente tabla:

No es difícil mostrar que siempre que n<5 y el nivel de significancia no exceda 0.05 para una prueba de una cola ó 0.10 para una prueba de dos colas, todos los valores posibles de w+, w-, o w conducirán a la aceptación de la hipótesis nula. Sin embargo, cuando 5 n 30, la tabla A.16 muestra valores críticos aproximados de W+ y W- para niveles de significancia iguales a 0.01, 0.025 y 0.05 para una prueba de una cola, y valores críticos de W para niveles de significancia iguales a 0.02, 0.05 y 0.10 para una prueba de dos colas. La hipótesis nula se rechaza si el valor calculado w+, w-, o w es menor o igual que el valor de tabla apropiado. Por ejemplo, cuando n=12 la tabla A.16 muestra que se requiere un valor de w+ 17 para que la alternativa unilateral sea significativa en el nivel 0.05.

Ejemplos:

1. Los siguientes datos representan el número de horas que un compensador opera antes de requerir una recarga: 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0, 1.2 y 1.7. Utilice la prueba de rango con signo para probar la hipótesis en el nivel de significancia de 0.05 que este compensador particular opera con una media de 1.8 horas antes de requerir una recarga.

Solución:

H0;

H1;

Se procederá a efectuar las diferencias y a poner rango con signo a los datos.

Page 49: ESTADISTICA ADMNISTRATIVA 2

Dato di = dato - 1.8 Rangos

1.5 -0.3 5.5

2.2 0.4 7

0.9 -0.9 10

1.3 -0.5 8

2.0 0.2 3

1.6 -0.2 3

1.8 0 Se anula

1.5 -0.3 5.5

2.0 0.2 3

1.2 -0.6 9

1.7 -0.1 1

Regla de decisión:

Para una n = 10, después de descartar la medición que es igual a 1.8, la tabla A.16 muestra que la región crítica es w 8.

Cálculos:

w+ = 7 + 3 + 3 = 13

w- = 5.5 + 10 + 8 + 3 + 5.5 + 9 + 1 = 42

por lo que w = 13 (menor entre w+ y w-).

Decisión y Conclusión:

Como 13 no es menor que 8, no se rechaza H0 y se concluye con un = 0.05 que el tiempo promedio de operación no es significativamente diferente de 1.8 horas.

 

Page 50: ESTADISTICA ADMNISTRATIVA 2

2. Se afirma que un estudiante universitario de último año puede aumentar su calificación en el área del campo de especialidad del examen de registro de graduados en al menos 50 puntos si de antemano se le proporcionan problemas de muestra. Para probar esta afirmación, se dividen 20 estudiantes del último año en 10 pares de modo que cada par tenga casi el mismo promedio de puntos de calidad general en sus primeros años en la universidad. Los problemas y respuestas de muestra se proporcionan al azar a un miembro de cada par una semana antes del examen. Se registran las siguientes calificaciones del examen:

Par

Con problemas de muestra

Sin problemas de muestra

1 531 509

2 621 540

3 663 688

4 579 502

5 451 424

6 660 683

7 591 568

8 719 748

9 543 530

10 575 524

Pruebe la hipótesis nula en el nivel de significancia de 0.05 de que los problemas aumentan las calificaciones en 50 puntos contra la hipótesis alternativa de que el aumento es menor a 50 puntos.

Solución:

La prueba de rango con signo también se puede utilizar para probar la hipótesis nula d0. En este caso las poblaciones no necesitan ser simétricas. Como con la prueba de signo, se resta d0 de cada diferencia, se clasifican las diferencias ajustadas sin importar el signo y se aplica el mismo procedimiento.

Page 51: ESTADISTICA ADMNISTRATIVA 2

En este caso d0 = 50, por lo que se procede a calcular las diferencias entre las muestras y luego restarles el valor de 50. Se representara con y la calificación media de todos los estudiantes que resuelven el examen en cuestión con y sin problemas de muestra, respectivamente.

H0;

H1;

Regla de decisión:

Para n=10 la tabla muestra que la región crítica es w+ 11.

Cálculos:

 

Par

Con problemas de muestra

Sin problemas de muestra

di

di

– d0

Rangos

1 531 509 22-28

5

2 621 540 81 31 6

3 663 688-25

-75

9

4 579 502 77 27 3.5

5 451 424 27-23

2

6 660 683-23

-73

8

7 591 568 23-27

3.5

8 719 748-29

-79

10

9 543 530 13 - 7

Page 52: ESTADISTICA ADMNISTRATIVA 2

37

10 575 524 51 1 1

w+ = 6 + 3.5 + 1 = 10.5

Decisión y Conclusión:

Como 10.5 es menor que 1 se rechaza H0 y se concluye con un = 0.05 que los problemas de muestra, en promedio, no aumentan las calificaciones de registro de graduados en 50 puntos.

Aproximación Normal para Muestras Grandes

Cuando n 15, la distribución muestral de W+ ó W- se aproxima a la distribución

normal con media y varianza .

Por tanto, cuando n excede el valor más grande en la tabla A.16, se puede utilizar la estadística

para determinar la región crítica de la prueba.

http://www.itch.edu.mx/academic/industrial/estadistica1/cap04d.html