Prueba estadística paramétrica

desarrollado por jfgt, desarrollado por jfgt,desarrollado por jfgt,desarrollado …

1

Prueba Estadística paramétrica

A diario cada uno de nosotros hacemos cosas increíblemente complejas, y somos únicos, pues nadie posee nuestras características tanto físicas, intelectuales, de personalidad, etc . en cada momento de nuestra vida damos testimonio de captar, procesar e integrar una gran cantidad de datos captados por nuestros sentidos y que actuamos de manera instantánea, basándose en la información obtenida y que origina una gama de probabilidades relativas a los posible comportamientos. Veamos un ejemplo, si Ud va a cruzar una avenida, el tiempo que demora en cambiar la luz de semáforo, Ud a tomado en cuenta ( en base a una información descriptiva) en colocarse en un lugar “ seguro” llámese paradero. Pues bien, justo en el momento de cruzar la avenida , de manera intempestiva ve un auto que no respeta el reglamento de tránsito e intenta cruzar. En ese instante se verá obligado a actuar de acuerdo a la información estadística que posee: rezar, detenerse, retroceder o adelantarse, su mecanismo probalistico le prevé de varias alternativas de manera inmediata.

Si se detiene, cual es la probabilidad de que el conductor del auto también frene a tiempo? Si Ud en base a sus datos sensoriales tiene a bien, antes de cruzar una avenida observa que los coches están detenidos. Entonces es correcta la decisión que tomó, el de detenerse, porque es muy probable que al coche que siguió sin percatarse el cambio de luz del semáforo. Ud lo notara.

Como a podido advertir son muchas las circunstancias que se presentar en nuestra vida diaria y que de manera instantánea tenemos que tomar decisiones correctas en base a una generación de decisiones estadísticas. Por lo tanto, es Ud un estadístico.

Cuando se habla de estadística, se le considera como un método para manejar los datos, es decir, es una herramienta para la recopilación, organización, y análisis de hechos numéricos o de observaciones.

El método estadístico muestra dos funciones: la estadística descriptiva, que tiene como propósito presentar la información de manera cómoda, utilizable y comprensible y la estadística inferencial, es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a una información parcial o completa obtenida mediante técnicas descriptivas. Por lo tanto, se ocupa del proceso metódico para obtener conclusiones válidas de una muestra, con respecto a la población, de manera tal que se le pueda considerar representativa de ella.

“se basan en que se supone una forma determinada de la distribución de valores,

generalmente la distribución normal, en la población de la que se obtiene la muestra

experimental.” SEO


2

Al realizar una investigación paramétrica, el investigador en base a una muestra, estima una o varias características de la población de donde proviene. Se obtiene de dos maneras: mediante la estimación y la prueba de hipótesis. Es decir, estimar el valor de un parámetro a partir de la muestra y contrastar si su hipótesis es confirmada en la muestra. Considerando a la hipótesis Ho como hipótesis nula , de no confirmarse se explica por la hipótesis alterna H1 que acepta que esas diferencias existen dentro de cierto margen de probabilidad: cuando son significativas (a nivel de una p < 0.05 o < 0.001) se rechaza la hipótesis nula y se acepta la hipótesis alterna ( MGG Y CDB “ sinopsis de las pruebas no paramétricas” p7. podemos afirmar que el contraste

de hipótesis es el procedimiento que nos permite verificar y confirmar si esa relación potencial es verdadera o no y con qué margen de error.

Es conveniente señalar lo siguiente: En el desarrollo del proceso de contraste de hipótesis es igualmente relevante el nivel de significación, error tipo I o α (rechazar una Ho cuanto ésta es verdadera) que se asume en el mismo, así como el nivel de confianza (1-α). Los valores habituales asumidos para los errores son el 10%, menos usado y, sobre todo, 5% y 1%, siendo por ende, los niveles de confianza del 90%, 95% y 99%.( se conoce como p< 0.05 o < 0,1 o 0.001). También destacamos el error tipo II o β (no rechazar una Ho cuando ésta es falsa) y la potencia de contraste (1-β). Todos estos aspectos quedan esquemáticamente reflejados en la siguiente tabla:

Decisiones respecto a Ho H0 cierta H0 falsa

H0 rechazada Error tipo I (α) Decisión correcta Potencia de contraste (1-β)

H0 no rechazada Decisión correcta Nivel de confianza (1-α)

Error tipo II (β)

Como podemos apreciar en la tabla anterior el proceso final del contraste de hipótesis es un resultado que sirve para aceptar o rechazar la hipótesis nula con un cierto grado de error.

Que es un parámetro? Es cualquier característica medible de una población. Es un número que resume la enorme cantidad de datos que pueden derivarse del estudio de una variable estadística.

El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población. En estadística se definen como variables a los atributos, rasgos o propiedades de un grupo de elementos que toman diferentes valores, magnitudes o intensidades. En el proceso de medición de ellas se les asignan números o códigos de observación. Las variables pueden ser cuantitativas (que se pueden contar)y cualitativas ( por su atributo) veamos: el color de ojos ( azules, verdes, negros) la religión a la que pertenece( católica, protestante), partido político. sexo ( masculino, femenino) Corresponde a variables cualitativas nominales. Si se considera los niveles jerárquicos (soldado, alférez, teniente, capitán) la intensidad del dolor ( leve, agudo, crónico) grado académico( doctor , maestro, licenciado), clase social( baja, media, alta) se designan


3

como variable cualitativa ordinal . Etc y en el otro caso: el número de nacimientos, el número de estudiantes etc. son valores enteros se conoce como variable cuantitativa discreta; también se presenta valores fraccionarios como: el peso de las personas( 60.3 kg 25,4 kg), la estatura ( 1.57m, 1,78m ), el salario de un empleado ( $ 2450.6 ) se les denominan variable cuantitativa continuas.

Las pruebas paramétricas asumen los parámetros de la distribución de la variable (media y Varianza) y un tipo de distribución normal. Veamos un ejemplo: Si se conoce la estatura de las personas sigue una distribución normal, luego se puede obtener la media ( promedio) de la estatura de las personas que han sido medidas posteriormente queremos conocer cuan distante esta del promedio la estatura de cada uno de los participantes de la medición, como habrá podido notar dado que es un promedio existirá datos mayores al promedio como también menores esa diferencia se conoce como dispersión entonces se ha conseguido 2 cosas: calcular el promedio y las medidas de variabilidad, mediante el promedio y la varianza.

No debe olvidar que, la solución de problemas de investigación sin estas dos medidas es casi imposible. Asimismo, cuando se menciona Normal nos referimos a la campana de Gauss o distribución Gaussiana ( se recomienda revisar cualquier libro de estadística básica).

Las pruebas paramétricas, para usarlas deben cumplirse supuestos:

1. Independencia de las observaciones a excepción de datos pareados.

2. Las observaciones para la variable dependiente se han obtenido de manera aleatoria de una población con distribución normal.

3. La variable dependiente es medida al menos en una escala de intervalo.

4. Se recomienda un tamaño de muestra mínimo de 30 sujetos por grupo( mediciones cuantitativas, actualmente es opcional)

5. Los datos son obtenidos de poblaciones que tienen varianzas iguales (una varianza no debe ser el doble o mayor que la otra). ¿?

6. Habitualmente las hipótesis se hacen sobre valores numéricos, especialmente el promedio de una población (μ), como ejemplo:

Ho: μ1 = μ2

H1: μ1 ≠ μ2

7. Otros posibles requisitos: variable independiente nominal o de intervalo, homocedasticidad (para cada nivel de la variable independiente hay una variación similar de la variable dependiente) y casillas de igual tamaño.

A veces se usa sin cumplir los supuestos pero debe usarse con cautela en muestras más pequeñas o con varianzas desiguales, en estos casos prefiera usar pruebas no paramétricas. Cuando se menciona medidas de intervalo es conveniente


4

indicar lo siguiente, si a Ud le preguntaran cual es la estatura de su amigo, dirá 1.80 m ¿ qué confianza tiene Ud, en que la estatura de su amigo sea exactamente 1.80m? Si nos preguntaran, probablemente responderíamos “dudo que su estatura sea exactamente de 1.80m. Así es porque pueden ocurrir 3 casos, la primera es que acierte, créame que tuvo una suerte extraordinaria en adivinarlo, pero también es probable que sea mayor o menor a lo señalado por Ud. Sin embargo, se puede estar razonablemente seguro que su estatura este comprendido entre 1.79 y 1.81m. al hacer esto, hemos establecido el intervalo dentro del cual confiamos esté la verdadera estatura. Después de un momento de reflexión y vacilar ligeramente,” bien, quizás su estatura este entre 1.75 y 1.85 m , estoy completamente seguro” Nótese que cuanto mayor sea el tamaño del intervalo mayor confianza tendremos de que el verdadero valor esté comprendido entre estos límites. Es necesario advertir que al establecer estos límites de confianza estamos haciendo dos cosas. a) establecer los límites entre los cuales creemos que se encuentra el verdadero valor y b) rechazamos la posibilidad de que su verdadera estatura esté fuera de los límites.

Además, debe tener presente que mientras más grande sea la muestra más exacta será la estimación. También es importante acotar que como dijimos anteriormente acerca de la normal (llamada también campana de Gauss) en la cual los datos suelen seguir una distribución normal. Acepte que no siempre es asi, a veces los datos con los que se cuentan no cumplen dicho supuesto, simplemente por no contar con la suficiente cantidad de datos.

Asimismo, cuando se menciona sobre las varianzas iguales (homogéneas), tenga cuidado en su interpretación, son ignoradas dicha requisito cuando las muestras son muestras relacionadas al parecer no existe riesgo alguno de distorsionar los resultados.

Las pruebas paramétricas son :

Prueba del valor Z de la distribución normal Prueba T de student para datos relacionados y no relacionados –

muestras independientes. Prueba T de student – Welch para dos muestras independientes con

varianzas homogéneas.

Prueba del Ji cuadrada de barlett para demostrar la homogeneidad de varianzas.

Prueba F( análisis de varianza)

Las pruebas estadísticas paramétricas, como la de la “t” de Student o el análisis de la varianza (ANOVA), se basan en que se supone una forma determinada de la distribución de valores, generalmente la distribución normal, en la población de la que se obtiene la muestra experimental.

DESCRIPCIÓN DE ALGUNAS PRUEBAS PARÁMETRICAS:


5

a) La prueba Z. Comparación de una media muestra X respecto a una

media poblacional . La hipótesis teórica puede plantear que el valor de una muestra es diferente, mayor o menor que el obtenido en una población respecto a una determinada característica. Simbolicamente, las hipótesis nula y alterna se plantean de la siguiente manera: Ho: μ1 = μ2 H1: μ1 ≠ μ2 ( prueba bilateral)

Ho: μ1 = μ2 H1: μ1 < μ2 ( prueba unilateral) Ho: μ1 = μ2 H1: μ1 > μ2 ( prueba unilateral) La formulación es la siguiente:

Ejemplo: La medición del cociente de las habilidades sociales en una institución educativa es de 110 puntos como promedio , y una desviación estándar de 4. Ante este resultado un investigador seleccionó una muestra aleatoria de 600 alumnos y encontró que el promedio alcanzaban los 116


6

puntos ¿indican estos resultados la existencia de concordancia con lo obtenido en la primera evaluación? La hipótesis nula Ho, es la afirmación que se hace generalmente con la finalidad de rechazarla. Con toda seguridad el investigador querrá rechazar, la que se obtuvo en la primera medición. Por lo tanto la hipótesis nula será: Ho : El promedio del cociente de habilidades sociales es de 110 puntos

Ho : = 110 H1 : el promedio del cociente de habilidades sociales es mayor a 110 puntos

H1 : > 110 Como habrá podido notar que no se menciona la cantidad obtenida por el investigador en ninguna de las hipótesis ( nula o alterna), puesto que lo que nos interesa son los 110 puntos del promedio poblacional. El nivel de significación es de α = 0,05, indica que la probabilidad de rechazar el promedio de 110 puntos, por efectos del azar y no porque en dicha institución educativa los alumnos tengan en promedio un valor mayor de 110, es de 5%. Asimismo, si de rechaza la hipótesis nula, se tendrá la confianza del 95% que realmente el promedio de los estudiantes es mayor a 110. La muestra es grande, y las mediciones son cuantitativas, se conoce la varianza de la población como su muestra aleatoria. Asumiendo que las habilidades sociales en la institución educativa, es normal. Como se puede observar la prueba es unilateral, el nivel de significación elegido es 5% el valor teórico de Z = 1.64

= media poblacional = 110 X = media de la muestra = 116 n = 600

= 4 Donde el error estándar de la media:

× = 41 / √ 600 = 1.67 Reemplazando en la fórmula:

Zo = 116 – 110 / 1.67 = 3.59


7

El valor de Zo = 3.59 es mayor que el valor crítico de Zo = 1,64. Por lo tanto se encuentra en la región de rechazo, por lo tanto se rechaza la hipótesis nula y se acepta la hipótesis alterna. Se concluye que el promedio de los estudiantes de la Institución educativa es mayor que 110 puntos.

b) La prueba t de Student de dos grupos independientes.

Se utiliza para comparar dos pequeñas muestras cuando se conocen su varianza poblacionales. La gráfica de la T de Student, depende del número de grados de libertad el cual es igual al número de elementos menos 1, por cada muestra. Si se tiene un número muy grande de grados de libertad, la gráfica de grados de libertad, la gráfica de la T de Student se confunde con la curva normal.

En la prueba de hipótesis, generalmente se usa para comparar las medias poblacionales a través de muestras pequeñas.


8

Si las muestras son independientes, la prueba de hipótesis correspondiente utilizando la t de Student, tiene el mismo procedimiento que se sigue para el caso de diferencias de medias con la prueba Z .

Como elegir la distribución apropiada, la distribución normal estándar Z o la distribución

de t Student.


9

Existen las siguientes versiones:

Prueba t para grupos independientes con tamaños de muestras diferentes. Prueba t para grupos independientes con tamaños de muestras iguales.

Ejemplo: Determinar la existencia estadísticamente significativa entre los puntajes de responsabilidad de dos grupos de alumnos, uno del turno diurno y otro del turno nocturno, se seleccionaron muestras aleatorias de 12 alumnos del turno diurno y 14 alumnos del turno nocturno. Para obtener los puntajes se aplicó la prueba ARQ. Asumiéndose puntajes más altos mayor responsabilidad. Los puntajes fueron los siguientes.

TURNO Alumnos Diurno Nocturno

1 22 20

2 20 18

3 18 22

4 19 21

5 21 20

6 19 18

7 19 21

8 21 20

9 23 22

10 19 21

11 22 22

12 17 19

13 20

14 22

La hipótesis nula se plantea de la siguiente manera: Ho = No existen diferencias estadísticamente significativas entre los puntajes promedios de responsabilidad de los alumnos del turno diurno y los alumnos del turno nocturno.

Ho = µ1 = µ2

µ1 = Representa el puntaje promedio de responsabilidad de la población de alumnos que estudian el el turno diurno.


10

µ2 = Representa el puntaje promedio de responsabilidad de la población de alumnos que estudian el el turno nocturno. Se sugiere determinar si existen diferencias significativas entre los dos grupos de estudiantes. donde : H1 = µ1 ≠ µ2 El nivel de significación es de 5%. Indica que existe la probabilidad de o,o5

de rechazar la hipótesis nula por efectos de azar. No se conocen las varianzas de las poblaciones. Se asume que la distribución de los puntajes en las poblaciones tiene una distribución normal. Las mediciones se han realizado en el nivel por intervalos. Se elige la t de Student para comparar dos grupos independientes. gl : 12 + 14 -2 = 24 El valor teórico de la t de student para 24 grados de libertad al nivel de significación del 5% para una prueba de tipo bilateral es tt= 2.064

- 2.064 +2.064

El valor de de to (reemplazando en la formula correspondiente a dos grupos independientes) es mayor que 2.064, se rechazará la hipótesis nula.


11

Si to > = ( mayor o igual) 2.064 se rechaza Ho

Para decidir si se acepta ose rechaza H0 se halla el valor de t0

X1 = 20 ∑X1 = 240 ∑X12 = 4836 SC1 = 36 X2 = 20,4 ∑X2 = 286 ∑X2

2 = 5868 SC2 = 25.4 Aplicando la ecuación correspondiente para dos grupos independientes con tamaños de muestra diferentes. T0 = 0,634

Como 2,064 es mayor que 0,634 t0 < tt se acepta la hipótesis nula y se concluye que no existe diferencias estadísticamente significativas entre los promedios de responsabilidad de los alumnos del turno diurno y del turno nocturno Nota : con respecto a la T de Student, es conveniente señalar que puede presentarse situaciones donde los grupos son independientes y las muestras iguales , o que las muestras estén relacionadas ( dependientes).

Prueba estadística paramétrica

Education

Transcript of Prueba estadística paramétrica