Chi Cuadrado
-
Upload
jhon-larico-velasquez -
Category
Documents
-
view
8 -
download
1
description
Transcript of Chi Cuadrado
2014TRABAJO: CHI CUADRADO
TRABAJO: CHI CUADRADO
CURSO: GEOESTADISTICA IIPROFESOR: Ing. TEVES, AUGUSTO
INDICE:
OBJETIVOS…………………………………………………………………………..…….…..…2
RESUMEN……………………………………………………………………………………....…3
INTRODUCCION……………………………………………………………………………….…4
ALCANCE…………………………………………………………………………………….……5
ANALISIS DE RESULTADOS...…………………………………………..………………….…7
CONCLUSIONES…………………………………………………………………………………10
BIBLIOGRAFIA………………………………………………………………………………...…10
GEOESTADÍSTICA II Página 1
2014TRABAJO: CHI CUADRADO
OBJETIVOS:
El estudio de varias cuestiones en relación con v.a. cualitativas ó cuantitativas cuyos datos están recogidos en forma de tabla de frecuencias. El denominador común a todas ellas es que su tratamiento estadístico está basado en la misma distribución teórica: la distribución χ2 (chi-cuadrado ó ji-cuadrado).
Analizar y estudiar las hipótesis con los valores esperados. Obtener a través de números random los datos para el chi cuadrado. Interpretar los gráficos de la tabla chi cuadrado. Notar las diferencias en cada valor porcentual. Entender el significado del chi cuadrado.
El teorema debe de tener un valor de confianza real para poder aplicarlo en la minería.
GEOESTADÍSTICA II Página 2
2014TRABAJO: CHI CUADRADO
RESUMEN:
En los ordenadores personales es fácil simular la generación de números aleatorios, mediante mecanismos de generación de números seudoaleatorios (n número pseudo-aleatorio es un número generado en un proceso que parece producir números al azar, pero no lo hace realmente. Las secuencias de números pseudo-aleatorios no muestran ningún patrón o regularidad aparente desde un punto de vista estadístico, a pesar de haber sido generadas por un algoritmo completamente determinista, en el que las mismas condiciones iniciales producen siempre el mismo resultado)
A partir de esta aclaración siempre que nos refiramos a un número aleatorio estaremos hablando de un número perteneciente a una serie aleatoria. Ya sé por medios matemáticos (manuales), estadísticos o por medios de los Microsoft (Excel), incluso también se puede obtener mediante lenguajes de programación como por ejemplo Visual Basic, Visual C++, macros, java y otros.
Una vez obtenidos los números aleatorios, dichos números aleatorios deben estar en un rango de ]0,1[ (lo obtenemos con la función =aleatorio() ) y como en este informe vamos a obtener números aleatorios en el intervalo de ]2,5[ que serán las leyes del mineral en %
Con el código =ALEATORIO()*3+2
Una vez obtenido los 20 datos random procedemos hallar la media y la desviación estándar.
GEOESTADÍSTICA II Página 3
2014TRABAJO: CHI CUADRADO
INTRODUCCION:
En muestras de tamaño n, tomadas de una población en la que la regularidad estadística no sigue una distribución normal (puede ser de cualquier forma), que tiene una media poblacional y varianza poblacional, entonces si n es grande, el proceso de tomar muchas muestras y en cada una de ellas tomar su media, el promedio muestral produce una regularidad estadística de los valores de la media que se modela con la distribución normal con media y varianza.
La chi- cuadrada es adecuada para analizar este tipo de datos. Puede usarse para probar la existencia de una diferencia significativa entre un número observado de objetos o respuesta de cada categoría y un número esperado, basado en la hipótesis de nulidad.
Importante, esta prueba nos indica si existe o no relación entre las variables, pero no indica el grado o el tipo de relación: es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia
Cuando los datos puntualizan a las variables cualitativa (nominal u ordinal).
Poblaciones pequeñas.
Cuando se desconocen los parámetros media, moda, etc.
Cuando se quiere contrastar o comparar hipótesis.
Investigaciones de tipo social - muestras pequeñas no representativas >5.
Población > a 5 y < a 20
Planteamos las hipótesis
Hipótesis alterna (Ha). Habrá diferencia significativa entre la cantidad .
Hipótesis nula (Ho). No Habrá diferencia significativa entre la cantidad.
GEOESTADÍSTICA II Página 4
2014TRABAJO: CHI CUADRADO
ALCANCE:
• Muestra: Parte de una población que se toma cuando es imposible acceder a toda ella. La elección de la muestra se hace con la intención de, a partir de la información que ella proporciona, extender sus resultados a toda la población a la que representa.
• Muestra aleatoria: (Muestra elegida al azar) Aquella muestra tomada de la población en la que todo individuo tiene la misma probabilidad de resultar elegido para ella, y esto con independencia entre individuos.
• Función de Distribución: Función que hace corresponder a cada uno de los valores de una variable aleatoria la probabilidad de que tal variable aleatoria tome un valor igual o inferior al dado.
• Función de Probabilidad: Función que hace corresponder a cada uno de los valores de la variable aleatoria discreta su probabilidad.
• Contraste de hipótesis: Conjunto de reglas tendentes a decidir cuál de dos hipótesis –la nula ó la alternativa- debe aceptarse en base al resultado obtenido en una muestra. Es de dos colas cuando la alternativa es la negación de la nula. De una cola en caso contrario. Variable aleatoria: Toda función que toma diversos valores numéricos, dependiente de los resultados de un fenómeno aleatorio, con distintas probabilidades.
• Variable aleatoria discreta. Las variables aleatorias discretas son aquellas que presentan un número finito de valores, constituyen una sucesión numerable.
• Variable aleatoria continua. Las variables aleatorias continuas pueden tomar un número infinito de valores en un intervalo determinado.
• Variable categórica. Una variable categórica es una variable que clasifica cada individuo de una población en una de las varias clases mutuamente excluyentes en que ésta se divide.
• Variable numérica. Corresponde a los datos expresados en una escala continua numérica.
Supongamos que tenemos un número k de clases en las cuales se han ido registrado un total de n observaciones (n será pues el tamaño muestral). Denotaremos las frecuencias observadas en cada clase por
O1, O2, ..., O k (Oi es el número de valores en la clase Ai).
Se cumplirá:
O1 + O2 + ... + O k = n
Lo que queremos es comparar las frecuencias observadas con las frecuencias esperadas (teóricas), a las que denotaremos por E1, E2, ..., E k .
GEOESTADÍSTICA II Página 5
2014TRABAJO: CHI CUADRADO
Se cumplirá:
E1 + E2 + ... + E k = n
Se tratará ahora de decidir si las frecuencias observadas están o no en concordancia con las frecuencias esperadas (es decir, si el número de resultados observados en cada clase corresponde aproximadamente al número esperado). Para comprobarlo, haremos uso de un contraste de hipótesis usando la distribución Chi-cuadrado: El estadístico de contraste será
Observar que este valor será la suma de k números no negativos. El numerador de cada término es la diferencia entre la frecuencia observada y la frecuencia esperada. Por tanto, cuanto más cerca estén entre sí ambos valores más pequeño será el numerador, y viceversa. El denominador permite relativizar el tamaño del numerador.
Las ideas anteriores sugieren que, cuanto menor sean el valor del estadístico ∗ χ2 , más coherentes serán las observaciones obtenidas con los valores esperados. Por el contrario, valores grandes de este estadístico indicarán falta de concordancia entre las observaciones y lo esperado. En este tipo de contraste se suele rechazar la hipótesis nula (los valores observados son coherentes con los esperados) cuando el estadístico es mayor que un determinado valor crítico.
Notas:
(1) El valor del estadístico ∗ χ2 se podrá aproximar por una distribución Chi-cuadrado cuando el tamaño muestral n sea grande (n > 30), y todas las frecuencias esperadas sean iguales o mayores a 5 (en ocasiones deberemos agrupar varias categorías a fin de que se cumpla este requisito).
(2) Las observaciones son obtenidas mediante muestreo aleatorio a partir de una población particionada en categorías.
ANALISIS DE RESULTADOS
Generamos números aleatorios de varias formas, pero en este informe generamos en Microsoft Excel, una vez obtenidos los números aleatorios:
GEOESTADÍSTICA II Página 6
2014TRABAJO: CHI CUADRADO
En este caso hemos generado diferentes valores de random como lo son las leyes
Generamos 1200 datos.
Ojo: Cada randoms equivale a un dato, es decir que los valores random cambian para cada dato elaborado en nuestro trabajo
Lo cual este nos dará el significado de una distribución normal cosa que no podemos aplicar en los casos de leyes. Es importante tener en cuenta esto ya que no todos los problemas tendrán una distribución normal que se relacione con la realidad
Lo cual hallamos las media, varianza y desviación estándar
Y pasamos a graficar el histograma
Graficas de los histogramas
K = 1200
0.000241219997406006
0.0590341722264009
0.117827124455396
0.176620076684391
0.235413028913386
0.294205981142381
0.352998933371376
0.411791885600371
0.470584837829365
0.52937779005836
0.588170742287355
0.64696369451635
0.705756646745345
0.76454959897434
0.823342551203335
0.88213550343233
0.940928455661325
0.999721407890320
0.005
0.01
0.015
0.02
0.025
0.03
0.035
0.04
0.045
GEOESTADÍSTICA II Página 7
2014TRABAJO: CHI CUADRADO
El valor en la tabla chi cuadrado para 1199 grados de libertad y (1-α)=95%
GEOESTADÍSTICA II Página 8
0
0.4
0.8
1.2
1.6
2014TRABAJO: CHI CUADRADO
MEDIA 0,49244992
VARIANZA 0,07922623
DESVIACIÓN 0,28147155
Clase Frecuencia
Frecuenciarelativa
Distribucion
normal
Chi-cuadrado
0,00024122
1 0,00083333
0,307221355
0,305556949
0,0296377 22 0,01833333
0,366774146
0,331023878
0,05903417
43 0,03583333
0,433120763
0,364418691
0,08843065
36 0,03 0,505920484
0,44769942
0,11782712
34 0,02833333
0,584545738
0,529252407
0,1472236 25 0,02083333
0,66806344 0,627046454
0,17662008
38 0,03166667
0,755231135
0,693225578
0,20601655
30 0,025 0,844510473
0,795250546
0,23541303
39 0,0325 0,934099557
0,870230325
0,26480951
42 0,035 1,021984398
0,953183047
0,29420598
39 0,0325 1,106008179
1,04196319
0,32360246
37 0,03083333
1,183955515
1,12309183
0,35299893
40 0,03333333
1,253647399
1,187867035
0,38239541
42 0,035 1,313041329
1,243974278
0,41179189
44 0,03666667
1,360330268
1,287985257
0,44118836
49 0,04083333
1,394033787
1,31356319
0,47058484
35 0,02916667
1,413074995
1,355343678
0,49998131
27 0,0225 1,416837673
1,372194983
0,52937779
35 0,02916667
1,405199394
1,347471451
0,55877427
38 0,03166667
1,378538135
1,315932223
0,58817074
38 0,03166667
1,337711895
1,275128183
0,61756722
39 0,0325 1,284012838
1,219835454
0,64696369
35 0,02916667
1,219099396
1,161463868
0,67636017
28 0,02333333
1,144911294
1,098720162
0,70575665
36 0,03 1,063573569
1,004419773
0,73515312
28 0,02333333
0,97729619 0,931186616
0,7645496 32 0,02666667
0,888275837
0,835743055
0,7939460 41 0,0341666 0,79860580 0,73173422
Es 43.8 y en el valor experimental hallado es 29.75795361
Al ser menor se asegura que dentro de ese intervalo de confianza se puede aceptar que ese conjundo de datos tiene una distribución normal.
CONCLUSIONES:
Obtener a través de números random los datos para usar el chi cuadrado que serán los números random
Estudiar los valores de confianza que se aplican en la tabla chi cuadrado
El estudio de varias cuestiones en relación con v.a. cualitativas ó cuantitativas cuyos datos están recogidos en forma de tabla de frecuencias. El denominador común a todas ellas es que su tratamiento estadístico está basado en la misma distribución teórica: la distribución χ2 (chi-cuadrado ó ji-cuadrado.
Analizar y estudiar las hipótesis con los valores esperados.
Entender el significado del chi cuadrado.
Observamos que a menor valor de confianza se extenderá los intervalos o mejor dicho se harán más abiertos donde el intervalo será mayor.
GEOESTADÍSTICA II Página 9
2014TRABAJO: CHI CUADRADO
Lo ideal es tener un valor de confianza realista para poder aproximar las leyes promedios
BIBLIOGRAFIA:
o http://sameens.dia.uned.es/Trabajos13/Trab_Publicos/Trab_5/Viton_Asenjo_5/files/tablaschi.pdf
o http://es.wikipedia.org/wiki/Prueba_%CF%87%C2%B2
o http://www.ub.edu/aplica_infor/spss/cap5-2.htm
GEOESTADÍSTICA II Página 10
2014TRABAJO: CHI CUADRADO