Guia Estadistica

download Guia Estadistica

of 18

description

Estadística y Porbabilidad

Transcript of Guia Estadistica

Gua EstadsticaEstadstica: es unaciencia formaly una herramienta que estudia el uso y los anlisis provenientes de una muestra representativa dedatos, busca explicar las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en formaaleatoriaocondicional.1) Estadstica descriptiva: Se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. (Mediay ladesviacin estndar, histograma,pirmide poblacional,grfico circular, etc.)2) Estadstica inferencial: Se dedica a la generacin de losmodelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta laaleatoriedadde las observaciones.Mtodos Estadsticos:1) Recoleccin de Datos ( forma en que vamos a recabar informacin, analizar, organizar e interpretar)2) Encuestas (Senzo)3) Observacin4) Experimentacin5) ConsultaMuestreo:es la tcnica para la seleccin de unamuestraa partir de unapoblacin.Tipos de muestreo:1) Muestreo aleatorio simple: Forman parte de este tipo de muestreo todos aquellos mtodos para los que se puede calcular la probabilidad de extraccin de cualquiera de las muestras posibles. Este conjunto de tcnicas de muestreo es el ms aconsejable, aunque en ocasiones no es posible optar por l.2) Muestreo estratificado: Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo que compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms usadas en la prctica.

3) Muestreo por conglomerados: Se utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que se supone que contienen toda la variabilidad de la poblacin, es decir, la representan fielmente respecto a la caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos oconglomeradospara la realizacin del estudio.4) Muestreo sistemtico: Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario.

Distribucin de FrecuenciasUnas vez que los datos han sido recopilados se procede a organizarlos para su fcil manejo. Se divide en 3 pasos:1) Correccin2) Clasificacin3) Tabulacin Grafica EstadsticaClases f fa fra Marca L.R.CTamao de Ancho

58Inf.Sup.

60-6299.096159.562.53

63-652938.386462.565.53

66-684280.806765.568.53

69-711696.967068.571.53

72-7441001.07371.574.53

76

*Barras* (Dibujar Ejemplo)

*Polgono de Frecuencias* (Dibujar Ejemplo)Se usa indistintamente para variables discretas y continuas y se construye con la frecuencia simple y las marcas de clase.

*Histograma* (Dibujar Ejemplo)Se usa para representar variables continuas aunque tambin para variables discretas tabuladas en intervalos, se construye con Lim reales de clase y frecuencia simple.

*Ojiva* (Dibujar Ejemplo)Es la que ms nos puede dar informacin ya que nos permite saber el comportamiento con respecto al total de datos, se construye con los Lim reales de clase y la frecuencia acumulada.

Mediana

Li: lmite real inferior de la clase medianan: # total de datosf: suma de frecuencias antes de la medianaf med: frecuencia simple de la clase medianaC: ancho o tamao de clase

Ejemplo:Clases f fa fra Marca L.R.CTamao de Ancho

58Inf.Sup.

60-6299.096159.562.53

63-652938.386462.565.53

66-684280.806765.568.53

69-711696.967068.571.53

72-7441001.07371.574.53

76

= 66.3571 Moda

Li: lmite real inferior de la clase modal1: diferencia de frecuencia entre la clase modal y la premodal2: diferencia de frecuencia entre la clase modal y la postmodalC: tamao de clase

Ejemplo:Clases f fa fra Marca L.R.CTamao de Ancho

58Inf.Sup.

60-6299.096159.562.53

63-652938.386462.565.53

66-684280.806765.568.53

69-711696.967068.571.53

72-7441001.07371.574.53

76

Medidas de DispersinSon valores que nos permiten saber que tan lejanos o cercanos estn los datos con respecto a la media o que tan amplio es el rango de variabilidad de los datos. Estas medidas son el rango, la desviacin media, la varianza y la desviacin estndar. Se emplea para medir el promedio de los alejamientos de los datos con respecto a la media. Se calcula con la siguiente ecuacin.

X= dato= median= # de datos totales1) Calcular la desviacin media del siguiente conjunto de datos.22-18.71 = 3.2923.2910.82

23-18.71 = 4.29 24.2918.46

17-18.71 =-1.7121.712.92

19-18.71 = 0.2920.290.084

18-18.71 =-0.7120.710.504

15-18.71 =-3.7123.7113.76

17-18.71 =-1.7121.712.92

131/7= 18.71= 15.71= 49.46

Otra forma de evitar el 0 es usando la varianza.

Varianza

Ejemplo:22-18.71 = 3.2923.2910.82

23-18.71 = 4.29 24.2918.46

17-18.71 =-1.7121.712.92

19-18.71 = 0.2920.290.084

18-18.71 =-0.7120.710.504

15-18.71 =-3.7123.7113.76

17-18.71 =-1.7121.712.92

131/7= 18.71= 15.71= 49.46

Desviacin Estndar (S)

Ejemplo:

Datos BivariadosHasta el da de hoy el anlisis estadstico se ha realizado para una sola variable, pero Qu pasa cuando tenemos dos?Cuando se tienen 2 variables a analizar se les denomina datos Bivariados y las combinaciones que se puede presentar se trabajan por medio de mtodos tabulares y mtodos grficos.Los datos Bivariados son los valores de dos variables diferentes que se obtienen de un mismo elemento poblacional.Los datos Bivariados se pueden presentar en una tabla de contingencia y a partir de ella obtener porcentajes de cada una de las variables y combinacin de ellas como se muestra en el siguiente ejemplo:ArtesAdministracinTecnologaTotal

H56718

M64212

Total1120930

Tabla de Porcentaje de gran total:

ArtesAdministracinTecnologaTotal

H0.160.200.230.60

M0.200.130.060.40

0.360.330.301.00

Porcentajes por Columna:

ArtesAdministracinTecnologaTotal

H0.450.600.770.60

M0.550.400.220.40

1.001.000.991.00

Porcentaje por Rengln:

ArtesAdministracinTecnologaTotal

H0.270.330.381.00

M0.500.330.171.00

0.360.330.301.00

1) Qu porcentaje de los encuestados estudia tecnologa?R) 30%

2) Qu porcentaje de los que estudian administracin son mujeres?R) 40%

3) Qu porcentaje de los hombres estudian artes?R) 27%

Puntuacin ZEs otra medida de posicin en el sentido de que describe la localizacin de un valor en trminos de desviaciones estndar con respecto a la media.Una puntuacin de Z= 2 indica que el valor est a dos desviaciones estndar por encima de la media; y un valor de Z= -3 indica que el valor esta a 3 desviaciones estndar por abajo.Las puntuaciones Z nos permiten comparar valores de distintos conjuntos de datos.

Muestra:

Z: puntuacin estndarX: dato o valor: media : Desviacin estndar Poblacin:

Z: puntuacin estndarX: dato o valor: media : desviacin estndar

*Extras* Muestra: Un subconjunto de la poblacin. Poblacin: Es el universo que nos interesa estudiar. Diagrama de Pareto: consiste en un grfico de barras similar al histograma que se conjuga con una ojiva o curva de tipo creciente y que representa en forma decreciente el grado de importancia o peso que tienen los diferentes factores que afectan a unproceso, operacin o resultado. El diagrama de tallo y hoja: es una herramienta que permite obtener una representacin visual informativa de un conjunto de datos, para su elaboracin es necesario separar para cada uno de los datos el ltimo dgito de la derecha (hoja) del bloque de cifras restantes (tallo). Variable: es una propiedad que puede fluctuar y cuya variacin es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse. Variable Discreta: Es la variable lo que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores especficos que la variable pueda asumir. Ejemplo: El nmero de hijos (1, 2, 3, 4, 5). Variable Continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3kg, 2,4kg, 2,5kg,...) o la altura (1,64m, 1,65m, 1,66m,...), o el salario. Solamente se est limitado por la precisin del aparato medidor, en teora permiten que exista un valor entre dos variables. Variable Independiente: es aquella cuyo valor no depende de otra variable. La variable independiente se representa en el eje de abscisas. Variable Dependiente: Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable. La variable dependiente en una funcin se suele representar por y. La variable dependiente se representa en el eje ordenadas. Frecuencia Relativa: Razn entre el nmero de veces que se repite cada dato entre el total de los datos obtenidos. Categora Ordinal: describen el orden de los mismos con base en una escala. En la escala, no hay manera de distinguir la diferencia relativa entre los grupos. Por ejemplo, podemos decir que un auto lleg primero, segundo o de ltimo, pero no sabemos el tiempo de diferencia entre cada vehculo si no se nos provee ms informacin.

Categora Nominal: se basan en el etiquetado o codificacin de informacin en categoras. Generalmente, creas nombres para la informacin con base en las caractersticas. Por ejemplo, puedes clasificar los colores de cabello en moreno, rubio, rojo o negro.

Limites Reales: Puntos extremos de un intervalo de clase

Rango: diferencia entre el dato mayor y el menor de un conjunto de datos.

Binominal: esta distribucin agrupa los resultados en dos categoras mutuamente excluyentes.

Distribucin de Poisson: es unadistribucin de probabilidaddiscretaque expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un determinado nmero de eventos durante cierto perodo de tiempo.