Modulo Metodos Estadisticos

Click here to load reader

Transcript of Modulo Metodos Estadisticos

ANALISIS DE DATOS CON EXCEL

Programas de Experiencias Adquiridas- Universidad Cesar Vallejo

I. LA ESTADISTICA

1. DEFINICIN: La Estadstica es una ciencia que nos ofrece un conjunto de mtodos y tcnicas para recopilar, organizar, presentar, analizar e interpretar un conjunto de datos respecto a variables en estudio de una poblacin, con el fin de obtener conclusiones y tomar decisiones sobre determinados hechos o fenmenos en estudio.La estadstica es una rama de la matemtica y es parte del mtodo cientfico. En la actualidad, para hacer investigacin cientfica se necesita conocer de estadstica.

2. CLASIFICACION DE LA ESTADSTICALa Estadstica se clasifica de la siguiente manera: 2.1. Estadstica DescriptivaEs aquella rea de la Estadstica que describe y analiza una poblacin, sin pretender sacar conclusiones de tipo general. Es decir, las conclusiones obtenidas con validas solo para dicha poblacin.2.2. Estadstica InferencialEs aquella rea de la Estadstica, cuyo propsito es inferir o inducir leyes de comportamiento de una poblacin, a partir del estudio de una muestra. Es decir las conclusiones obtenidas a partir de una muestra, son validas para toda la poblacin.

3. DEFINICIONES PRELIMINARES:3.1. UNIVERSO: Es el conjunto de individuos, objetos o entes que tienen caractersticas comunes, definidas en forma general en un espacio y tiempo.Ejemplo: Conjuntos de alumnos, concjunto de docentes universitarios, conjunto de de pacientes, conjunto de clientes, conjunto de proveedores, conjunto de viviendas, conjunto de establecimientos, conjunto de documentos, etc.; de una determinada regin o zona en un tiempo determinado.

3.2. POBLACIN: Es un conjunto grande y completo de individuos, elementos o unidades que presentan como mnimo una caracterstica en comn y observable. Para definir una poblacin esta debe contener los siguientes elementos: contenido, espacio y tiempo. Al nmero de elementos de una poblacin de denota por N. Una poblacin puede clasificarse de la siguiente manera:A. Segn su extensin:Poblacin Finita: es aquella que tiene un determinado nmero de elementos.Poblacin Infinita: Es aquella cuyos elementos no se pueden contar.B. Segn su mbito o naturaleza: Poblacin Objeto: esta dada por los elementos que forman la poblacin.Poblacin Objetivo: esta dada por la informacin que da la poblacin objetoNota: De un universo se pueden desprender muchas poblaciones, pero operativamente se pueden hablar indistintamente como poblacin o universo.

3.3. MUESTRAEs una parte o un subconjunto de la poblacin en estudio. Tambin se puede decir que es una coleccin de unidades de muestreo seleccionados de un marco muestral o de varios marcos muestrales. Al nmero de elementos de la muestra se denota por n.Una muestra tiene las siguientes caractersticas:a. Es representativa.b. Es adecuada.

MUESTREO Es una tcnica estadstica por la cual se realizan inferencias o generalizaciones para una poblacin examinando solo una muestra de ella. Es una tcnica empleada para seleccionar elementos de una poblacin. Su propsito es proporcionar diferente tipo de informacin estadstica de naturaleza cuantitativa o cualitativa. Por su gran importancia los investigadores lo utilizan en los diferentes campos de saber y tambin lo usamos en la vida diaria.

3.4. UNIDAD DE ESTUDIO: Es el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a dar la informacin. Es el individuo u objeto del cual se toman las mediciones u observaciones.Ejemplos:Un docente, un auxiliar de educacin, un votante, una factura, una empresa, una botella de cerveza, una universidad, una vaca, una gota de sangre, etc.

3.5. OBSERVACIONES: Estadsticamente son los datos que se recolectan para un estudio. Una observacin o dato es cuando una variable en si toma un valor especifico.

3.6. VARIABLE:Una variable es una caracterstica de estudio de una poblacin. Una variable es lo que se quiere evaluar en una investigacin. Las caractersticas toma diferentes valores que varan de individuo a individuo o de objeto a objeto. Aquellas caractersticas que permanecen inalterables en las unidades de estudio reciben el nombre de constantes.Generalmente, las variables se designan con las ltimas letras maysculas del abecedario: X, Y, Z; y los valores de las variables se designan con letras minsculas: xi , yi , etc.Las variables se clasifican de la siguiente manera: Por su relacin: Variable dependiente - variable independiente. Por su escala de medicin: Nominal Ordinal Intervalo Razn. Por su naturaleza: Cuantitativas - Cualitativas.

VariableCualitativaCuantitativaNominalOrdinalDiscretaContinuaCualidadOAtributoCantidad o nmeroConteoMedicinNo ordenOrden

Ejemplos:Unidad de estudioVariable EstudiantePeso, talla, edad, ci, nmero de hermanos, raza, color de ojos, tipo de sangre, etc. EmpresaGanancia, costos, produccin, nmero de trabajadores, numero de computadoras, etc. PYMENmero de trabajadores, aos de funcionamiento, ganancias, etc.

3.7. PARAMETRO:Es un valor, una cantidad, un indicador que se obtiene con informacin de la poblacin. Dentro de estos tenemos: a. El promedio poblacionalb. La varianza poblacional.c. La proporcin poblacional, etc.

3.8. ESTIMADOR:Es un valor, una cantidad, un indicador que se obtiene con informacin de la muestra. Dentro de estos tenemos:a. El promedio muestral.b. La varianza muestral.c. La proporcin muestral, etc.

3.9. INVESTIGACIN CUANTITATIVA Y CUALITATIVAEl objetivo de cualquier ciencia es adquirir conocimientos y la eleccin del mtodo adecuado que nos permita conocer la realidad es por tanto fundamental. Los mtodos inductivos y deductivos tienen objetivos diferentes y podran ser resumidos como desarrollo de la teora y anlisis de la teora respectivamente.

Los mtodos inductivos estn generalmente asociados con la investigacin cualitativa mientras que el mtodo deductivo est asociado frecuentemente con la investigacin cuantitativa.

La investigacin cuantitativa es aquella en la que se recogen y analizan datos cuantitativos sobre variables. La investigacin cualitativa evita la cuantificacin. Los investigadores cualitativos hacen registros narrativos de los fenmenos que son estudiados mediante tcnicas como la observacin participante y las entrevistas no estructuradas. La diferencia fundamental entre ambas metodologas es que la cuantitativaestudia la asociacin o relacin entre variables cuantificadas y la cualitativa lo hace en contextos estructurales y situacionales.

La investigacin cualitativa trata de identificar la naturaleza profunda de las realidades, su sistema de relaciones, su estructura dinmica. La investigacin cuantitativa trata de determinar la fuerza de asociacin o correlacin entre variables, la generalizacin y objetivacin de los resultados a travs de una muestra para hacer inferencia a una poblacin de la cual toda muestra procede. Tras el estudio de la asociacin o correlacin pretende, a su vez, hacer inferencia causal que explique por qu las cosas suceden o no de una forma determinada.

VENTAJAS E INCONVENIENTES DE LOS MTODOS

Tabla 1. Diferencias entre investigacin cualitativa y cuantitativa.Investigacin cualitativaInvestigacin cuantitativa

Centrada en la fenomenologa y comprensinBasada en la induccin probabilstica del positivismo lgico

Observacin naturista sin controlMedicin penetrante y controlada

SubjetivaObjetiva

Inferencias de sus datosInferencias ms all de los datos

Exploratoria, inductiva y descriptivaConfirmatoria, inferencial, deductiva

Orientada al procesoOrientada al resultado

Datos "ricos y profundos"Datos "slidos y repetibles"

No generalizableGeneralizable

HolistaParticularista

Realidad dinmicaRealidad esttica

Tabla 2.Ventajas e inconvenientes de los mtodos cualitativos vs cuantitativos.Mtodos cualitativosMtodos cuantitativos

Propensin a "comunicarse con" los sujetos del estudioPropensin a "servirse de" los sujetos del estudio.

Se limita a preguntar. Se limita a responder.

Comunicacin ms horizontal... entre el investigador y los investigados... mayor naturalidad y habilidad de estudiar los factores sociales en un escenario natural.

Son fuertes en trminos de validez interna, pero son dbiles en validez externa, lo que encuentran no es generalizable a la poblacinSon dbiles en trminos de validez interna -casi nunca sabemos si miden lo que quieren medir-, pero son fuertes en validez externa, lo que encuentran es generalizable a la poblacin.

Preguntan a los cuantitativos: Cuan particularizables son los hallazgos?Preguntan a los cualitativos: Son generalizables tus hallazgos?

3.10. TCNICAS DE RECOLECCIN DE DATOS: Las tcnicas de recoleccin de datos permiten la obtencin sistemtica de informacin acerca de los objetos de estudio (personas, objetos y fenmenos) y de su entorno.Como ya se mencion, la recoleccin de datos tiene que ser sistemtica, ya que, si los datos se recolectan al azar ser difcil responder las preguntas de investigacin de una manera concluyente.Las tcnicas de recoleccin de datos son1. Utilizacin de la informacin disponible2. Observacin3. Entrevista( cara a cara)4. Cuestionarios auto-administrados5. Discusin con grupos focales6. OtrasOBSERVACIN:La observacin es una tcnica que implica seleccionar ver y registrar sistemticamente, la conducta y caractersticas de seres vivos, objetos o fenmenos. La observacin de la conducta humana es una tcnica de recoleccin de datos muy utilizada que puede llevarse a cabo de diferentes formas:a. Observacin participativa: El observador participa en la situacin que observab. Observacin no participativa: El observador no participa en la situacin que observaLas observaciones pueden servir para diferentes propsitos. Pueden dar informacin adicional y ms confiable de la conducta de las u.e. que las entrevistas o los cuestionarios. Los cuestionarios pueden ser incompletos ya que se pueden olvidar algunas preguntas o porque los entrevistados olvidan o no desean contestar algunas cosas. Con la observacin se puede, entonces, verificar la informacin recolectada( especialmente sobre temas como alcoholismo, drogadiccin, sida,) pero tambin puede ser una fuente primaria de informacin ( observacin sistemtica de los juegos de los nios).La observacin de la conducta humana puede formar parte de algn estudio, pero como consume tiempo se usa con mayor frecuencia en estudios de pequea escala.

ENTREVISTA:La entrevista es una tcnica de recoleccin de datos que involucra el cuestionamiento oral de los entrevistados ya sea individualmente o en grupo. Las respuestas a las preguntas durante la entrevista pueden ser registradas por escrito o grabadas en una cinta. La entrevista pueden conducirse con diferentes grados de flexibilidad.Las entrevistas utilizando una cedula para asegurar que se discuten todos los puntos, pero dando suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador puede hacer preguntas adicionales para obtener tanta informacin adicional como sea posible, Las preguntas son abiertas y no hay restricciones para las respuestas.Este mtodo poco estructurado de hacer las preguntas puede ser til para entrevistas individuales o grupales con informantes claves.Un mtodo de entrevista flexible es til si el investigador sabe poco del problema o de la situacin que esta investigando. Se aplica en estudios exploratorios y en los estudios de caso.

ENCUESTAS:Hoy en da la palabra "encuesta" se usa ms frecuentemente para describir un mtodo de obtener informacin de una muestra de individuos. Esta "muestra" es usualmente slo una fraccin de la poblacin bajo estudio. Una "encuesta" recoge informacin de una "muestra." Una "muestra" es usualmente slo una porcin de la poblacin bajo estudio.Las encuestas pueden ser clasificadas en muchas maneras. Una dimensin es por tamao y tipo de muestra. Las encuestas pueden ser usadas para estudiar poblaciones humanas o no humanas (por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas). Mientras que muchos de los principios son los mismos para todas las encuestas, el foco aqu ser en mtodos para hacer encuestas a individuos. Las encuestas pueden ser clasificadas por su mtodo de recoleccin de datos. Las encuestas por correo, telefnicas y entrevistas en persona son las ms comunes. En los mtodos ms nuevos de recoger datos, la informacin se entra directamente a la computadora ya sea por un entrevistador adiestrado o an por la misma persona entrevistada. Un ejemplo bien conocido es la medicin de audiencias de televisin usando aparatos conectados a una muestra de televisores que graban automticamente los canales que se observan

OTRAS TCNICAS DE RECOLECCION DE DATOSa. Tcnica de grupo nominalb. Tcnica delphic. Historias de vidad. Escalase. Ensayosf. Estudios de casosg. Mapeoh. Tcnicas rpidas de evaluacin de sondeoi. Encuestas participativas.

3.11. INSTRUMENTOS DE RECOLECCIN DE DATOS: Si tenemos presente el tema de investigacin por el que nos estarnos guiando se percibir que, una vez obtenidos los indicadores de los elementos tericos y definido el diseo de la investigacin, se har necesario estructurar las tcnicas d recoleccin de datos correspondientes, para as poder construir los instrumentos que nos permitan obtener tales datos de la realidad. Un instrumento de recoleccin de datos es, en principio, cualquier recurso de que pueda valerse el investigador para acercarse a los fenmenos y extraer de ellos informacin. Ya adelantbamos que dentro de cada instrumento concreto pueden distinguirse dos aspectos diferentes: una forma y un contenido. La forma del instrumento se refiere al tipo de aproximacin que establecemos con lo emprico, a las tcnicas que utilizamos para esta tarea; una exposicin ms detallada de las principales es la que se ofrece al lector en este mismo captulo. En cuanto al contenido ste queda expresado en la especificacin de los datos concretos que necesitamos conseguir; se realiza, por lo tanto, en una serie de tems que no son otra cosa que los indicadores bajo la forma de preguntas, de elementos a observar, etc. De este modo, el instrumento sintetiza en s toda la labor previa de investigacin: resume los aportes del marco terico al seleccionar datos que corresponden a los indicadores y, por lo tanto, a las variables o conceptos utilizados; pero tambin expresa. todo lo que tiene de especficamente emprico nuestro objeto de estudio, pues sintetiza a travs de las tcnicas de recoleccin que emplea, el diseo concreto escogido para el trabajo.

PRACTICA CALIFICADA

Resolver los ejercicios presentados en la parte final del material de trabajo.

II. PRESENTACIN DE LA INFORMACIN:

En la Estadstica se trabaja generalmente con una gran cantidad de datos los cuales por facilidad de anlisis y clculos se organizan en Cuadros de Distribucin de Frecuencias (CDF) y Grficos Estadsticos (GE).

1. CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF):

1.1. DEFINICIN: Un cuadro de distribucin de frecuencias, es una tabla resumen de un conjunto de datos que muestra el comportamiento o distribucin de la variable en estudio en forma rpida y resumida.An cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta, generalmente es comn seguir algunos pasos que de alguna forma homogenizan criterios y ayudan a los fines didcticos. Para realizar este anlisis se tienen que tener en cuenta el tipo de variable que se esta evaluando.

1.2. PARTES DE UN CUADRO DE DISTRIBUCION DE FRECUENCIAS:Las partes de un CDF son las siguientes: a. Nmero del cuadro de frecuencias en forma correlativa.b. Ttulo: Especificar la variable y la poblacin en estudioc. Encabezado o conceptos.d. Cuerpo o contenido del cuadro de frecuenciase. Nota de pie (no siempre es necesaria)f. Fuenteg. Elaboracin

1.3. ELEMENTOS PARA CONSTRUIR UN CDF:Para construir un cuadro de frecuencias se utilizan los siguientes elementos:A. Valores de la variable Xi: Los valores de la variable o datos se representan por Xi. Ejm: Si se tienen 50 datos sus valores correspondientes no agrupados se representan como X1, X2, X3, ..., X50 .B. Intervalos de clase: Los intervalos son subconjuntos de la recta real Ron que estn definidos por un lmite menor o inferior Li y un lmite mayor o superior Ls.C. Frecuencia:1. Frecuencia absoluta simple: Se denotan por fi. Est constituida por el nmero de veces que se repite un valor. En el caso de intervalos es el nmero de observaciones comprendidas en dicho intervalo. Estas frecuencias siempre son enteros positivos y adems la suma de todos ellos es el tamao de la muestra n. 2. Frecuencia relativa: Se denotan por hi. Indica la relacin o proporcin existente entre la frecuencia absoluta simple y el nmero total de datos. Estas frecuencias son numeros fraccionarios positivos entre o y 1. Para fines interpretativos estas frecuencias se expresan en % (hi%) . As:

3. Frecuencia absoluta acumulada: Se denotan por Fi. Resulta de la suma de las frecuencias cuyas marcas de clase son iguales o menores a la marca de clase del intervalo dado o considerado, es decir:F1 = f1F2 = f1 + f2F3 = f1 + f2 + f3.............................................Fj = f1 + f2 + f3 + ....... + fi4. Frecuencia relativa acumulada: SE denotan Hi. Resulta de la suma de las frecuencias relativas simples hasta la frecuencia del intervalo considerado. As:H4 = h1 + h2 + h3 + h4H6 = h1 + h2 + ....+ h6 Para fines interpretativos estas frecuencias se expresan en % (Hi%) D. Marca de clase: Se denota por Yi. Es el promedio de los valores correspondientes a los lmites inferior y superior de cada uno de los intervalos determinados.

1.4. PROPIEDADES DE UN CDF:A. Las fi y Fi son siempre nmeros enteros positivos. Es decir: fi , Fi 0B. Las hi y Hi son siempre nmeros fraccionarios positivos comprendidos entre 0 y 1, es decir 0 hi , Hi 1C. F1 siempre es igual f1 y H1 siempre es igual a h1.D. La suma de todas las fi es igual a n y la suma de las hi es igual a 1.E. Fm siempre es igual a n y Hm siempre es igual a 1.

1.5. CONSTRUCCIN DE CUADROS DE FRECUENCIAS: Para la construccin de los CDF hay que tener en cuenta el tipo de variable que se esta analizando, es decir, si es cuantitativa continua, cuantitativa discreta o variable cualitativa.

A. CDF PARA UNA VARIABLE CUANTITATIVA CONTINUA: Para la construccin de este cuadro hay que realizar los siguientes pasos:PASO 1. Determinar el Rango del conjunto de datos.

R = Valor mximo - Valor mnimo

PASO 2. Determinar el nmero de intervalos m.

m = 1 + 3.322 log ( n ) Este valor siempre es un nmero entero (Redondeo)PASO 3. Determinar la amplitud A intervlica (de cada intervalo).

A = R / m Este valor esta en funcin de la estructura de la base de datos (tomar el inmediato superior)PASO 4. Determinar el nuevo rango R2 (Solamente si se tomo un inmediato superior)

R2 = A * m

A: es la amplitud teniendo en cuenta el inmediato superior.PASO 5. Determinar los intervalos y finalmente construir el cuadro.B. CDF PARA UNA VARIABLE CUANTITATIVA DISCRETA: Para la construccin de un CDF para una variable cuantitativa discreta (valores discretos) ya no se utiliza los pasos anteriores solamente colocar en los intervalos a los diferentes valores discretos.

C. CDF PARA UNA VARIABLE CUALITATIVA: Para la construccin de un CDF para una variable cualitativa se sigue los mismos pasos que para una variable cuantitativa discreta, es decir, solamente colocar en los en los intervalos a las diferentes categoras de la variable cualitativa.

Aplicaciones:

CASO N 01:

A continuacin se dan los datos relativos a las tasas de crecimiento de un grupo de Instituciones Educativas Particulares durante el ao 2006.1.391.352.271.152.291.751.321.521.721.082.141.651.152.521.752.262.231.932.551.891.681.481.702652.671.232.021.651.711.371.841.921.351.463.091.161.401.091.611.441.181.042.591.951.922.131.671.591.921.31

Construya un cuadro de distribucin de frecuencias.

CASO N 02:Se ha registrado el peso en kilogramos de 50 alumnos que estudian Ingeniera Industrial en la Universidad Cesar Vallejo-Trujillo. 45444350546049455045 49726056445250635049 47535250534555485050 4852 6860624555504952 50526350765853526059

Construya un cuadro de distribucin de frecuencias

PRACTICA CALIFICADA

Resolver los ejercicios presentados en la parte final del material de trabajo.

III. GRFICOS ESTADSTICOS:

1. DEFINICION: Un grfico estadstico es una representacin pictrica, cuyo objetivo es expresar el comportamiento de una variable en estudio. Los grficos estadsticos son representaciones de informacin real que existe en nuestro mundo, es una expresin artstica de datos reales y observados. Un grfico sirve tambin para comparar visualmente el comportamiento de dos o ms variables similares o relacionadas.

2. PARTES DE UN GRAFICO ESTADISTICO: Numeracin. Titulo: Aqu se seala la poblacin en estudio y la variable de inters. Diagrama: esta dado por el propio dibujo el cual representa el comportamiento de los datos. Escalas y/o leyendas: Son indicadores donde se precisa la correspondencia entre los elementos del grfico y la naturaleza de las medidas representadas. Fuente: Aqu se seala el CDF que permiti obtener el respectivo grfico.

3. CRITERIOS PARA CONSTRUIR GRAFICOS: No existe una regla especfica para la construccin de grficos, pero si es posible considerar algunas recomendaciones o criterios. Se emplea una diversidad de grficos, cuya estructura o forma depender del tipo de variable que se est estudiando. Este grfico debe tener rasgos simples y de fcil comprensin.

4. TIPOS DE GRAFICOS ESTADISTICOSHay varias tipos de grficos, los cuales dependen del tipo de variable que esta evaluando. Presentaremos aqu los mas importantes:a. Grfico de bastones: Se utiliza cuando se tienen datos de una variable cuantitativa discreta.b. Histograma: Se utiliza cuando se tienen datos de una variable cuantitativa continua. c. Grfico de Barras: Se utiliza cuando se tienen datos de una variable cualitativa. d. Grfico Sectorial o Pastel: Se utiliza cuando se tienen informacin de una variable cualitativa o cuantitativa discreta.e. Polgono de frecuencias: Se utiliza para indicar el comportamiento de un conjunto de datos. f. Grfico de series de tiempo: Se utiliza para analizar variables cuantitativas continuas pero expresadas en el tiempo.g. Pirmide poblacional: Se utiliza para analizar el comportamiento de una poblacin segn sexo y edad.

PRACTICA CALIFICADA

Resolver los ejercicios presentados en la parte final del material de trabajo.

IV. ANALISIS ESTADISTICO DESCRIPTIVO:

La estadstica descriptiva es una tcnica que consiste en obtener indicadores que describen el comportamiento de un conjunto de datos. Dentro de estas medidas estadsticas tenemos:A. Las medidas de Posicin: Dentro de estas tenemos:a. Medidas de tendencia central: Media, Moda, Mediana.b. Medidas de localizacin: cuartiles, deciles y percentiles.B. Las medidas de variacin: rango, varianza, desviacin estndar, coeficiente de variacin.C. Las medidas de deformacin: asimetra y kurtosis.

1. MEDIDAS DE TENDENCIA CENTRAL

1.1. MEDIA ARITMTICA: Se denota por Es la medida estadstica ms fcil de calcular. La media o promedio es el punto central de un conjunto de datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

1.2. MEDIANA: Se denota por Me. Es un valor que divide al conjunto de datos en dos partes iguales, es decir, cada segmento tiene el 50% de los datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

1.3. MODA: Se denota por Mo. La moda es el valor que ms se repite en un conjunto de datos. En un conjunto de datos se presentan los siguientes casos:a. No existir datos Amodalb. 1 modaUnimodal.c. 2 modasBimodald. 3 a mas modasMultimodal Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

2. MEDIDAS DE LOCALIZACIN:

2.1. CUARTILES: Se denotan por Qk, donde k=1,2,3 Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir, cada sector tiene el 25% de los datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

2.2. DECILES: Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9 Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir, cada sector tiene el 10% de los datos.

2.3. PERCENTILES: Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, , 99 Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir, cada sector tiene el 1% de los datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

3. MEDIDAS DE VARIABILIDAD:

3.1. RANGO: Se denota por R y la medida de variabilidad ms fcil de calcular. Es la diferencia que existe entre el valor mximo y el valor mnimo del conjunto de datos.

3.2. VARIANZA: Mide la variabilidad de un conjunto de datos respecto a un valor central(promedio) Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es ilgica su interpretacin. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

3.3. DESVIACIN ESTANDAR: Mide la variabilidad de un conjunto de datos respecto a su valor central pero en unidades originales. Esta es la medida de variabilidad que tiene una interpretacin lgica. Se obtiene al sacra la raz cuadrada de la varianza.

3.4. COEFICIETE DE VARIACIN: Se denota por C.V. El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento homogneo o heterogneo. Para llegar a determinar la homogeneidad se compara con un valor convencional del 33%. Si el CV 33% el conjunto de datos tiene un comportamiento homogneo. Si el CV > 33% el conjunto de datos tiene un comportamiento heterogneo.

4. MEDIDAS DE FORMA:

4.1. ASIMETRIA: La asimetra se entiende como la deformacin horizontal de un conjunto de datos. Para conocer esta asimetra se calcula el coeficiente de asimetra As. En un conjunto de datos pueden presentar los siguientes casos:a. As= 0, el conjunto de datos es simtrica.b. As0, el conjunto de datos es asimtrica positiva.

4.2. KURTOSIS: Se entiende por Kurtosis a la deformacin vertical de un conjunto de datos, es decir, mide el apuntamiento o achatamiento de un conjunto de datos. Para conocer que tipo de asimetra tiene un conjunto de datos, se utilizan las siguientes formulas:

A. Kurtosis en funcin de los momentos: Si K1>3, el conjunto de datos es leptocrtica. Si K1=3, el conjunto de datos es mesoctica. Si K10, el conjunto de datos es leptocrtica. Si K2=0, el conjunto de datos es mesoctica. Si K20.263, el conjunto de datos es leptocrtica. Si K3=0.263, el conjunto de datos es mesoctica. Si K310Luego, P [A B]= P [A] + P [B] P [AB] = 16/52 + 12/52 0/52 = 7/13= 0.5384 53.84%

1.6. RBOL DE PROBABILIDADES

El diagrama del rbol es ms sugerente para determinar el espacio muestral de un experimento aleatorio compuesto.

EJERCICIO: Se tiene 6 esferas de colores en una nfora, de las cuales 3 son rojas, 2 son blancas y 1 es negra. Se extraen aleatoriamente a la suerte de 1 en 1 sin reposicin

a. Construya un rbol de probabilidades hasta la tercera extraccinb. Cul es la probabilidad de obtener 2 rojas hasta la tercera extraccinc. Cul es la probabilidad de obtener una esfera blanca y una esfera negra hasta la segunda extraccin. SOLUCIN:

a. Figura

b. Probabilidad de obtener dos rojas hasta la tercera extraccin:

P [A]= 3/6 * 2/5 * 2/4+3/6 * 2/5 * 1/4+3/6 * 2/5 * 2/4+3/6 * 1/5 * 2/4+2/6 * 3/5 * 2/4+1/6 * 3/5 * 2/4P [A]= 9/20 = 0.45 45%

c. Probabilidad de obtener una esfera blanca y una esfera negra hasta la segunda extraccin:

P [x] = 2/6 * 1/5 + 1/6 * 2/5 = 2/15 = 0.1333 13.33%

3/62/61/62/52/51/53/51/51/53/52/52/42/42/41/41/41/42/41/42/41/41/43/41/43/41/42/42/43/41/4RBNRBNRBNRBRBRBRBNRBNRBRBNRNRB

1.6. PROBABILIDAD CONDICIONAL:

Es aquella en la que el total de casos posibles ya no es igual a n(S), sino que se refiere a un nmero menor o subconjunto de S.

SE LEE: probabilidad de que ocurra el suceso A, sabiendo que ha ocurrido el suceso B

Frmula:

En donde B es la condicin EJERCICIO:Se extrae una carta al azar. Cul es la probabilidad de que la carta seleccionada sea menor de 7, si se conoce que es roja?A = menor que 7B = color rojoP [A/B] = 12/26 = 6/13 = 46.15 % Hay 46.15% de probabilidades de que la carta seleccionada sea menor que 7, sabiendo que es roja.VIII. DISTRIBUCIONES DE PROBABILIDADES:

LA DISTRIBUCIN NORMAL:

La distribucin normal, llamada tambin Curva de Gauss (en recuerdo al cientfico que lo descubri), es la distribucin de probabilidad ms importancia en la Estadstica y por ende del Calculo de Probabilidades. Esta distribucin de probabilidad es importante porque las variables aleatorias continuas (peso, edad, talla, produccin, gasto en publicidad, temperatura, ventas, PBI, ganancias, etc) que son variables que ms se evalan en una investigacin cientfica o investigacin de mercados se aproximan a esta distribucin de probabilidad. Tambin es importante porque se utiliza como aproximacin de las distribuciones discretas tales como: la Binomial, la Poisson, etc.

CARACTERSTICAS

1.Tiene como parmetros a y 2.Su funcin de probabilidad est dada por:

Adems: - + - < < + y > 0

3. El promedio puede tomar valores entre y + mientras que > 0, entonces existen infinitas curvas normales. 4. Esta funcin de probabilidad es asinttica con respecto al eje X, (a pesar de tener recorrido infinito, la curva nunca toca el eje X); adems es unimodal y es simtrica con respecto a la media .5. El are bajo esta funcin o curva es 1 100%, de la misma manera se sabe que las reas comprendidas bajo la curva normal son :

1. = 68.3%

2. 2 = 95.5%

3. 3 = 99%

-3 2 1 1 2 3 +

7. Para calcular probabilidades en la distribucin normal se necesitaran infinitas tablas de probabilidad.

LA DISTRIBUCIN NORMAL ESTNDAR:

1.Es una distribucin a la cual se le ha modificado la escala original; esta modificacin se ha logrado restando la media al valor de la variable original y dividiendo este resultado por , la nueva variable se denota por Z y recibe el nombre de variable estandarizada

2.La modificacin de la escala ha permitido elaborar una tabla para el clculo de las probabilidades; si esto no hubiera sido posible, sera necesario construir una tabla para cada valor de y .3. La funcin de densidad de la variable estandarizada es:

4.El promedio (valor esperado) y la varianza de Z son:E(Z) = 0 , V(Z) = 15. Notacin:Si X es v.a. continua distribuida normalmente con media y varianza 2 , la denotamos por : X N( , 2). Aplicando esta notacin a la variable normal estandarizada Z, escribimos: Z N(0 , 1) , esto se interpreta como, Z tiene distribucin normal con media 0 y varianza 1. 6.La superficie bajo la curva normal Z estandarizada tambin es igual a 1. Por consiguiente, las probabilidades pueden representarse como reas bajo la curva normal escandalizada entre dos valores.7.Debido a que la distribucin normal es simtrica muchas de las tablas disponibles contienen solo probabilidades para valores positivos de Z. USO DE TABLA:Si se conoce el comportamiento de una variable, es decir, se sabe que tienen una distribucin normal, para calcular las diferentes probabilidades se tiene que estandarizar la variable. Una vez estandarizada la variable, recin utilizar la tabla de la distribucin normal estandarizada o tabla Z.FORMULAS:

a.

b.

c.

PRACTICA CALIFICADAResolver los ejercicios presentados en la parte final del material de trabajo.IX. ESTIMACIN ESTADSTICA

ESTIMACIN: Es el proceso mediante el cual se intenta determinar el valor del parmetro de la poblacin a partir de la informacin de una muestra. Al realizar una estimacin siempre se va a cometer un error. Existen dos tipos de estimacin:A. ESTIMACIN PUNTUAL B. ESTIMACIN INTERVLICA

A. ESTIMACION PUNTUAL: Es aquel nico valor que se obtiene de la muestra, es decir, que para su clculo se debe tener informacin muestral. Las formulas para calcular o realizar estas estimaciones son las siguientes:

PROMEDIOVARIANZAPROPORCION

PARAMETRO

ESTIMACION PUNTUAL

B. ESTIMACIN INTERVLICA: Al realizar una estimacin, siempre se va a cometer un error. Entonces, cuando estimamos un parmetro nunca va a ser exacto, ese valor ser mayor o menor al verdadero. Entonces se obtendr un intervalo de valores posibles. Ese intervalo se llama estimacin intervlica.A esa diferencia mayor o menor se llama error de estimacin, el cual esta en relacin directa con la variabilidad del estimador y el nivel de confianza determinado por el investigador. La estimacin intervalica para un parmetro en general, esta dada por:

Error de EstimacinError de estimacinTambin se puede escribir de la siguiente manera:

Para determinar este intervalo se necesita de:a. La estimacin puntualb. La desviacin estndar del estimador.c. Nivel de confianza, el cual ser repartido para cada lado del intervalo.

FORMULAS DE LOS INTERVALOS DE CONFIANZA

I. INTERVALO DE CONFIANZA PARA EL PROMEDIO POBLACIONAL

A. Si la muestra (n) es mayor de 30 y la varianza poblacional es conocida:

B. Si la muestra (n) es menor o igual a 30 y la varianza poblacional es desconocida:

II. INTERVALO DE CONFIANZA PARA LA PROPORCION POBLACIONAL

A. Si la proporcin poblacional se conoce:

B. Si la proporcin poblacional No se conoce: (entonces hay que calcularla en la muestra)

III. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS

A. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas poblacionales se CONOCEN:

B. Si las muestras son de tamao n130 y n2>30 (grandes) y adems las varianzas poblacionales se CONOCEN:Estadstico de prueba:

D. Si las muestras son de tamao n1