Estmerc m1 Manual

61
ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I  INTRODUCCIÓN En el curso de Estadística Empresarial abordamos de manera profunda la estadística descriptiva definiendo cada uno de sus conceptos bases como: po blación, muestra, parámetro, estadístico, variables y escalas de medida. Conceptos que nos permitieron comprender la tabulación de datos, distribuciones de frecuencia, representaciones gráficas y medidas de resumen. Luego estudiamos las tablas bidimensionales y Regresión lineal para finalizar el curso con probabilidades. El curso de inferencia estadística requiere como base recordar algunos conceptos mencionados anteriormente para poder sustentar los nuevos conocimientos estadísticos que serán aborda dos en este módulo. El principal objetiv o de este curso es realizar inferencias con respecto a la población basándose en la información contenida en una muestra. Las poblaciones se describen mediante medidas numéricas denominadas parámetr os, el objetivo de la mayoría de las investigaciones estadísticas es deducir una inferencia con respecto a uno o más parámetros de la población. En este módulo centraremos nuestra atención al estudio de la estimación de parámetros. Comenzaremos el módulo recordando algunos co nceptos preliminares de estadística descriptiva dando énfasis en las medidas de resumen ya que corresponden a medidas descriptivas de la muestra también llamadas estadísticos.  Siguiendo los contenidos conoceremos el concepto de variable aleatoria aplicada al cálculo de probabilidades sobre valores que tome la variable aleatoria haciendo su uso la distribución normal y propiedades. Le seguirá el estudio de las distribuciones muéstrales las cuales serán de gran utilidad en el módulo 2. Finalmente trataremos los métodos de estimación puntual e intervalar para los distintos parámetros de estudio.

Transcript of Estmerc m1 Manual

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    1

    INTRODUCCIN En el curso de Estadstica Empresarial abordamos de manera profunda la estadstica descriptiva definiendo cada uno de sus conceptos bases como: poblacin, muestra, parmetro, estadstico, variables y escalas de medida. Conceptos que nos permitieron comprender la tabulacin de datos, distribuciones de frecuencia, representaciones grficas y medidas de resumen. Luego estudiamos las tablas bidimensionales y Regresin lineal para finalizar el curso con probabilidades. El curso de inferencia estadstica requiere como base recordar algunos conceptos mencionados anteriormente para poder sustentar los nuevos conocimientos estadsticos que sern abordados en este mdulo. El principal objetivo de este curso es realizar inferencias con respecto a la poblacin basndose en la informacin contenida en una muestra. Las poblaciones se describen mediante medidas numricas denominadas parmetros, el objetivo de la mayora de las investigaciones estadsticas es deducir una inferencia con respecto a uno o ms parmetros de la poblacin. En este mdulo centraremos nuestra atencin al estudio de la estimacin de parmetros. Comenzaremos el mdulo recordando algunos conceptos preliminares de estadstica descriptiva dando nfasis en las medidas de resumen ya que corresponden a medidas descriptivas de la muestra tambin llamadas estadsticos. Siguiendo los contenidos conoceremos el concepto de variable aleatoria aplicada al clculo de probabilidades sobre valores que tome la variable aleatoria haciendo su uso la distribucin normal y propiedades. Le seguir el estudio de las distribuciones mustrales las cuales sern de gran utilidad en el mdulo 2. Finalmente trataremos los mtodos de estimacin puntual e intervalar para los distintos parmetros de estudio.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    2

    ESQUEMA GENERAL DEL MODULO 1

    Mdulo 1

    Conceptos Preliminares

    1) Importancia de la estadstica y aplicacin en la empresa 2) Tipos de Variables 3) Matriz de datos y Tabulacin de datos 4) Distribucin de Frecuencias y representaciones grficas 5) Medidas de Resumen

    Variable Aleatoria

    1) Concepto Variable 2) Aleatoria Discretas 3) Variable Aleatoria Continua

    Distribucin Normal

    1) Caractersticas 2) Distribucin Normal Estandarizada 3) Clculo de Probabilidades 4) Estrategia para resolver ejercicios resueltos 5) Gua de estudio distribucin normal

    Distribuciones muestrales

    1) Estadsticos y Parmetros 2) Tipos de distribuciones muestrales 3)Distribuciones muestrales de los estadsticos 4) Estrategia para resolver ejercicios y Casos propuestos para resolver

    Estimacin de parmetros

    1) Introduccin 2) Estimacin puntual 3) Mtodos de estimacin puntual 3) Propiedades de los estimadores 4) Estadsticos de orden y sus propiedades 5) Estimacin por intervalos de confianza para medias, varianzas y proporciones 6) Pasos para resolver un intervalo de confianza 7) Gua de ejercicios de estimacin puntual e intervalo de confianza para medias, varianzas y proporciones.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    3

    OBJETIVO GENERAL Introducir a los alumnos en los conceptos bsicos de inferencia estadstica.

    CONTENIDOS

    1. Conceptos Preliminares

    2. Variable Aleatoria

    3. Distribucin normal

    4. Distribuciones Muestrales

    5. Estimacin de parmetros

    Conceptos Preliminares

    1.1. Importancia de la estadstica y aplicacin en la empresa La estadstica es una ciencia que se ha convertido en una herramienta imprescindible ante la necesidad de conocimiento y anlisis de informacin. La utilidad para el administrador de una empresa, es que a travs de la aplicacin de procedimientos estadsticos precisos, pueden predecirse algunos sucesos futuros con cierto grado de exactitud y eso beneficiar profundamente a la empresa. El costo de recolectar la informacin es estratgico, ya que contribuye notablemente a una mejor gestin. Peter Drucker "el padre del management" afirma que las mediciones son la clave. Si usted no puede medirlo, no puede controlarlo. Si no puede controlarlo, no puede gestionarlo. Si no puede gestionarlo, no puede mejorarlo. La falta sistemtica o ausencia estructural de estadsticas en las organizaciones impide una administracin cientfica de las mismas. (1) As pues, slo en la medida en que seamos capaces de comprender y dominar la correcta utilizacin de los mtodos estadsticos, podremos interpretar, valorar y extraer todo el provecho posible a los datos procedentes de nuestra empresa. Ejemplos

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    4

    Mercadeo: Qu clientes les generan los mayores beneficios?, Qu zonas o regiones son las que generan mayores ventas en unidades monetarias y volmenes?, Cul es el nivel de rotacin o permanencia de clientes?, En qu etapa del ciclo de vida se encuentra cada uno de sus productos o servicios?, Cul es el nivel de satisfaccin de los clientes?. (1)

    Operaciones: Cules son las reparaciones que ms se han producido en el ltimo trimestre?, Qu tipo de reparaciones han generado mayores egresos?, Cul es la capacidad de los diferentes procesos en materia de costos, productividad y calidad?. (1)

    Finanzas: En el clculo del costeo de todas las operaciones, En qu momento se alcanza el punto de equilibrio? (1)

    Ejercicio: Busque ejemplos de aplicaciones de la estadstica en el rea financiera y administrativa. La estadstica es la disciplina cientfica dedicada a la recoleccin, presentacin y anlisis de la informacin para la toma de decisiones. Al reunir informacin sobre ciertas caractersticas de los elementos de un grupo de individuos u objetos es a menudo inconveniente o imposible observar todo el grupo para lo cual se examina una pequea parte llamada muestra. Si la muestra es representativa de la poblacin, su anlisis permitir formular importantes conclusiones sobre la poblacin.

    (1)http://estadisticaparaadministracion.blogspot.com/2011/07/aplicaciones-de-la-estadistica-en-la.html

    La estadstica bsica se divide en Estadstica Descriptiva y Estadstica inferencia. Se llama estadstica descriptiva a aquella que se preocupa de describir y analizar un grupo dado sin extraer conclusiones o inferencia sobre un grupo ms grande o poblacin. La rama de la estadstica que se preocupa de las condiciones bajo las cuales tal inferencia (deduccin) es vlida, se llama inferencia estadstica, como en tal conclusin no hay seguridad absoluta se emplea el lenguaje de las probabilidades.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    5

    Recordemos algunos trminos comunes utilizados:

    Poblacin: conjunto de objetos los elementos (individuos, objetos, etc.) de inters para un determinado problema. A los elementos que conforman la poblacin se les llama unidad observable o unidad de observacin. Muestra: cualquier subconjunto no vaco de la poblacin. Se llama variable a una caracterstica que toma un valor para cada individuo u objeto de una poblacin. Las caractersticas numricas de la poblacin se denominan parmetros y las caractersticas numricas de la muestra se llaman estadsticos o estadgrafos. Dato u observacin: es el valor de la variable asociada a un elemento de la poblacin o muestra, puede ser un nmero, palabra o smbolo. Experimento: es el procedimiento cuyos resultados producen el conjunto de datos. Ejercicio. Identifique la poblacin, la muestra, la variable, los datos, el experimento, el parmetro, la estadstica, si es posible, en las aplicaciones que busco anteriormente o en las dadas en el ejemplo.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    6

    Para que utilizamos la estadstica en la empresa?

    Los anlisis estadsticos son fundamentales a los efectos de gestionar y mejorar temas o actividades tales como: 1. El control de calidad. 16. Gestin de inventarios.

    2. El nivel de averas y sus frecuencias. 17. Cumplimiento de aprovisionamiento por parte de los proveedores.

    3. Los tiempos para cambios o preparacin de herramientas.

    18. Prediccin de ventas por canales de comercializacin.

    4. Los niveles de productividad de distintos procesos, actividades y productos.

    19. Proyectos de inversin.

    5. Los costos correspondientes a distintos tipos de conceptos y actividades.

    20. Probabilidades para la construccin del rbol para la Toma de Decisiones.

    6. La gestin de crditos y cobranzas. 21. Evolucin de los distintos ratios econmicos financieros y patrimoniales a lo largo del tiempo.

    7. El seguimiento del flujo de fondos. 22. Estudios e investigacin de mercado.

    8. Los niveles de satisfaccin de los clientes y usuarios.

    23. Tiempos de mquinas y personas por actividad.

    9. Los tipos de accidentes y sus frecuencias. 24. Cantidad y representacin porcentual de mltiples problemas y sus efectos econmicos en la empresa.

    10. El anlisis mediante diagramas de Pareto de defectos, costes, rentabilidades, ventas.

    25. Tasa de polivalencia del personal.

    11. Ventas por clientes, vendedores, zonas y productos.

    26. Productos ms demandados, a nivel global, por zona y por canal de comercializacin.

    12. Predicciones de ventas por zonas, productos, servicios o sucursales.

    27. Porcentajes de actividades generadoras de valor agregado para los clientes finales, de valor agregado para la empresa y carentes de valor agregado.

    13. Capacidad de los procesos en cuanto a generacin de niveles de costes, calidad y productividad.

    28. Tiempos promedios, mximos y mnimos de reparaciones por tipo de averas.

    14. Tiempos totales de ciclos productivos. 29. Clculos de costes y en especial para el Costeo Basado en Actividades.

    15. Tiempos de respuestas. 32. Estadsticas de los personales (directivos y empleados).

    __________________________________________________________________________ (2)

    Notas de Estadstica Aplicada a la Administracin, Contadura e Informtica Administrativa I. Semestre 2012-2. Dr. Francisco Javier Tapia Moreno. Departamento de Matemticas. Universidad de Sonora.

    1.2. Tipos de Variables Dado un conjunto de datos de una variable, que denotaremos por X, las variables se clasifican en cualitativas y cuantitativas.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    7

    Variables cualitativas (o atributos o categrica) son aquellas cuyos valores corresponden a conceptos, atributos o cualidades, solo pueden clasificarse pero no medirse. Por ejemplo: Al referirse a la cantidad fabricada de un cierto producto, puede ser que existan tres fabricantes y se tienen que categorizar en el productor A, el productor B y el producto C para poder mencionar su volumen anual de produccin. O bien, al referirse al sexo de una persona, se tienen dos cualidades o categoras, femenino y masculino. Aqu podemos diferenciar dos tipos de variables cualitativas:

    Nominales: (slo se etiquetan) slo permiten la clasificacin, no se puede establecer entre ellas ningn tipo de orden, por ejemplo, color, lugar de residencia, sexo, tamao, raza, estado civil.

    Ordinales: (se etiquetan y ordenan) toman distintos valores ordenados siguiendo una escala establecida, por ejemplo, nivel socioeconmico, intensidad de consumo de alcohol, das de la semana, meses del ao, grado acadmico. etc. Estas variables regularmente estn sujetas a escalas de medicin tales como escalas de Likert, Killip o Apgar.

    Variables cuantitativas (o numricas) son aquellas cuyos valores corresponden a nmeros reales. Por ejemplo altura, peso, nota, ingreso, nmero de hijos, nmero de parsitos en un cm3 de sangre, contenido de glucosa en una solucin, etc. Aqu podemos diferenciar dos tipos de variables cuantitativas:

    Discretas: (toman valores como 1, 2, 3,...) son aquellas variables que slo pueden

    tomar cantidades contables (que se puedan contar) de valores distintos. Estos es,

    las variables discretas slo puede tomar valores enteros y, entre un valor y otro

    siempre existir un vaco o interrupcin. Ejemplos de este tipo de variables es, el

    nmero de artculos fabricados en una empresa un da determinado, el nmero de

    pedidos tomados en una pizzera de la localidad, el nmero de hijos en una familia,

    el nmero de trabajadores en una empresa.

    Continuas son aquellas variables que tericamente pueden tomar cualquier valor dentro de un intervalo de valores. Es decir, las variables continuas se miden uniformemente y pueden tomar valores fraccionarios. Ejemplos de variables continuas lo son la estatura, el tiempo realizado en la fabricacin de un artculo, la distancia recorrida por un automvil en la entrega de un cierto producto, la longitud de un trozo de madera

    Adems de la clasificaciones se debe tener en cuenta la escala de medicin utilizada para medir u observar las variables por existen diversos tipos de escalas que se utilizan para clasificar ms detalladamente las variables, se dividen en 4 niveles (nominal, ordinal, intervalo, razn).

    Escala Nominal: clasifica los datos en categoras mutuamente exclusivas. Es una asignacin numrica a atributos sin que exista una relacin de orden o jerarqua

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    8

    entre ellos. Ejemplo: estado civil, nacionalidad, sexo de las personas, material del envase que ms le atrae al consumidor.

    Escala Ordinal: clasifica los datos en categoras que pueden ser jerarquizadas o divididas en rangos, sin embargo no se puede determinar con precisin las diferencias entre rangos. Existe la relacin mayor o menor que entre las categoras de la variable. Ejemplos: el nivel socioeconmico, tamao del producto con mayor consumo, niveles en los puestos de las empresas.

    Escala de Intervalo: en contraste con la ordinal tiene diferencias precisas entre unidades de medida, sin embargo el cero es relativo, esto quiere decir que si en la medida de la variable da cero no hay suficientes argumentos como para garantizar la ausencia del mismo. Ejemplo: escala es la medicin de temperaturas con las escalas Celsius y Fahrenheit.

    Escala de Razn: posee todas las caractersticas de la escala de intervalo y existe un cero absoluto por lo tanto existen razones verdaderas entre diferentes unidades de medida. Ejemplos para esta escala son: el peso, edad, velocidad, una persona con un peso de 120 kg. tiene el doble de peso de una persona con un peso de 60 kg.

    Es importante saber distinguir entre datos cualitativos y cuantitativos porque se usan mtodos estadsticos diferentes para ser analizarlos. Ejercicio. Identifique las variables que investigara en uno de los ejemplos anteriores y el tipo de escala a usar.

    1.3. Matriz de datos y Tabulacin de datos. Usualmente la informacin es presentada en una matriz de datos o planilla de datos Excel donde cada fila representa las mediciones de un individuo u objeto en particular y cada columna representa las variables que estn siendo estudiadas.

    Por ejemplo, los datos correspondientes a una investigacin llevada a cabo para el estudio de los trabajadores de una empresa B&C, produjeron como resultado la matriz de datos de la Tabla 1, en donde se recopilaron las observaciones de las variables "edad", "sexo", "estatura", "peso", antigedad, escolaridad y "estado civil" en los 100 individuos seleccionados en la muestra.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    9

    Tabla 1

    La informacin entregada en la matriz de datos de la tabla 1 es necesario organizarla mediante la tabulacin de datos cuyo objetivo es ordenan y clasificar los datos en cuadros numricos o tablas que implican la agrupacin de las observaciones en categoras o clases, mutuamente excluyentes de acuerdo a caractersticas o atributos previamente definidos. De esta manera la tabulacin de datos permite observar la distribucin de frecuencias de ocurrencia de cada categora o clase. Tener en cuenta que la tabulacin de datos y la descripcin grfica posterior depende del tipo de variable de estudio. Ejercicio: Identifique que matrices de informacin maneja diariamente y qu tipo de tabulaciones realiza con esta informacin.

    1.4. Distribucin de frecuencias y representaciones grficas. La informacin estadstica puede constar de un gran nmero de datos u observaciones, y mientras mayor sea su nmero, mayor es la conveniencia y necesidad de presentarla en forma resumida, con lo cual se pierde algunos detalles, pero en cambio se aprecia mejor la naturaleza general de la informacin. Para tal efecto, primero se deben definir categoras o clases identificando cada dato en alguna de estas categoras. El procedimiento anterior da origen a una agrupacin de los datos que denomina distribucin de frecuencias. Una categora o clase es una particin o subdivisin de todos los valores posibles que tome la variable. La distribucin de frecuencias se resume en una tabla de frecuencias que tiene la siguiente estructura segn si la variable es cualitativa o cuantitativa: Para Variables cualitativas Nominales

    Categora o Clase

    Concepto o atributo

    Frecuencia absoluta

    Frecuencia relativa

    Frecuencia relativa porcentual

    1 c1 n1 f1 f1% 2 c2 n2 f2 f2% : : : : : k ck nk fk fk%

    Tabla 2: Tabla de frecuencias para datos cualitativos

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    10

    Notacin:

    ci : concepto o atributo de la i-sima clase

    ni : nmero de elementos de la i-sima clase se cumple que el total de elementos

    en la muestra es n=

    k

    1i

    in .

    n

    nf ii , se tiene que

    k

    1i

    i .1f

    fi%=100 fi , se tiene que

    k

    1i

    i .100%f

    Ejemplo 1. Los siguientes datos corresponden al sexo de cuarenta nios que asistieron a un centro de salud con problemas respiratorios durante el fin se semana pasado.

    F M M M F F F M F F F M F M M M F M M F

    F F M F F F F M F M F F M M M F F M M M

    SEXO Frecuencia Absoluta

    Frecuencia Relativa

    Frecuencia Relativa Porcentual

    Femenino 21 0,525 52,5%

    Masculino 19 0,475 47,5%

    Total 40

    Esta tabla corresponde a una distribucin de frecuencias de atributos y puede representarse mediante un grfico de barras, el cual corresponde al tipo ms simple de representacin grfica y es usado en variables cualitativas o en variables discretas. Las clases se representan en el eje horizontal y las frecuencias ene el eje vertical. En este tipo de grficos la longitud de cada barra es proporcional a la frecuencia del atributo que representa. Las barras deben ser del mismo ancho y especificadas en forma uniforme. Otro tipo de grfico que se utiliza cuando se desea representar la distribucin de frecuencias de un conjunto de datos muestrales es el grfico circular o de torta (pie-chart). Los siguientes grficos fueron obtenidos con Excel.

    Grfico 1 : Grfico de Barras y Grfico Circular ejemplo1

    Esta misma idea se aplica para representar datos cuantitativos discretos cuando el nmero de valores posibles es pequeo.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    11

    Para variables cualitativas Ordinales

    Tabla 3: Tabla de frecuencias para datos cualitativos ordinales o cuantitativos agrupados en clases individuales.

    Notacin:

    j

    1i

    ij nN

    j

    1i

    ij fF .

    Ejemplo 2: Los siguientes datos corresponden a la calidad de la atencin recibida por los nios segn las madres. B B B B B B B B B B B B B B B B B B B B

    B B B B B M M M M M MB MB MB MB MB MM MM R R R

    Atencin Frecuencia Absoluta

    Frecuencia Relativa

    Frecuencia Relativa Porcentual

    Frecuencia Absoluta Acumulada

    Frecuencia Relativa Acumulada

    Frecuencia Absoluta Acumulada Porcentual

    Muy Mala 2 0,05 5,0% 2 0,05 5,0%

    Mala 5 0,125 12,5% 7 0,175 17,5%

    Regular 3 0,075 7,5% 10 0,25 25,0%

    Buena 25 0,625 62,5% 35 0,875 87,5%

    Muy Buena 5 0,125 12,5% 40 1 100,0%

    Total 40

    Es posible realizar una ordenacin jerarquizada de los valores de la variable y conocer la frecuencia acumulada o porcentual para alguna clase en particular. La grfica siguiente muestra el porcentaje de respuestas segn la calidad atencin recibida por los nios de sus madres.

    Grfico 2: Grfico de Barras y Grfico Circular ejemplo2

    Para variables cuantitativas y discretas

    Categora o Clase

    Concepto o atributo

    Frecuencia absoluta

    Frecuencia relativa

    Frecuencia relativa porcentual

    Frecuencia absoluta acumulada

    Frecuencia relativa acumulada

    Frecuencia relativa acumulada porcentual

    1 c1 n1 f1 f1% N1 F1 F1%

    2 c2 n2 f2 f2% N2 F2 F2% : : : : : : : : k ck nk fk fk% Nk Fk Fk%

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    12

    Cuando el tamao de la muestra y el recorrido de una variable discreta sea grande, o cuando sta sea continua, conviene agrupar en intervalos de clase o grupos.

    Categora o Clase

    Intervalo de Clase

    Frecuencia absoluta

    Marca de clase

    Frecuencia relativa

    Frecuencia relativa porcentual

    Frecuencia absoluta acumulada

    Frecuencia relativa acumulada

    Frecuencia relativa acumulada porcentual

    1 ]L0,L1] n1 m1 f1 f1% N1 F1 F1% 2 ]L1,L2] n2 m2 f2 f2% N2 F2 F2% : : : : : : : : : k ]L-k1,Lk] nk mk fk fk% Nk Fk Fk%

    Tabla 4: Tabla de frecuencias para datos cuantitativos continuos (o discretos cuando el nmero de valores posibles es grande).

    Notacin:

    Li-1 : es el lmite inferior del i-simo intervalo de clase.

    Li : es el lmite superior del i-simo intervalo de clase.

    mi : es la marca de clase del i-simo intervalo de clase y corresponde al punto medio del intervalo de clase.

    Recordar que el nmero de intervalo y la longitud del intervalo se realiza mediante la regla de Sturgers y para generar los intervalos de clase debe calcular el rango y la longitud del intervalo. Excel y otros programas estadsticos realizan esta operacin fcilmente entregando la distribucin de frecuencias Ejemplo: Los siguientes datos representan el nmero de alumnos que asistieron a las 40 sesiones de clculo el semestre anterior. Estos datos han sido ordenados de menor a mayor:

    Procedimiento para obtener tabla de frecuencia Paso 1. Se determina el rango o recorrido de la variable. Rango=Xmax - Xmin Rango = 94 - 31 Paso 2. Se decide el nmero k de clases a considerar. Una regla frecuentemente usada es tomar: k = 1 + 3.3 log(n) Regla de Sturges

    El nmero k = 1+3.3 log(40) = 6.28 7 (Otra forma k n )

    Paso 3. Se obtiene la amplitud o tamao del intervalo, dividiendo por el nmero de

    intervalos:k

    RangoA , se aproxima aumentando y manteniendo el mismo nmero de

    decimales que los datos. A = 31/7 5

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    13

    Paso 4. Se seleccionan los lmites de clase que definen los intervalos, de manera que las clases sean de la misma longitud y cada observacin se clasifique sin ambigedad en una sola clase. Paso 5. Se cuenta el nmero de observaciones en cada clase, es decir se determina las frecuencias de cada clase.

    Clase Intervalos de clase Marca de Clase

    Frecuencia de la clase

    Frecuencia relativa

    Frecuencia absoluta acumulada

    Frecuencia relativa acumulada

    1 ]62.5, 67.5] 65 3 0.075 3 0.075

    2 ]67.5, 72.5] 70 6 0.150 9 0.225

    3 ]72.5, 77.5] 75 11 0.275 20 0.5

    4 ]77.5, 82.5] 80 7 0.175 27 0.675

    5 ]82.5, 87.5] 85 9 0.225 36 0.9

    6 ]87.5, 92.5] 90 3 0.075 39 0.975

    7 ]92.5, 97.5] 95 1 0.025 40 1 Tabla 5: Tabla de frecuencias ejemplo 3

    La representacin grfica ms frecuente para datos agrupados es el histograma, el cual corresponde a un conjunto de rectngulos cada uno de los cuales representa un intervalo de clase. Sus bases son iguales a la amplitud del intervalo y las alturas se determinan de manera que su rea sea proporcional a la frecuencia de cada clase.

    Un til agregado al histograma es el polgono de frecuencias, que se construye uniendo las marcas de clase de los intervalos adyacentes. El polgono de frecuencias se utiliza para observar el comportamiento ms suave de una distribucin de frecuencias para posteriormente decidir cul es el mejor modelo probabilstico posible de ajustar a la muestra. Grfico 3: histograma ejemplo 3

    Una propiedad importante que cumple el polgono de frecuencias es que el rea limitada por el polgono y el eje de las abscisas es igual a la suma de los rectngulos que forman el histograma. Un tercer tipo de grfico es la ojiva que se obtiene graficando la frontera superior de cada intervalo versus la frecuencia acumulada. Este grfico permite visualizar rpidamente las frecuencias acumuladas hasta un valor determinado de la variable. La ojiva permite determinar los percentiles 25, 50 y 75, tambin denominados cuartiles Q1, Q2 y Q3 respectivamente. Adems permite estimar el nmero de observaciones entre dos valores dados. El percentil 50 o cuartil dos, Q2 recibe el nombre de mediana y divide a la distribucin de frecuencias en partes iguales.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    14

    Grfico 4: histograma y polgono sobrepuesto - Frecuencia Acumulada y Ojiva sobrepuesta Ejercicio: Ingrese la informacin anterior en una planilla Excel y realice las tablas y grficos anteriores.

    1.5. Medidas de Resumen

    Llamadas medidas estadsticas o estadgrafos describen y cuantifican en forma resumida las caractersticas de la distribucin de frecuencias de un conjunto de datos de una poblacin o muestra.

    Las medidas de uso ms frecuente son: medidas de tendencia central medidas de dispersin medidas de sesgo o asimetra medidas de apuntamiento o achatamiento (agudeza)

    Medidas de Tendencia Central: Determina un valor caracterstico de una distribucin de frecuencias ubicado hacia el centro de la distribucin estas medidas son media aritmtica, a la mediana o a la moda. Cada una de estas medidas es apropiada para ciertos propsitos descriptivos, pero resulta completamente inadecuada para otros.

    Media aritmtica o media o promedio, es el promedio comn. Se obtiene dividiendo la suma de todas las observaciones por el nmero de ellos.

    Para datos individuales:

    n

    1i

    in21 x

    n

    1

    n

    x...xxx

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    15

    Para datos agrupados en k agrupaciones o intervalos de clase: n

    mn

    x

    k

    1i

    ii

    Notacin:in : frecuencia absoluta clase i - im : Marca de clase i. n tamao de la muestra.

    Nota: Utilizamos la marca de clase el valor aproximado de la media (cuando n es grande la aproximacin es bastante buena).

    Si el polgono de frecuencias presenta la forma de una campana simtrica entonces el

    valor de x est justo en el centro de la distribucin de frecuencias y se dice que este

    valor es el ms representativo de la distribucin por estar equidistante de los extremos.

    Mediana: denotada por Me, corresponde al valor central del conjunto de datos ordenados en forma ascendente o descendente (cuartil dos, Q2, o percentil 50, P50).

    Para datos individuales: Sea x1, x2, ..., xn el conjunto de observaciones, entonces x(1), x(2), ..., x(n) denota al conjunto de datos ordenados en forma ascendente.

    a) Si n es impar se tiene que

    2

    1nxMe

    b) Si n es par se tiene que 2

    xx

    Me1

    2

    n

    2

    n

    Para datos agrupados en clases individuales, se identifica la mediana como aquella clase donde la frecuencia acumulada es inmediatamente mayor que (n+1)/2. Para datos agrupados en intervalos de clase, primero se identifica el intervalo que contiene a la mediana ]Li-1, Li], el cual corresponde al que tiene la frecuencia absoluta acumulada que supera inmediatamente el valor (n+1)/2, entonces:

    1

    12

    i

    i i

    i

    nN

    Me L An

    Notacin

    Li-1 : lmite inferior del intervalo que contiene a la mediana en el cual N i >2

    n.

    n : tamao muestral o cantidad de datos. Ni-1 : frecuencia absoluta acumulada del intervalo anterior al intervalo que contiene a la mediana.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    16

    ni : frecuencia absoluta del intervalo mediano. Ai : amplitud del intervalo "mediano".

    Moda: se define como el valor que aparece con mayor frecuencia (pudiendo no existir). Esta medida es ms representativa que las anteriores cuando la distribucin de frecuencias presenta una forma inestable o sinusoidal (indicando presencia de estratos).

    Para datos agrupados en clases individuales:la moda es el valor con ms alta frecuencia. Para datos agrupados en intervalos de clase. primero se identifica el intervalo que tiene la mayor frecuencia absoluta, ]Li-1, Li], y se determina la moda de la siguiente forma:

    i

    1i1i

    1i1i A

    nn

    nLMo

    Notacin Li-1 : lmite inferior del intervalo que contiene a la moda ni+1 : frecuencia absoluta acumulada del intervalo posterior al intervalo que contiene a la moda. ni-1 : frecuencia absoluta acumulada del intervalo anterior al intervalo que contiene a la moda ni : frecuencia absoluta del intervalo mediano. Ai : amplitud del intervalo "moda". Ejercicio. Obtenga la medidas de tendencia central para los datos del ejemplo 3 usando los datos sin agrupar y los datos agrupados en la tabla. Medidas de Dispersin: Cuantifican la concentracin de los datos en torno a un valor central

    El rango o recorrido: diferencia entre la observacin de mayor valor y la de menor valor.

    La varianza corresponde al promedio de las desviaciones al cuadrado de los datos

    con respecto a la media aritmtica, se denota por V(X) o 2X .

    Para datos poblacionales individuales:

    2 22

    2 11

    ( )nn

    iiii

    x nx

    n n

    .

    Para datos muestrales individuales:

    222

    12 1

    ( )

    1 1

    nn

    iiii

    x nxx x

    sn n

    .

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    17

    Para datos muestrales agrupados en agrupaciones o intervalos de clase:

    2

    22

    12 1

    ( )

    1 1

    kk

    i ii iii

    nm nxm x n

    sn n

    .

    Desviacin estndar corresponde a la raz cuadrada positiva de la varianza y tiene la ventaja de que est en la misma unidad de medida de los datos.

    Para datos poblacionales individuales: 2 .

    Para datos muestrales individuales: 2s s .

    Coeficiente de Variacin. Para comparar el grado de dispersin entre dos o ms distribuciones expresadas en distintas unidades de medida, no podemos comparar simplemente las varianzas y las desviaciones estndar respectivas o las medias. En este caso se define un nuevo estadgrafo de dispersin llamado coeficiente de variacin que est dado por:

    %100x

    sCV XX

    Nota: Solo para valores positivos, asegurarse que la media es positiva.

    Ejercicio. Obtenga la medidas de tendencia dispersin para los datos del ejemplo 3 usando los datos sin agrupar y los datos agrupados en la tabla. Medidas de Posicin: Dividen a la distribucin en un cierto nmero de partes de manera que en cada una de ellas hay la misma frecuencia.

    Cuartiles. Particionan a una distribucin de frecuencias en cuatro partes mediante los puntos Q1, Q2, Q3, llamados primer, segundo y tercer cuartil. Se denomina recorrido intercuartlico a Q = Q3 - Q1 (medida robusta de la dispersin de los datos).

    Deciles. Particionan a una distribucin de frecuencias en diez partes mediante los puntos D1, D2, ..., D9, llamados primer, segundo, ..., noveno decil. Se denomina recorrido interdeclico a D = D9 - D1.

    Percentiles. Particionan a una distribucin de frecuencias en cien partes mediante los puntos P1, P2, ..., P99, llamados primer, segundo , ..., 99

    avo percentil.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    18

    Para datos agrupados en intervalos de clase:

    1

    1

    100i

    r i i

    i

    nrN

    P L An

    Ejercicio. Obtenga apartir de la tabla 3 los cuartiles Q1 =25%, Q2 =50%, Q2 =75% Grfico 5: Grfico de caja permite visualizar los cuartiles y la media y mediana.

    Grfico 6: Resumen de las medidas anteriores

    Medidas de sesgo o asimetra: Indica el grado de simetra de una distribucin de frecuencias con respecto a de una distribucin simtrica unimodal.

    a) Si la distribucin de frecuencias es simtrica, entonces:

    MoMex . b) Si la distribucin de frecuencias presenta asimetra positiva, entonces

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    19

    MoMex c) Si la distribucin de frecuencias presenta asimetra negativa, entonces

    MoMex Medidas de apuntamiento: Mide el grado de apuntamiento de una distribucin de frecuencias con respecto a de una distribucin simtrica unimodal de forma acampanada.

    Ejercicio: Investigue en la internet la importancia y uso de las medida de asimetra y apuntamiento en la administracin de empresas. (Consultar: Modelos de valoracin de activos financieros con riesgo asimtrico)

    2. Variables Aleatorias Para poder emplear la teora de probabilidades para sacar conclusiones precisas acerca de la poblacin, en base de una muestra extrada de esa poblacin primero debemos dirigir nuestra atencin hacia las variables aleatorias que constituyen un eslabn entre la teora de las probabilidades y la inferencia estadstica.

    2.1. Concepto Una variable aleatoria es una variable cuyo valor es el resultado de un evento aleatorio.

    Ejemplo 1: Si se lanza una moneda tres veces y se anota el nmero de caras que se obtienen. Los posibles resultados son: 0 caras, 1 cara, 2 caras 0 3 caras. As la variable aleatoria es el nmero de caras y los posibles resultados son los valores de la variable aleatoria.

    Dado un experimento Dado un experimento aleatorio , el espacio muestral asociado

    a . Una funcin X que asigna a cada elemento en uno y solamente un nmero real

    x = X(), se llama variable aleatoria. Es decir, X es una funcin real, X: IR

    El dominio de la variable aleatoria X es y el rango es un subconjunto de IR que lo denotaremos por RX. El rango RX de la variable aleatoria X est dado por el siguiente conjunto de nmeros reales.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    20

    Consideremos el experimento aleatorio anterior. El espacio muestral est dado por:

    ssscssscssscsccccsccc ,,,,csc,,, .

    Suponga que ahora solo nos interesa el nmero de caras que sale, es decir nuestra variable de inters es X(w): Nmero de caras que aparecen en los tres lanzamientos.

    As vamos a tener que

    X(ccc)=3 X(ccs) = X(csc) = X(scc) =2 X(css) = X(scs) = X(ssc) =1 X(sss)=0

    Evaluamos las probabilidades de los posibles resultados de la variable aleatoria al realizar el experimento.

    8

    1()0(

    83csc,,()1(

    83csc,,()2(

    81()3(

    sssPXP

    sscscsPXP

    sccsccPXP

    cccPXP

    Las variables aleatorias pueden ser discretas o continuas.

    2.2. Variables aleatorias discretas Se llama variable aleatoria discreta si el recorrido o rango de la variable aleatoria X, es un conjunto finito o infinito numerable.

    Ejemplo 2.- La variable del ejemplo 1 es una variable aleatoria discreta, porque su recorrido es un conjunto finito, en efecto es: RX = {0, 1, 2, 3}.

    Propiedades de una variable aleatoria discreta

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    21

    Sea X una variable aleatoria discreta con recorrido RX. Se llama funcin de probabilidad, distribucin de probabilidad (tambin se llama funcin de cuanta) de la variable aleatoria X.

    La funcin definida por:

    )()( xXPxp , que satisface las siguientes condiciones:

    1)();,0)() XRx

    X xpbRxxpa

    El conjunto de pares (x, p(x)), x RX se llama distribucin de probabilidad de X, que se puede representar en forma de tabla o como una expresin matemtica.

    As la distribucin de probabilidad es una lista de todos los resultados posibles de algn experimento y de la probabilidad relacionada con cada resultado.

    Ejemplo 3.- Del ejemplo 1. Hallar la distribucin de probabilidad y grfico de la distribucin de probabilidad de la variable aleatoria X: numero de caras en los tres lanzamientos.

    Solucin:

    x 0 1 2 3

    p(x) = P(X=x) 1/8 3/8 3/8 1/8

    El grfico de la funcin de probabilidad es:

    Un gran nmero de decisiones empresariales depende de la distribucin de probabilidad Ejercicio: Aplique los conceptos anteriores para resolver el siguiente caso: Para recolectar los datos de un proyecto de investigacin, un estudiante de mercadeo en una universidad pequea en el centro de estados unidos cont 50 cursos de negocios el nmero de estudiantes que haban comprado recientemente discos compactos. En 12 clases no encontr estudiantes que hubieran hecho dicha compra, 3 estudiantes haban comprado en 8 clases, 4 haban comprado en 9 clases, 5 en 15 clases y 7 estudiantes, de las seis clases restantes haban aumentado sus colecciones de msica. El estudiante deseaba comenzar su investigacin resumiendo sus datos. Cmo podra usted ayudarle?

    0

    1/8

    1/4

    3/8

    0 1 2 3 4Pro

    ba

    bilid

    ad

    de

    X

    Recorrido de X

    Funcin de probablidad nmero de caras en 3 lanzamiento de

    una moneda

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    22

    Funcin de distribucin acumulada

    La funcin de distribucin acumulativa de la variable aleatoria X es la probabilidad de que X sea menor o igual a un valor especfico de x y est dada por:

    ( ) ( ) ( )i

    i

    x x

    F x p X x p x

    Ejemplo: Hallemos la funcin de distribucin acumulada de la v.a X, cuya informacin de probabilidad es:

    Solucin:

    En general, la funcin de distribucin acumulativa F(x) de una variable aleatoria discreta es una funcin no decreciente de los valores de X, de tal manera que

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    23

    ) 0 ( ) 1,

    ) ( ) ( ),

    ) ( ) 1 ( )

    ) ( ) ( ) ( 1)

    ) ( ) ( ) ( 1)

    i j i j

    i j j i

    a F x x

    b F x F x si x x

    c P X x F x

    d P X x F x F x

    e P x X x F x F x

    Ejemplo 4.- La tabla siguiente muestra la variable aleatoria X, el nmero de personas por da que solicitan un tratamiento innecesario en el servicio de urgencia de un pequeo hospital.

    x 0 1 2 3 4 5

    p(x) 0.01 0.1 0.3 0.4 0.1 ?

    a) Encontrar p(5). Es decir, la probabilidad que el nmero de personas que solicitan tratamiento innecesario en el servicio de urgencia sea de 5 personas.

    b) Determinar la probabilidad que a lo ms dos personas pidan tratamientos innecesarios en un da en el servicio de urgencia.

    c) Determinar la probabilidad que por lo menos dos personas pidan tratamientos innecesarios en un da en el servicio de urgencia.

    d) Determinar la probabilidad que menos de dos personas pidan tratamientos innecesarios en un da en el servicio de urgencia.

    e) Determinar la probabilidad que entre dos y cuatro personas pidan tratamientos innecesarios en un da en el servicio de urgencia.

    Soluciones:

    a) p(5)=0.09, esto es ,ya que para los valores de la variable aleatoria la suma de todas las probabilidades es 1.

    b) P(X2)=P(X=0)+ P(X=1)+ P(X=2)=0.01+0.1+0.3=0.41 c) P(X2)= 1-P(X

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    24

    2) Calcular y representar grficamente la funcin de distribucin acumulada.

    3) Calcular las siguientes probabilidades:

    Esperanza y varianza de una variable aleatoria discreta

    La funcin de probabilidad describe totalmente el comportamiento de la variable aleatoria en el sentido de una poblacin ideal. Al considerar una visin general de la poblacin podemos definir constantes o parmetros asociados a cualquier variable aleatoria. Conocer estos valores numricos permite al investigador una visin mucho ms amplia sobre la naturaleza de las variables. Los parmetros ms

    conocidos son: la media o esperanza o valor esperado o promedio aritmtico, la

    varianza 2 y la desviacin estndar.

    El valor esperado de una variable aleatoria discreta con funcin de probabilidad p(x) se denota y define por:

    XRx

    ii xpxXE )()(

    Nota: Si H(X) es una funcin de la variable aleatoria X, entonces su esperanza est dada por:

    En particular si H(X) = X2 se tiene que:

    XRx

    ii xpxXE )()(22

    La varianza de la poblacin. Se define como:

    2222 )()())(()()( XEXEXEXEXVXVar

    La desviacin estndar de la poblacin, se define como la raz de la varianza, es decir,

    )(XV

    Propiedades de la esperanza y la varianza: Sea x una variable aleatoria discreta

    1) E(aX+b)=a E(x)+b, a y b constantes

    2) Var(ax+b)= a2 Var(x) ,

    Ejemplo: Sea la v.a. X: nmero de paquetes de programas contratado por un cliente seleccionado al azar y consideremos su funcin de probabilidad

    ) ( 5)

    ) ( 3)

    ) (2 5)

    ) (4)

    a p x

    b P X

    c P x

    d F

    ( ( )) ( ) ( )X

    i i

    x R

    E H X H x p x

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    25

    x 1 2 3 4 5

    P(X=x) 0,375 0,275 0,175 0,100 0,075

    Suponga que el costo del servicio (Y) es una funcin nmero de paquetes contratado segn la frmula Y=30(X+1).

    Cul es el nmero esperado de paquetes de programas contrados? Cul es el valor esperado del costo pagado por el cliente?, Cul es la varianza del nmero esperado de paquetes?, Cul es varianza del costo pagado por el cliente?

    Solucin:

    a) Cul es el nmero esperado de paquetes de programas contrados?

    ( ) ( )

    ( ) (1*0,375 2*0,275 3*0,175 4*0,1 5*0,075)

    ( ) 2,225

    X

    i i

    x R

    E X x p x

    E X

    E X

    b) Cul es el valor esperado del costo pagado por el cliente?

    ( ) (30 X 1 )

    ( ) (30 30) 30* ( ) 30

    ( ) 30*2,225 30

    ( ) 97,5

    E Y E

    E Y E X E X

    E Y

    E Y

    c) Cul es la varianza del nmero esperado de paquetes?

    22

    2 2 2 2 2 2

    2

    22

    2

    ( ) ( ) ( )

    ( ) (1 *0,375 2 *0,275 3 *0,175 4 *0,1 5 *0,075)

    ( ) 6,525

    ( ) ( ) ( )

    ( ) 6,525 2,225

    ( ) 1,574

    V X E X E X

    E X

    E X

    V X E X E X

    V X

    V X

    d) Cul es varianza del costo pagado por el cliente?

    ( ) (30 30)

    ( ) 30* ( )

    ( ) 30*1,574

    ( ) 47,22

    V Y V X

    V Y V x

    V Y

    V Y

    Ejercicio: Un distribuidor de aparatos electrodomsticos vende tres modelos diferentes de congeladores verticales con capacidad de 13.5, 15.9 y 19.1 pies cbicos de espacio de

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    26

    almacenaje, respectivamente. Sea X= cantidad de espacio de almacenaje que compra el siguiente cliente. Suponga que X tiene la siguiente funcin de probabilidad.

    X 13.5 15.9 19.1

    P(x) 0.2 0.5 0.3

    a. Calcule E(X), E(X2) y V(X) b. Si el precio de un congelador con capacidad de X pies cbicos es 25X-8.5, Cul es

    el precio esperado que paga el siguiente cliente por un congelador? c. Cul es la varianza del precio 25X-8.5 que paga el siguiente cliente? d. Suponga que si bien la capacidad nominal de un congelador es X, la capacidad real

    es h(X)=X-0.01X2 Cul es la capacidad real esperada del congelador que compra el siguiente cliente?

    2.3. Variable Aleatoria Continua Una variable aleatoria es continua si puede tomar cualquier valor en algn intervalo (o intervalos) del conjunto de los nmeros reales. Las variables aleatorias continuas pueden tomar infinitos valores, resulta imposible enumerarlos todos. Luego necesitamos determinar una expresin que nos permita calcular las probabilidades. As para este caso, nos interesa hallar la probabilidad de la variable aleatoria X que est comprendida en un intervalo concreto o entre determinados valores. El clculo de las probabilidades para una variable aleatoria continua se realiza calculando el rea bajo la curva con el uso de integrales, donde la curva se denomina funcin de densidad.

    Funcin de densidad. Sea X una variable aleatoria continua. La funcin de

    densidad de X es una funcin definidas para todos los nmeros reales tal:

    1. )(0)( negativanoesxf

    2. El rea comprendida entre la grfica de f y el eje de las x es igual a 1.

    3. Para cualquier valor real de los nmeros a y b, )( bXaP viene representada por el rea comprendida entre la grfica de f y las rectas x = a y x = b, y el eje x.

    Nota: En el caso continua la probabilidad punto es cero, esto es, P(X=x)=0

    ( ) ( )

    b

    a

    P a X b f x dx

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    27

    Funcin de distribucin: Como en el caso de la v.a. discreta, la funcin de distribucin proporciona la probabilidad acumulada hasta un determinado valor de la variable, es decir, cumple las siguientes condiciones:

    Nota:

    a) Su valor es cero para todos los puntos situados a la izquierda del menor valor de la variable. b) b) Su valor es 1 para todos los puntos situados a la derecha del mayor valor de la variable.

    Ejemplo: Sea X el tiempo de supervivencia en aos despus de un diagnstico de leucemia. La grfica siguiente muestra la funcin de densidad de X

    a) Determine la probabilidad que el paciente sobreviva menos de 6 meses. b) Cul es la probabilidad que el paciente sobreviva exactamente 6 meses? c) Cul es la probabilidad que el paciente sobreviva entre un y un y medio ao?

    Solucin:

    a) P(X

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    28

    Ejercicio: Si se sabe que el ingreso por ventas en una industria manufacturera, en miles de

    dlares, est dada por la funcin de densidad

    2; 0

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    29

    5) Sea X una variable aleatoria continua con funcin de distribucin

    0 0

    2 1 0

    3 2( )

    1 1(2 1) 1

    3 2

    1 1

    x

    x x

    F x

    x x

    x

    a) Comprobar que F es, realmente, una funcin de distribucin b) Determinar la funcin de densidad de probabilidad de X

    6) Si la ganancia de un contratista en un trabajo de construccin se puede considerar

    como una variable aleatoria continua con funcin de densidad:

    1( 1) 1 5

    ( ) 18

    0 resto

    x xf x

    Donde las unidades estn en millones de pesos.

    a) Calcular la probabilidad que el contratista gane por lo menos 2000000 7) Los obreros de una empresa se acogen a tres categoras salriales: un tercio de

    ellos cobra $150000 al mes, otro tercio $250000 al mes, y el resto $300000 al mes. Por otro lado, los directivos de la empresa tambin se agrupan en tres categoras de igual tamao, con salarios de $270000 al mes, $300000 al mes y 530000 al mes.

    a) Calcular el salario medio de cada grupo (obreros / directivos) b) Qu grupo es ms homogneo en lo que respecta al salario?

    8) Sea X una variable discreta que toma los valores 0, 1, 2 y 3 con probabilidades

    1/125, 12/125, 48/125 y 64/125.

    a) Encontrar E(X) y E(X2).

    b) Utilizar los resultados de a) para obtener 2

    3 2E X

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    30

    3. Distribucin normal

    3.1. Caractersticas de la Distribucin Normal Esta es la distribucin ms importante de la estadstica tambin llamada gaussiana la mayora de los mtodos estadsticos bsicos que estudiaremos se apoyan en la distribucin normal.

    Una variable aleatoria continua, tiene distribucin normal, (X ~ N (,2) ) si su funcin de densidad de probabilidades es :

    0,,2

    1exp

    2

    1)(

    2

    2

    x

    xxf

    El grfico de esta funcin de probabilidad tiene forma de campana, es simtrica con

    respecto a la media , Notacin. Los parmetros 2 corresponden a la media aritmtica y a la varianza de la distribucin normal.

    El rea bajo la curva normal es igual a 1 lo que permite usarla para el clculo de probabilidades. El rea sombreada sobre la curva normal entre dos valores representa la probabilidad de encontrarse en esta zona. Esta probabilidad se obtiene integrando la funcin de densidad f(x) entre los dos valores.

    Regla de la probabilidad normal

    ( ) ( )

    b

    a

    P a X b f x dx

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    31

    Sea X una variable aleatoria normal con media y varianza 2, entonces, a) La probabilidad de que X tome un valor a una distancia mxima de su media de

    una desviacin estndar es 0,68. (P ( - < X < + ) =0,68). b) La probabilidad de que X tome un valor a una distancia mxima de su media de dos

    desviaciones estndar es 0,95. (P ( - 2 < X < + 2) =0,95). c) La probabilidad de que X tome un valor a una distancia mxima de su media de

    tres desviaciones estndar es 0,99. (P ( - 3 < X < + 3) =0,99).

    3.2. Distribucin Normal Estandarizada Obtener las probabilidades integrando la funcin de densidad normal f(x) es una tarea compleja. Sea hace uso de un cambio de variable llamado estandarizacin de la variable como: Esta variable estandarizada Z tiene media 0 y varianza 1, es de decir que la variable z tiene distribucin normal estndar ( Z ~ N (0,1)). La distribucin de una variable aleatoria normal con media 0 y varianza 1 se llama distribucin normal estndar.

    Por lo tanto cuando tenemos una v.a. X que sigue una distribucin normal de media y

    desviacin estndar pasamos a otra variable Z que sigue una distribucin N (0,1) mediante la estandarizacin de la variable. La distribucin normal estndar se encuentra tabulada lo que permiten calcular probabilidades de la distribucin N(0,1).

    3.3. Clculo de Probabilidades

    Si X N( 2), estandarizando Z N( 01),

    FX(x) = P( X x) = ( ) = P(Z ) La tabla el valor de probabilidad a la izquierda del valor z calculado.

    XZ

    XZ

    x

    x

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    32

    Podemos usar la tabla para calcular las probabilidades de intervalos. Por ejemplo:

    1) P(a < Z < b) = (b) - (a)

    2) P( Z > b) = 1- P(Z b) = 1- (b)

    3) Si b > 0, P (Z < -b) = (-b) y P(Z > -b) = 1- (b) Veamos algunos ejemplos usando la tabla Tabla_Normal_Estandar

    ( )a P 0,2z

    0,2 0,2 0,5793P z P z

    ( )b P 1,27z

    1,27 1 1,27 1 0,8980 0,1020P z p z

    ( )c P 0,52 1,03z

    0,52 1,03 1,03 0,52

    1,03 1 0,52

    0,8485 1 0,6985 0,5470

    P z P z P z

    P z P z

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    33

    3.4. Estrategia para resolver y ejercicio resuelto

    1. Reconocer los elementos del enunciado 2. Definir la variable aleatoria 3. Realizar la estandarizacin de la variable con los valores 4. Plantear la probabilidad 5. Dibujar la regin del clculo de la probabilidad.

    Veamos un ejercicio resuelto:

    El plomo, como muchos otros elementos, est presente en el medio natural. La revolucin industrial y la gran cantidad de automviles han incrementado la cantidad de plomo en el medio hasta el punto de que, en algunos individuos, la concentracin de plomo puede alcanzar niveles peligrosos. Sea X la concentracin de plomo en partes por milln en la sangre de un individuo. Supongamos que X tiene distribucin normal con media 0,25 y desviacin estndar 0,11. Una concentracin de 0,6 o ms es considerada extremadamente alta.

    a) Cul es la probabilidad de que si un individuo es seleccionado al azar ste

    pertenezca a la categora extremadamente alta? b) Cul es la probabilidad de que si un individuo es seleccionado al azar tenga una

    concentracin de plomo entre 0,20 y 0,35? c) Cul es la probabilidad de que si un individuo es seleccionado al azar tenga una

    concentracin de plomo de por lo menos 0,45? Solucin:

    X tiene distribucin normal con media 0,25 y desviacin estndar 0,11.

    V.a es X la concentracin de plomo en partes por milln en la sangre de un individuo.

    Una concentracin de 0,6 o ms es considerada extremadamente alta.

    a) P(X>0.6)= 1- P(X 6.0 ) = 1- P(Z 11.0

    25.06.0 )=(3,18)=1

    b) P(0.20 X 0.35) = P(11.0

    25.020.0 Z

    11.0

    25.035.0 )=(0,91) - (-0,45)= 0,8186-

    0,3264=0,4922.

    c) P(X0.45)= 1- P(X 45.0 ) = 1- P(Z 11.0

    25.045.0 )=1-(1,82)=0,9656

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    34

    3.5. Gua de estudio distribucin normal

    1) Un botnico ha observado que el ancho, X, de las hojas del lamo sigue una distribucin normal con media 6 cm, y que el 90% de las hojas tiene un ancho inferior a 7,5 cm. Hallar la probabilidad de que una hoja mida ms de 8 cm.

    2) Las notas obtenidas en un examen por un grupo grande de alumnos se distribuye

    segn una normal de media 5.5 y desviacin tpica 1.2.

    a) Se obtiene A con una nota mayor que 6.2. Qu proporcin de estudiantes reciben A?

    b) Se obtiene B con una nota entre 5.3 y 6.2. Un profesor tiene un grupo de 100 alumnos, que puede verse como una muestra aleatoria del total de los estudiantes. Hallar el nmero esperado de estudiantes de esta clase que obtendrn una B

    c) Se decide reprobar al 5% de estudiantes con notas ms bajas. Cul es la nota mnima necesaria para no reprobar?

    3) En una fbrica de turrn, la cantidad de almendra de una tableta determina su

    calidad:

    Calidad normal: menos de 180 gramos de almendra Calidad extra: entre 180 y 200 gramos de almendra Calidad superior: ms de 200 gramos de almendra.

    Admitiremos que la cantidad de almendra por tableta es una variable aleatoria que sigue una distribucin normal. Adems, sabemos que el 45% de las tabletas son de calidad superior y el 15% de calidad normal. a) Obtener el contenido medio de almendra por tableta b) Obtener la desviacin estndar c) Calcular la probabilidad de que una tableta elegida al azar tenga entre 185 y 205

    gramos de almendra. d) Hallar la probabilidad de que una tableta tomada al azar entre las de calidad

    superior, tenga una cantidad de almendra inferior a 208 gramos. e) Elegimos 150 tabletas al azar (independientemente unas de otras) cul es la

    probabilidad de que al menos 2 tengan una cantidad de almendra inferior a 158 gramos?

    4) Una compaa de alquiler de automviles ha determinado que la probabilidad de

    que un coche necesite una revisin en un mes es de 0,3. La compaa tiene 900 coches. Cul es la probabilidad de que ms de 300 coches necesiten revisin en un mes determinado?

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    35

    5) El peso de un adulto de un cierto mamfero se distribuye segn una variable

    aleatoria normal de media 100 kg y desviacin tpica 8 kg. Cul es la probabilidad de que un adulto escogido al azar pese:

    a) Menos de 90kg b) Entre 95 y 105 kg c) Ms de 110 kg?

    4. Distribuciones Muestrales Generalmente las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Por lo cual es necesario seleccionar una muestra representativa de un tamao manejable. Esta muestra se utiliza luego para sacar conclusiones sobre una poblacin.

    4.1. Estadsticos y Parmetros

    Las caractersticas muestrales denominadas estadsticos se emplean para hacer inferencias con respecto a las caractersticas de la poblacin Parmetros. Papel fundamental de la inferencia estadstica. Una vez obtenida una muestra se obtiene el estadstico que corresponde a una funcin de la muestra. Los estadsticos son variables aleatorias que presentan distribuciones de probabilidad llamadas distribuciones muestrales Los objetos seleccionados generan n nmeros x1, x2, ..., xn que son los valores observados de las variables aleatorias X1, X2, ..., Xn . Supongamos que estudiamos una variable X en una poblacin y sabemos que presenta una distribucin F() , donde es el parmetro de la distribucin y es desconocido. Los problemas de inferencia que pueden darse son: de estimacin, en los que se busca un valor (estimacin puntual) para o un conjunto de valores posibles para el mismo (estimacin por intervalos de confianza), y de pruebas o hiptesis, cuyo objetivo es comprobar si es cierta o falsa cierta hiptesis formulada sobre el parmetro .

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    36

    Si un estadstico lo usamos para estimar un parmetro desconocido de la poblacin (por ejemplo la media , varianza 2, etc.) lo llamaremos estimador de ese parmetro. Al valor que toma una vez observada la muestra se le llama estimacin puntual del parmetro. Para cada parmetro habr que encontrar "el mejor estimador", tratando de cometer en la estimacin el menor error posible. El error de estimacin depende fundamentalmente de la variabilidad poblacional y del tamao de la muestra. Error de muestreo: Diferencia entre el parmetro y el estadstico de la muestra utilizado para estimar el parmetro.

    Los estadsticos de bsicos de inters son: Media muestral Varianza muestral Proporcin muestral Desviacin muestral

    Parmetros Estadsticos o Estadgrafos

    Las distribuciones muestrales que sern usadas son: a) Teorema Central del lmite b) Distribucin Chi. Cuadrado c) Distribucin T- Student

    d) Distribucin F de Snedecor

    1 2 1...

    n

    i

    n i

    XX X X

    Xn n

    2

    2 1

    ( )

    1

    n

    i

    i

    X X

    Sn

    1 2 1...

    n

    i

    n i

    XX X X

    pn n

    2S S

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    37

    Es de bastante utilidad conocer y manejar las distribuciones normales, chi-cuadrado, t-student y F de Snedecor en el estudio muestreo.

    4.2. Tipos de distribuciones muestrales

    a) Teorema Central del Lmite

    El teorema central del lmite, es uno de los conceptos ms importantes en estadstica. Este teorema justifica la importancia de la distribucin normal.

    Teorema central del lmite Sea X1, X2, ,Xn, una sucesin de variables aleatorias

    independientes con E(Xi) = i y varianza V(Xi) = 2

    i (ambos finitos).

    Si Y= X1 + X2 + + Xn=

    n

    ii

    X1

    , entonces bajo ciertas condiciones de generales, la variable

    aleatoria Z definida por

    n

    ii

    n

    i

    n

    iii

    X

    Z

    1

    2

    1 1

    tiene una distribucin aproximadamente normal estndar N(0,1), cuando n es suficientemente grande.

    La variable Y =

    n

    ii

    X1

    puede ser aproximada a la distribucin normal, cualquiera sea la

    distribucin de la Xi.

    Teorema Sean X1, X2, ,Xn, n variables aleatorias independientes idnticamente distribuidas con E(Xi) = y varianza V(Xi) =

    2 (con media y varianza comn y ambas finitas).

    Si Y= X1 + X2 + + Xn=

    n

    ii

    X1

    , entonces la variable aleatoria:

    1

    / /

    n

    i

    i

    X nX

    Zn n

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    38

    Donde n

    X

    X

    n

    ii

    1 ( X se llama media muestral) tiene una distribucin

    aproximadamente normal con media cero y varianza uno (N(0, 1))

    Ejemplo: Las cajas entregadas por una fbrica tienen un peso medio de 300 libras y una desviacin estndar de 50 libras. Cul es la probabilidad de que 25 cajas tomadas al azar y cargadas en un camin exceden de la capacidad especificada del camin, que se sabe es de 8,200 libras? Cul es la probabilidad que el peso promedio de estas 25 cajas sea inferior a 320 libras? Solucin:

    X tiene distribucin normal con media =300 libras y desviacin estndar =50.

    Muestra de cajas n=25

    El peso promedio de las 25 cajas se distribuye normal. ( , / )X N n

    El peso de las 25 cajas tiene distribucin normal. 1

    ( , / )n

    i

    i

    X N n n

    Cul es la probabilidad de que 25 cajas tomadas al azar y cargadas en un camin exceden de la capacidad especificada del camin, que se sabe es de 8,200 libras?

    P (1

    n

    i

    i

    X

    > 8.200) P (8200 25*300

    50 / 25Z

    ) = 1

    Estandarizando Con seguridad al cargar las 25 cajas se exceder la capacidad del camin. Cul es la probabilidad que el peso promedio de estas 25 cajas sea inferior a 320 libras?

    P ( X < 320) P (320 300

    50 / 25Z

    ) = (2) = 0.9772

    Estandarizando Ejercicio: La longitud a que se puede estirar sin ruptura un filamento de Nylon es una variable aleatoria exponencial con media de 5,000 pies. Cul es la probabilidad (aproximada) que la longitud promedio de 100 filamentos este comprendida entre 4,750 y 5,550 pies?

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    39

    a) Distribucin Chi. Cuadrado La distribucin chi-cuadrado se denota X2 es la distribucin muestral de la varianza muestral (S2), es una distribucin sesgada a la derecha. Estimar la varianza poblacional o la desviacin estndar requiere conocer la distribucin

    chi- cuadrado. Si se escoje una muestra de tamao n de una poblacin con varianza 2 , el estadstico X2 tiene distribucin chi-cuadrado con n-1 grados de libertad.

    Los tres elementos principales en esta distribucin son:

    El valor crtico 2X : es el valor que determina una probabilidad a la izquierda

    bajo la curva X2. La probabilidad de cobertura : rea (probabilidad) bajo la curva a la izquierda

    del valor crtico. Grados de libertad (v): indicador de la muestra (v=n-1)

    Para el clculo de probabilidades se hace uso de la tabla de probabilidades para la distribucin chi cuadrado. La tabla contiene dos entradas: Las filas indican las probabilidades de cobertura y las columnas los grados de libertad (v), los valores en el interior corresponden al valor crtico.

    22 2

    12

    ( 1)~ n

    n SX

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    40

    Ejemplo: Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de

    una poblacin normal con varianza ,, tenga una varianza muestral:

    a) Mayor que 9.1

    22

    2

    2 2

    2 2

    2

    2

    ,24

    ( 1) (24)9,1( 9,1) ( )

    6

    (24)9,136,4

    6

    36,4 1 36,4

    36,4 1

    36,4 ?

    n SP S P

    P X P X

    P X P X

    P X

    x

    Visualizando la tabla de valores de probabilidad chi- cuadrado para v= 24 grados de

    libertad y valor crtico 2X = 36,4, la probabilidad a la izquierda de este valor es = 0,95

    Por lo tanto

    2

    2

    36,4 1 0,95

    36,4 0,05

    P X

    P X

    Ejercicio: Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones,

    de una poblacin normal con varianza , tenga una varianza muestral:

    b) Entre 3.462 y 10.745 Recuerde que: P(a < x < b) = P(x

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    41

    Estimar la media muestral apartir de una poblacin normal cuando la muestra es pequea requiere conocer la distribucin t. Si se escoge una muestra de tamao n (pequea) de

    una poblacin normal con media y varianza 2 , el estadstico t tiene distribucin t student con n-1 grados de libertad.

    La distribucin t difiere de la normal estndar en que la varianza de t depende del tamao de la muestra y siempre es mayor a uno. Estas distribuciones sern las mismas cuando el tamao de la muestra tiende a infinito.

    Los tres elementos principales en esta distribucin son:

    El valor crtico ( t ): es el valor que determina una probabilidad a la izquierda

    bajo la curva t. La probabilidad de cobertura ( ): rea (probabilidad) bajo la curva a la izquierda

    del valor crtico. Grados de libertad (v): indicador de la muestra (v=n-1)

    Para el clculo de probabilidades se hace uso de la tabla de probabilidades para la distribucin t- student. La tabla contiene dos entradas: Las filas indican las probabilidades de cobertura y las columnas los grados de libertad (v), los valores en el interior corresponden al valor crtico. Es importante destacar que como t es simtrica alrededor de una media de cero, se tiene

    que 1t t ; as, el valor t que deja un rea (probabilidad) de 1 a la derecha y por

    tanto un rea de a la izquierda, es igual al valor t negativo que deja un rea de en la cola derecha de la distribucin. Esto es, t0.95 = -t0.05, t0.99=-t0.01. Ejemplo: Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto proceso en lotes es 500 gramos por milmetro de materia prima. Para verificar esta

    1~ nx

    t ts

    n

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    42

    afirmacin toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre t0.05 y t0.05, queda satisfecho con su afirmacin. Qu conclusin extraera de una muestra que tiene una media de 518 gramos por milmetro y una desviacin estndar de 40 gramos? Suponga que la distribucin de rendimientos es aproximadamente normal.

    Solucin:

    De la tabla buscamos t0.05 =t0, 95 con 24 grados de libertad es de 1.711. De esta forma el fabricante queda satisfecho si de una muestra de 25 lotes el valor t se encuentra entre 1.711 y 1.711.

    Se procede a calcular el valor de t:

    518 5002.25

    4025

    xt

    sn

    Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De aqu que es probable que el fabricante concluya que el proceso produce un mejor producto del que piensa.

    Ejercicios

    1) Una compaa manufacturera afirma que las bateras que utiliza en sus juegos electrnicos duran un promedio de 30 horas. Para mantener este promedio, se prueban 16 bateras cada mes. Si el valor t que se calcula cae entre t0.025 y t0.025, la compaa queda satisfecha con su afirmacin. Qu conclusiones debera obtener la empresa de una muestra que tiene una media de 27,5 horas y una desviacin estndar de 5 horas. Suponga que la distribucin de las duraciones de las bateras es aproximadamente normal.

    2) Un fabricante de cierta marca de barras de cereal bajo en grasa afirma que su contenido promedio de grasa saturada es 0.5 gramos. En una muestra aleatoria de 8 barras de cereal de esta marca, el contenido de grasa saturada fue 0,6; 0,7; 0,7; 0,3; 0,4; 0,5; 0,4 y 0,2.

    Estara de acuerdo con la afirmacin? Suponga una distribucin normal?

    c) Distribucin F

    La distribucin F se define como la razn de dos variables aleatorias chi - cuadradas, dividida cada una entre sus grados de libertad.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    43

    Caractersticas

    La variable aleatoria F es no negativa, es decir, los valores que asume la variable F no son negativos

    La distribucin es sesgada hacia la derecha.

    La distribucin F tiene una apariencia muy similar a la distribucin chi-cuadrada; sin embargo, se encuentra centrada respecto a 1.

    Presenta dos parmetros dados por los grados de libertad lo cuales proporcionan una flexibilidad adicional con respecto a la forma de la distribucin.

    La distribucin F nos permite comparar las varianzas de dos poblaciones utilizando las varianzas muestrales de estas.

    Sean 21S y

    2

    2S las varianzas muestrales de dos muestras independientes de tamao n1 , n2

    tomadas de poblaciones normales 21 y

    2

    2 .

    El estadstico F tiene distribucin F con v1 y v2 grados de libertad.

    Los tres elementos principales en esta distribucin son:

    El valor crtico 1 2,

    (1 )v vF : es el valor que determina una probabilidad a la

    izquierda bajo la curva X2. La probabilidad de cobertura (1 ) : rea (probabilidad) bajo la curva a la

    izquierda del valor crtico. Grados de libertad ( v1 , v2 ): indicador de las dos muestras ( v1 =n1 - 1 ,

    v2 = n2 1)

    1 2

    2

    12

    1,2

    22

    2

    (1 )v v

    S

    F FS

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    44

    Para el clculo de probabilidades se hace uso de la tabla de probabilidades para la distribucin F para distintos valores de 0,9;0,95;0,975;0,99;0,995.

    La tabla contiene dos entradas: Las filas indican los grados de libertad v1, las columnas indican los grados de libertad v2, los valores en el interior corresponden a las

    probabilidades coberturas a la derecha valor crtico 1 2,

    (1 )v vF .

    Ejemplo: Encuentre el valor de F para cada uno de los siguientes casos:

    a. El rea (probabilidad) a la derecha de F, es de 0.25 con n1=5 y n2=10. b. El rea (probabilidad) a la izquierda de F, es de 0.95 con n1=16 y n2=11.

    Ejemplo: Sean s12 y s2

    2 las varianzas muestrales de muestras aleatorias independientes de tamaos n1=10 y n2 =20, tomadas de poblaciones normales que poseen las mismas

    varianzas, encuentre P (s12/s2

    2 2.42).

    Ejercicio: Encuentre el valor de F para cada uno de los siguientes casos:

    a. El rea (probabilidad) a la derecha de F es de 0.95 con n1=7 y n2=9. b. El rea (probabilidad) a la izquierda de F, es de 0.10 con con n1=26 y n2 =32

    Ejercicio: Sean s12 y s2

    2 las varianzas muestrales de muestras aleatorias independientes de tamaos n1=25 y n2 =31, tomadas de poblaciones normales con varianzas 1

    2 =10 y 2

    2 = 15, respectivamente, encuentre P (s12/s2

    2 > 1.26).(3)

    A partir de las distribuciones muestrales ser posible realizar inferencias para los siguientes estadsticos al abordar el tema de intervalos de confianza.

    Media muestral Varianza muestral Proporcin muestral Diferencia de medias muestrales Cociente de Varianzas muestrales Diferencia de Proporciones muestrales

    4.3. Distribuciones muestrales de los estadsticos

    Media muestral

    Sea X1, ..., Xn una muestra aleatoria simple (m.a.s.) de una poblacin X con E(X) = y V ar(X) = 2. Se puede probar que la esperanza de la media muestral est dada por:

    )(XE y su varianza est dada por: n

    XV2

    )(

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    45

    Recordemos que: El Teorema Central del Lmite establece que:

    ncuando

    nN

    n

    XX

    n

    ii

    ),(~2

    1

    Por lo tanto Sea X1, ..., Xn una m.a.s. de una poblacin X con distribucin N (, ). Entonces,

    La media muestral se distribuye normal con media y varianza 2

    n

    .

    Varianza muestral

    Sea X1, ..., Xn una m.a.s. de una poblacin X con E(X) = y Var(X) = 2.

    Sea X1, ..., Xn una m.a.s. de una poblacin X con distribucin N (,

    2). Entonces:

    y 2SyX son independientes.

    (3) http://www4.ujaen.es/~dmontoro/Metodos/Temas/Tema6.pdf

    Por lo tanto el cuociente 2

    2

    ( 1)n S

    se distribuye Chi- cuadrado con n-1 grados de

    libertad.

    Proporcin muestral

    Sea X1, ..., Xn una m.a.s. de una poblacin X. Sea p la proporcin de inviduos en la

    poblacin que presentan una determinada caracterstica, y p la proporcin muestral.

    )1,0(~)1(

    ))1(

    ,(~

    N

    n

    pp

    ppZ

    n

    pppNp

    Nota: El nmero de individuos que presentan la caracterstica en la muestra sigue una distribucin Binomial B(n, p), que con n suficientemente grande se puede aproximar a una

    2

    1 ~ ( , )

    n

    i

    i

    X

    X Nn n

    22 2

    12

    ( 1)~ n

    n SX

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    46

    N (np, np(1 - p)). Por lo tanto, la proporcin muestral sigue tambin una distribucin Normal con los parmetros arriba indicados.

    Diferencia de medias muestrales

    Sea X1, ..., Xn1 una m.a.s de una poblacin X, e Y1, ..., Yn2 una m.a.s. de una poblacin Y. Suponemos que las poblaciones X e Y son independientes y con distribuciones normales N

    (1,2

    1 ) y N(2,

    2

    2 ) respectivamente.

    Se pueden presentar los siguientes casos:

    (a) 2

    2

    2

    1 y conocidas:

    ),(~2

    2

    2

    1

    2

    1

    21nn

    NYX

    o equivalentemente

    )1,0(~)()(

    2

    2

    2

    1

    2

    1

    2121 N

    nn

    XXZ

    (b) 22

    2

    2

    1 desconocidas:

    1

    21

    2121 ~11

    )(

    n

    c

    t

    nnS

    XXT

    donde

    2

    )1()1(

    21

    222

    2112

    nn

    SnSnSc

    Cociente de varianzas muestrales

    Sea X1, ..., Xn1 una m.a.s de una poblacin X, e Y1, ..., Yn2 una m.a.s. de una poblacin Y. Suponemos que las poblaciones X e Y son independientes y con distribuciones normales N

    (1,2

    1 ) y N(2,

    2

    2 ) respectivamente. Entonces,

    1,1

    2

    2

    2

    2

    1

    2

    12~

    nn

    Y

    X

    FS

    S

    F

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    47

    Diferencia de proporciones muestrales

    Sea X1, ..., Xn1 una m.a.s de una poblacin X, e Y1, ..., Yn2 una m.a.s. de una poblacin Y. Suponemos que las poblaciones X e Y son independientes. Denotamos por p1 y p2 las

    proporciones poblacionales y por 21, pp las correspondientes proporciones

    muestrales.

    )1,0(~)1()1(

    )(

    2

    22

    1

    11

    2121 N

    n

    pp

    n

    pp

    ppppZ

    Utilizaremos las distribuciones muestrales anteriores en el clculo de probabilidades en los siguientes ejercicios. 5. Estimacin de parmetros

    5.1. Introduccin

    Consideremos una v.a X con distribucin F con desconocido. En este tema vemos cmo dar una estimacin puntual para el parmetro y cmo construir un intervalo de confianza para el mismo, dos formas segn se coment de estimar el parmetro.

    5.2. Estimacin puntual

    Sea X una variable poblacional continua con funcin de densidad de probabilidad

    f(x; 1,..., k), siendo i parmetros desconocido o una variable aleatoria discreta con

    funcin de probabilidad p(x; 1, ..., k), siendo i parmetros desconocidos. El problema de estimacin puntual consiste en, seleccionada una muestra X1, ..., Xn, encontrar el estadstico T (X1, ..., Xn) que mejor estime el o los parmetro i. Una vez observada o realizada la muestra, con valores x1, ..., xn, se obtiene la estimacin puntual

    de , T (x1, ..., xn) = . Vemos a continuacin dos mtodos para obtener la estimacin puntual de un parmetro: mtodo de los momentos y mtodo de mxima verosimilitud.

    5.3. Mtodos de estimacin puntual

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    48

    Mtodo de los momentos: consiste en igualar momentos poblacionales a momentos muestrales. Deberemos tener tantas igualdades como parmetros a estimar.

    Un momento poblacional de orden r esta dado por krr

    ...,,1),E(X r

    Momento muestral de orden r krn

    xM

    r

    i

    r

    i

    r...,,1,1

    rr M

    Mtodo de mxima verosimilitud: consiste en tomar como valor del parmetro

    aquel que maximice la probabilidad de que ocurra la muestra observada.

    Si X una variable poblacional continua con funcin de densidad de probabilidad f(x; 1,

    ..., k), siendo i parmetros desconocido o una variable aleatoria discreta con funcin de

    probabilidad p(x; 1, ..., k), siendo i parmetros desconocido. Sea X1, ..., Xn una muestra seleccionada de de una v.a. X, y sean x1, ..., xn los valores observados de la muestra. La funcin de verosimilitud de la muestra se define as:

    );(

    );(*...*);(),...,;(),...,;(

    1

    111

    n

    ii

    nnn

    xf

    xfxfxxfxxL

    A ),...,;( 1 nxxL se le llama funcin de verosimilitud.

    Buscamos entonces el valor de que maximice la funcin de verosimilitud, y al valor obtenido se le llama estimacin por mxima verosimilitud de .

    5.4. Propiedades de los estimadores puntuales

    Insesgamiento: Se dice que el estadstico muestral es un estimador insesgado del parmetro poblacional, si el valor esperado del estadstico muestral es igual al parmetro poblacional estudiado.

    El estadstico muestral es un estimador insesgado del parmetro poblacional de si:

    ( )E , donde ( )E es el valor esperado del estadstico muestral .

    La figura siguiente muestra la diferencia entre un estimador sesgado y uno insesgado.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    49

    Consistencia: Un estimador puntual es consistente si el valor del estimador puntual tiende a estar ms cerca del parmetro poblacional a medida que el tamao de la muestra aumenta, es decir, que una muestra grande tiende a proporcionar un mejor estimador puntual que una muestra pequea.

    La figura siguiente muestra la diferencia entre dos distribuciones muestrales,

    visualizando el apuntamiento de la distribucin muestral de 1 , vemos que este estimador es mas consistente.

    Eficiencia: Sean dos muestras aleatorias simples de tamao n de manera que se obtienen dos estimador puntuales insesgados de un mismo parmetro poblacional. Se dice que un estimador puntual que presenta menor error

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    50

    estndar tiene mayor eficiencia relativa. Un estimador es eficiente con respecto a otro si presente menor error estndar.

    Suficiencia: La idea intuitiva de estadstico suciente sugiere eliminar de la muestra aquellos elementos que no sean informativos respecto de cierto parmetro.

    5.5. Estadsticos de orden y sus propiedades

    Estadsticos conocidos como ordinales, el objetivo principal de los estadsticos de orden es ordenar los datos que sern utilizados dentro de un experimento en base a determinados criterios de orden (Creciente o decreciente). Se utilizan para las pruebas de rango multiple para ordenar las muestras aleatorias de diversas poblaciones.

    5.6. Estimacin por intervalos de confianza Los intervalos de confianza son instrumentos estadsticos que sirven para medir la incertidumbre de un parmetro. En lugar de dar una estimacin puntual para el parmetro buscamos ahora un intervalo [1(x1, ..., xn), 2(x1, ..., xn)] que contenga al parmetro con una alta probabilidad. Esta probabilidad recibe el nombre de nivel de confianza del intervalo, se denota por (1 - ) y la fija el investigador.

    Construccin de un intervalo de confianza (I.C)

    Sea X ~ F , con desconocido. Una variable aleatoria con una distribucin de probabilidad especfica y un parmetro desconocido. Seguimos los siguientes pasos para construir un I.C. para :

    1. Seleccionamos una m.a.s. X1, ..., Xn. 2. Buscamos un estadstico que incluya el parmetro a estimar y que tenga

    distribucin conocida. (distribuciones muestrales de los estadsticos) 3. Fijamos el nivel de confianza (1 - ). 4. Encontramos 1(x1, ..., xn) y 2(x1, ..., xn) tal que:

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    51

    5. P (1(x1, ..., xn) 2(x1, ..., xn)) 1 6. Diremos entonces que [1(x1, ..., xn), 2(x1, ..., xn)] es un I.C. para al (1 - )100% de

    confianza. Eso significa que de cada 100 intervalos que pudieran obtenerse (segn distintas muestras que pudieran haber sido seleccionadas al azar), (1 - )100% contendran el verdadero valor del parmetro .

    Ejemplo: Construimos un I.C. al (1 - )100% de confianza para la media de una normal

    con varianza conocida 20 .

    n

    XZ

    0

    P (-z1-/2

    n

    X

    0

    z1-/2) = 1-

    1)( 2/12/1n

    zXn

    zXP

    El Intervalo para al (1 - ) 100% de confianza es entonces

    n

    zXn

    zX

    2/12/1

    ,

    Observaciones: - El intervalo depende de la muestra seleccionada - La amplitud del intervalo mide la precisin de la estimacin. Concretamente, el error

    cometido en la estimacin de por x viene dado por e = X es menor o igual que

    nz 02/1

    con una probabilidad (1 - ).

    Luego para el caso anterior.

    nze

    2/1

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    52

    2

    2/1*

    e

    zn

    A mayor tamao muestral n, menor amplitud, y por lo tanto mayor precisin en la estimacin. Por otro lado, cuanto mayor es el nivel de confianza, mayor es la amplitud del intervalo. Ejemplo: Supongamos que llevan a cabo pruebas de la resistencia a la tensin de una clase de largueros de aluminio utilizado en la fabricacin de alas de aeroplanos. De la experiencia se considera una desviacin estndar de 1 kg/mm2. Una muestra de 10 largueros proporciona una resistencia promedio de 87.6 kg/mm2. Vamos a obtener un I.C. al 95% de confianza para la resistencia promedio de esta clase de largueros. Solucin

    X = Resistencia a la tensin ~ N (, 1)

    Sabemos que el I.C. al (1 -)100% es n

    zxn

    zx

    2/12/1 ,[

    En este caso, el nivel de confianza es del 95%, por lo que (1 - ) = 0,95 y = 0,05. El intervalo es por lo tanto:

    10

    196.16.87 = [86.98, 88.22]

    5.7. Intervalo de confianza para medias, varianzas y proporciones

    Intervalo de confianza para la media de una distribucin normal

    Sea X1, ..., Xn una m.a.s. de X ~ N (,

    2).

    Varianza conocida 2

    nzx

    nzx

    2/12/1 ,[

    Varianza desconocida

    n

    Stx

    n

    Stx nn 1,2/11,2/1 ,

    Intervalo de confianza para la varianza de una normal

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    53

    Sea X1, ..., Xn una m.a.s. de X ~ N (, 2).

    212

    2

    ~*)1(

    nSn

    X

    2

    2/,1

    2

    2

    2/1,1

    2

    2 *)1(,*)1(

    nn

    SnSn

    Ejemplo: Un ingeniero de control de la calidad midi el espesor de la pared de 20 botellas de vidrio de 2 litros. La media muestral result 4.05 mm y la desviacin estndar 0.08 mm. Obtenga un intervalo de confianza al 90% para la variabilidad del espesor de la pared de las botellas. X = Espesor ~ N (, 2), con , desconocidas

    Soluc: 2 [0,005, 0,015]

    Intervalo de confianza para la diferencia de medias de dos poblaciones normales e independientes

    Sean X1, ..., Xn1 una m.a.s. de X ~ N (1, 2

    1 ) y Y1, ..., Yn2 una m.a.s. de Y ~ N (2, 2

    2 ),

    independientes.

    )1,0(~)(

    ),(~

    2

    2

    2

    1

    2

    1

    2121

    2

    2

    2

    1

    2

    12121

    N

    nn

    XXZ

    aequivalequelo

    nnNXX

    Se tiene que: Si las varianzas son conocidas:

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    54

    )1,0(~)(

    ),(~

    2

    2

    2

    1

    2

    1

    2121

    2

    2

    2

    1

    2

    12121

    N

    nn

    XXZ

    aequivalequelo

    nnNXX

    Si las varianzas son desconocidas se cumple que:

    21

    2121

    11

    )(

    nnS

    XXT

    c

    Los intervalos de confianza para la diferencia de medias: Varianzas conocidas

    2

    2

    2

    1

    2

    12/12121 )(

    nnzXX

    Varianzas desconocidas pero iguales

    21

    2,2/12121

    11)

    21 nnStXX cnn

    Ejemplo: El hundimiento de un petrolero en las proximidades de la costa de una determinada regin ha provocado un gran desastre tanto econmico como ecolgico. Con el fin de analizar la composicin del fuel que desprende el buque, han sido seleccionadas 17 galletas de chapapote a las cuales se les mide la concentracin de zinc, obtenindose un promedio 140 mg/l, con una desviacin estndar de 30 mg/l. (a) Obtenga un intervalo de confianza al 95% para la concentracin media de zinc en el fuel que desprende el petrolero. X = Composicin de cinc ~ N (, 2), con , 2 desconocidas

    Solucin: [124,575, 155,425] (b) Qu ocurrira al incrementar el tamao de la muestra?. Razona la respuesta.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    55

    Solucin: Al incrementar el tamao de la muestra, se reduce el error de estimacin de la media

    Intervalo de confianza para el cociente de varianzas de dos poblaciones normales e independientes

    Sean ~ N (1, 2

    1 ) y ~ N (2, 2

    2 ), independientes. Suponemos que las poblaciones X e Y

    son independientes y con distribuciones normales N (1,2

    1 ) y N(2,

    2

    2 )

    respectivamente y sean X1, ..., Xn1 una m.a.s. de X y Y1, ..., Yn2 una m.a.s. de Y . Entonces,

    1,1

    2

    2

    2

    2

    1

    2

    12~ nn

    Y

    X

    FS

    S

    F

    1,12/12

    2

    1,12/2

    2

    2

    2

    2

    1

    22,,, nn

    Y

    Xnn

    Y

    X fS

    Sf

    S

    S

    Ejemplo: Se piensa que la concentracin del ingrediente activo de un detergente lquido para ropa est afectada por el tipo de catalizador utilizado en el proceso de fabricacin. Por experiencias anteriores se supone que la desviacin estndar de la concentracin activa es de 3 g/l, sin importar el tipo de catalizador utilizado. Se toman 10 observaciones con cada catalizador y se obtienen los siguientes datos:

    Cat.1 57.9 66.2 65.4 65.4 65.2 62.6 67.6 63.7 67.2 71 Cat.2 66.4 71.7 70.3 69.3 64.8 69.6 68.6 69.4 65.3 68.8

    (a) Obtenga un intervalo de confianza al 90% para el cociente de varianzas?. Puede

    suponerse la misma variabilidad en la concentracin con el empleo de ambos catalizadores?.

    X = Concentracin con catalizador 1 ~ N (1, 12)

    Y = Concentracin con catalizador 2 ~ N (2, 22),

    Son independientes y todos los parmetros se desconocen.

    Solucin: [0,116, 1,180].

    Al estar el 1 contenido en el intervalo, las varianzas podran considerarse iguales.

  • ESTADISTICAS DE MERCADO MANUAL DE ESTUDIO- MODULO I

    56

    (b) Obtenga un intervalo de confianza al 95% para la diferencia en la concentracin activa

    bajo la presencia de ambos catalizadores. Depende la concentracin activa del catalizador?.

    Solucin: [6,061; 0,379]

    Intervalo de confianza para una proporcin

    Sea X1, ..., Xn una m.a.s. de X ~ Bernoulli(p). Para muestras grandes, la proporcin muestral

    muestraladetamao

    ticacaracterslaconmuestralaenobjetosdenmerop

    Tiene una distribucin aproximadamente normal con media p y varianza p(1-p)/n.

    )1,0(~)1(

    ))1(

    ,(~

    N

    n

    pp

    ppZ

    n

    pppNp

    Luego un intervalo de confianza para p esta dado por:

    n

    ppzp

    n

    ppzp