Apuntes de apoyo de “Estadística Descriptiva”
description
Transcript of Apuntes de apoyo de “Estadística Descriptiva”
Apuntes de apoyo de“Estadística Descriptiva”
Martínez Stone Claudia Montserrat
Origen de la Estadística
En su origen, la estadística surge como una disciplina enfocada a conocer los
recursos del Estado mediante su cuantificación, de ahí su nombre.
Posteriormente con la diversificación de sus aplicaciones, se dio por llamar
estadísticas a las tablas en las que se codifica la información, extendiéndose
este nombre a la disciplina en general de recopilar, ordenar, analizar e interpretar
información cuantitativa.
Definiciones de Estadística
Noreau de Jonneis (1847).- "La Estadística es la ciencia de los hechos sociales, expresados en términos numéricos".
Romelín (1863).-"La Estadística describe las características de la sociedad humana a base de observaciones metodológicas y de enumeraciones de fenómenos similares".
Arthur Bowley (1901).- "La Estadística es la ciencia de los promedios, la ciencia de los grandes números".
Mason y Lind (1998).- “Ciencia que trata de la recopilación, organización, presentación, análisis e interpretación de datos numéricos (Estadísticas) con el fin de realizar una toma de decisiones más efectiva”
Definiciones de Estadística
Método Estadístico
• Identificación y definición del problema.
• Formulación de objetivos e hipótesis.
• Recopilación de la información.• Organización y aplicación de las
herramientas estadísticas.• Análisis e interpretación.• Conclusiones.• Toma de decisiones.
Descriptiva, estudia poblaciones totales que describe a través de medidas que la resumen llamadas parámetros:
• Medidas de tendencia central• Medidas de Posición• Medidas de dispersión• Asimetría• KurtosisInferencial, estudia una muestra de la
población que analiza exhaustivamente, y a partir de ella infiere lo que sucede en la población a través de los estimadores de los parámetros (estadísticos) que la describen:
• Probabilidad• Muestreo• Estimación• Pruebas de Hipótesis
Muestra, parte representativa de la población, o un subconjunto de ella
Población, se refiere a una totalidad, es decir, al conjunto de todos los elementos que la conforman, o, a todos los valores que puede tomar la variable en estudio
VARIABLEElemento de interés que puede
tomar valores diferentes.
Cuantitativa; es aquella cuyos valores se pueden expresar como cantidades numéricas
Cualitativa; solo puede clasificarse pero no medirse, no proporciona información cuantificable, se refiere solamente a las características de la variable
VARIABLESCUANTITATIVAS
Discretas, solo pueden asumir ciertos valores que se caracterizan por ser enteros, finitos y positivos
Continuas, pueden asumir cualquier valor dentro de un cierto intervalo, caracterizándose porque pueden ser decimales e infinitas
EJEMPLOS DE VARIABLES
DISCRETAS
Número de autos vendidos en un mes por una agencia.
Número de cuadernos utilizados al semestre por un estudiante.
Número de puntos anotados en un juego de baloncesto.
Número de personas que asisten cada semana a los servicios religiosos de cierto templo.
CONTINUAS
Precio de una acción en una muestra de varios días.
Peso de cajas de fruta empacadas para su exportación.
Velocidad de un automóvil en ciertos tramos de una carretera.
El tiempo de duración de 5,000 lámparas incandescentes.
SERIES DE TIEMPO:Aquellas cuya información muestra un orden cronológico o una evolución temporal de la variable.
SERIES DE CORTE TRANSVERSAL:Aquellas cuya información se toma en un mismo momento del tiempo entre diferentes miembros de una población o lugares.
VARIABLES CUANTITATIVAS
SERIE ESTADÍSTICA
Conjunto de datos ordenados que miden los cambios en una variable, ya sea de manera
cronológica o transversal
SERIE SIMPLE SERIE DE
FRECUENCIAS
SERIE DE CLASES Y FRECUENCIAS O DE DATOS AGRUPADOS
Serie Simple
Como su nombre lo indica, es la más sencilla, y se define como:
“Conjunto de datos ordenadosde manera ascendente o
descendente, que miden lasvariaciones de un fenómeno
o variable”
Serie o Distribución de Frecuencias
Frecuencia, es el número de veces que un término o valor que adopta una variable se repite o existe en una
serie estadística; se representa como y ó f.
“CONJUNTO DE DATOS ORDENADOS QUEMIDEN LOS CAMBIOS EN UN
FENÓMENO O VARIABLE,RELACIONÁNDOLOS O PONDERÁNDOLOS
CON SU FRECUENCIA”
Clase, es un subconjunto de algunas observaciones de la variable, cercanos unos a otros, de acuerdo con sus características.
Intervalo de clases, es el rango de valores encontrados dentro de una clase.
“CONJUNTO DE DATOS ORDENADOS,AGRUPADOS EN SUBCONJUNTOS QUEMIDEN LOS CAMBIOS DEL FENÓMENO
O VARIABLE Y RELACIONÁNDOLOS CONSU FRECUENCIA”
SERIE DE CLASES Y FRECUENCIAS
Intervalo de Clase1. Buscamos el valor más pequeño o el
primer valor en una serie ordenada previamente (frontera inferior) y el valor más grande (frontera superior).
2. Calculamos el rango o recorrido de la serie (Rango = F. Sup. – F. Inf.).
3. Dividimos el rango entre el número de clases que se desea tener.
Intervalo de clase = Rango
Número de clases que se desean
EJEMPLO:
Los siguientes datos se refieren a la duración en horas de 40 focos tomados por el departamento de control de calidad de su fábrica.
54 78 96 78 96 73 90 78 73 107 83 66 83 73 66 78 73 62 73 73 66 73 62 90 83 54 83 66 96 66 78 90 78 83 73 78 73 83 78 62
Serie Simple
n xi n xi n xi n xi1 54 11 73 21 78 31 832 54 12 73 22 78 32 833 62 13 73 23 78 33 834 62 14 73 24 78 34 905 62 15 73 25 78 35 906 66 16 73 26 78 36 907 66 17 73 27 78 37 968 66 18 73 28 83 38 969 66 19 73 29 83 39 96
10 66 20 78 30 83 40 107
xi y yac yrel. %54 2 2 2/40=0.050 5.062 3 5 3/40=0.075 7.566 5 10 5/40=0.125 12.573 9 19 9/40=0.225 22.578 8 27 8/40=0.200 20.083 6 33 6/40=0.150 15.090 3 36 3/40=0.075 7.596 3 39 3/40=0.075 7.5
107 1 40 1/40=0.025 2.5SUMA 40 40/40=1.00 100.0
SERIE O DISTRIBUCIÓN DE FRECUENCIAS
clasessredondeamon 63246.640
83.8653
65354107....
deseansequeclasesdeNúmero
RangoclasedeIntervalo
clasesIFSFRango
Serie de clases y Frecuencias
xi y De 54 a 62.82 5
De 62.83 a 71.66 5 De 71.67 a 80.49 17 De 80.50 a 89.32 6 De 89.33 a 98.16 6 De 98.17 a107.00 1
40
Serie de Clases y Frecuencias
Ejercicios de Aplicación• 1.- Elaboración de ejercicios que impliquen la representación en Series de los datos:
– a.1. Los siguientes, son los números de videocámaras producidas durante 50 turnos de 8 horas seleccionadas al azar.
– a.2. Un Banco, esta estudiando el número de veces que es utilizado por día un cajero automático localizado en un supermercado. A continuación se indica los números de veces que el aparato se empleo en los últimos 30 días
348 371 360 369 376 397 368 361 374 410 374 377 335 356 322 344 399 362 384 368 380 349 358 343 432 376 347 385 399 400 359 329 370 398 358 396 366 392 375 379 389 390 386 341 351 354 395 338 390 333
83 64 84 76 84 54 75 59 70 61 63 80 84 73 68 52 65 90 52 77 95 36 78 61 59 84 95 47 87 60
Representación Gráfica
• Nos permite observar rápidamente el comportamiento de la serie estadística.
• Histograma• Polígono de frecuencias• Ojiva• Gráfica por sectores• Gráfica de Pareto
Histograma
DURACION DE FOCOS
0
50
100
150
1 4 7
10 13 16 19 22 25 28 31 34 37 40
DATO
HORA
S
Histograma de Frecuencias
DURACION DE FOCOS
0
5
10
54 62 66 73 78 83 90 96 107
Xi HORAS
y FR
ECUE
NCIA
Histograma de Frecuencias
DURACION DE FOCOS
0
5
10
15
20
58.41 67.25 76.08 84.91 93.75 102.59PUNTO MEDIO Xi
FREC
UENC
IA
Polígono de Frecuencias
DURACION DE FOCOS
0
2
4
6
8
10
54 62 66 73 78 83 90 96 107
HORAS
FREC
UENC
IAS
Ojiva
DURACION DE FOCOS
01020304050
54 62 66 73 78 83 90 96 107
HORAS
FREC
UENC
IA
ACUM
ULAD
A
Gráfica de Sectores
DURACION DE FOCOS545% 62
8%
6613%
7322%
7819%
8314%
908%
968%
1073%
INFORMACIÓN CUALITATIVA
Se representa gráficamente por:• Histogramas• Gráficas de Pareto• Gráficas de Sectores
Histograma
ENCUESTA DE CALIDAD
0 5 10 15
EXCELENTE
BUENA
REGULAR
SUFICIENTE
MALA
Gráfica de pareto
ENCUESTA DE CALIDAD
02468
10121416
FREC
UEN
CIA
Gráfica de Sectores
ENCUESTA DE CALIDAD
BUENA34%
REGULAR20%
SUFICIENTE15%
MALA7% EXCELENTE
24%
DATOS BIVARIADOS
Se obtienen cuando se miden dos variables en una sola unidad experimental.
Cuando se miden más de dos variables se denominan multivariados.
Representación gráfica: Gráficas de barras Gráficas de línea Gráficas de área
Gráfica de Barras
0
200
400
600
800
1995 1996 1997 1998 1999 2000
COSTOS
INGRESOS
Gráfica de Líneas
0
200
400
600
800
1995 1996 1997 1998 1999 2000
AÑO
PESO
S
COSTOS INGRESOS
Gráfica de Barras
0
500
1000
1500
1995 1996 1997 1998 1999 2000
AÑO
PESO
S
COSTOS INGRESOS
0%20%40%60%80%
100%
1995 1996 1997 1998 1999 2000
AÑO
COSTOS INGRESOS
GRÁFICA DE BARRAS
Gráfica de Áreas
0
200
400
600
800
1995 1996 1997 1998 1999 2000
AÑO
INGRESOS COSTOS
Ejercicios de Aplicación• 1.- Leer en la Antología el Tema de Representación Gráfica para conocer los diferentes tipos de
gráficas que existen.
• 2.- Del siguiente ejercicios (Anexo en material) Graficar la información y presentarla, mediante:– Histograma
– Polígono– Gráfica de Sectores
Ejemplo 1: Precios de Automóviles
20,197 20,372 17,454 20,591 24,453 14,266 15,021 25,683 27,872
16,587 20,169 32,851 16,281 21,285 21,324 21,609 25,670 12,546
12,935 16,873 22,251 22,277 21,533 24,443 16,889 17,004 14,357
17,155 16,688 20,657 23,613 17,203 20,765 22,783 23,661 29,277
17,642 18,981 21,052 22,799 15,263 33,625 14,399 14,968 17,356
18,442 18,722 16,331 19,817 17,633 17,962 19,845 23,285 24,896
26,076 29,492 15,890 18,740 21,571 22,449 25,337 17,642 20,613
21,220 27,655 19,442 14,891 23,237 17,445 18,556 18,639 21,296
Medidas de Tendencia Central
Las medidas de tendencia central se usan para buscar el valor central de la serie o distribución estadística. Son:
la media, la mediana y la moda.
Media
• Es el valor central, teórico y exacto que representa el centro de una serie estadística.
Puede ser:
– Aritmética– Geométrica– Armónica
Propiedades de la Media
• Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene una media.
• Al evaluar la media se incluyen todos los valores.
• La media es única para un conjunto de valores dado.
• Es muy útil para comparar dos o más poblaciones.
• Es la única medida de tendencia central en donde la suma de las desviaciones de los valores individuales respecto de la media es igual a cero.
Propiedades de la Media
Media Aritmética
Es un número tal que si sumamos tantas veces como términos tenga la serie estadística, su suma no se altera.
• Es lo que se conoce como promedio simple, se calcula:
xxi
ni
n
1
Sea la sucesión cuyos términos son:x1, x2, x3 ...… xn.
Designando con a la media aritmética obtenemos:
x + x + x + x + x + x = x1+ x2 + x3 +...+ xn
Por lo tanto: para una serie simple: nx = x1+ x2 + x3 +...+ xn
Despejando la x queda la fórmula:
MEDIA ARITMÉTICA
xxi
ni
n
1
x
MEDIA ARITMÉTICAEJEMPLO SERIE SIMPLE
n xi n xi n xi n xi1 54 11 73 21 78 31 832 54 12 73 22 78 32 833 62 13 73 23 78 33 834 62 14 73 24 78 34 905 62 15 73 25 78 35 906 66 16 73 26 78 36 907 66 17 73 27 78 37 968 66 18 73 28 83 38 969 66 19 73 29 83 39 96
10 66 20 78 30 83 40 107
7.7640068,31
n
xix
n
i
n = 40xi = 3,068
Duración de 40 focos ...
MEDIA ARITMÉTICASERIE DE FRECUENCIAS
Las frecuencias nos indican cuántas veces se repiten los datos, por lo
que la suma de Y, nos indica el total
de datos.
y
yxix
n
i 1
MEDIA ARITMÉTICAEJEMPLO SERIE DE FRECUENCIAS
xi y xiy54 2 10862 3 18666 5 33073 9 65778 8 62483 6 49890 3 27096 3 288
107 1 107 40 3,068
y = 40xiy = 3,068
7.7640068,31
y
xiyx
n
i
Duración de 40 focos ...
MEDIA ARITMÉTICASERIE DE CLASES Y FRECUENCIAS
•Dado que ahora la variable agrupa a un subconjunto de
valores (datos), es necesario, representarla con
la marca de clase xim.• Marca de clase, valor
representativo de los datos que se agrupan en la clase,
se calcula con la media aritmética de los límites de
cada clase.
2.sup..inf. LLxim
y
myxix
n
i 1
FÓRMULAS
MEDIA ARITMÉTICAEJEMPLO SERIE DE
CLASES Y FRECUENCIAS
xi y xim ximyDe 54 a 62.82 5 58.41 292.05
De 62.83 a 71.66 5 67.25 336.23De 71.67 a 80.49 17 76.08 1,293.36De 80.50 a 89.32 6 84.91 509.46De 89.33 a 98.16 6 93.75 562.47De 98.17 a 107 1 102.59 102.59
40 3,096.16
y = 40ximy = 3,096.15 40.77
4016.096,31
y
ximyx
n
i
Duración de 40 focos ...
Ejercicios Media
• 1.- Evalúe la media de la siguiente población de valores: 6 3 5 7 6
• 2.-Determinar el salario medio por hora pagado a carpinteros que obtuvieron los siguientes pagos por hora: $15.40, $20.10, $18.75, $22.76, $20.67, $18.00
• 3.- La Compañía de Servicio eléctrico, seleccionó 20 clientes residenciales al azar. Los siguientes, son
los importes (en dlls) que se cargaron a los clientes por el servicio eléctrico en el último mes:54, 48, 58, 60, 25, 47, 75, 46, 60, 70, 67, 68, 39, 35, 56, 66, 33, 62, 33, 62, 65, 67
• 4.- Determinar la media de la siguiente distribución de frecuencias
Clase Frecuencia0.01 a 5 25.01 a 10 710.01 a 15 1215.01 a 20 620.01 a 25 3
MEDIANAValor central que divide una serie estadística en dos partes exactamente iguales.
Es un valor real central exacto.Es también una medida de posición.
Para calcular la mediana, necesitamos primero ubicar el lugar en dónde se encuentra, ya que esta demás es una medida de posición, lo cual se logra determinando su número de orden:
21#
nMdorden
21
#
yMdorden
Serie simpleSerie de frecuencias y de clasesy frecuencias
MEDIANA
215.202
1402
1#
nMdorden
xi y yac54 2 262 3 566 5 1073 9 1978 8 2783 6 3390 3 3696 3 39107 1 40
SUMA 40
Md = 78
Duración de 40 focos ...
MEDIANASERIE DE CLASES Y FRECUENCIAS
)(2 iFi
Yacy
LiMd
Donde: Md.=Mediana Li = Límite inferior de la clase que contiene a la mediana; y = Número de términos ó suma de las frecuencias yac = Frecuencia acumulada de la clase anterior a la que contiene la mediana. Fi = Frecuencia de la clase que tiene a la mediana.i = Amplitud del intervalo de la clase que contiene la Md.
Duración de 40 focos ...
MEDIANASERIE DE CLASES Y FRECUENCIAS
xi y yacDe 54 a 62.82 5 5
De 62.83 a 71.66 5 10
De 71.67 a 80.49 17 27De 80.50 a 89.32 6 33
De 89.33 a 98.16 6 39
De 98.17 a 107 1 40 40
215.202
1402
1#
y
Mdorden
86.7683.817
10240
67.71)(2
i
Fi
yacy
LiMd
Clasemediana
Ejercicios Mediana
• 1.- Una muestra de personas solteras, que recibe pagos por seguro social, revelo los siguientes ingresos mensuales: $426, $299, $290, $687, $480, $439, y $565
– ¿Cual es la mediana de los ingresos?– ¿Cuántas observaciones están por debajo de la mediana? ¿cuántas por arriba?
• 2.- El número de paros laborales en la industria automotriz para meses seleccionados son: 6, 0, 10, 14, 8 y 0
– ¿Cuál es la mediana del número de paros?– ¿Cuántas observaciones están por debajo de la mediana? ¿Cuántas por arriba?– ¿Cuál es el valor modal de los paros en el trabajo?
• 3- El contador en jefe de una empresa, quiere preparar un informe acerca de las cuentas pro cobrar de la compañía. A continuación, se presenta una distribución de frecuencias que muestra la cantidad sobresaliente Cantidad Frecuencia$ 0 a $2000 4$2000 a $4000 15$4000 a $6000 18$6000 a $8000 10$8000 a $10,000 4$10,000 a $12,000 3
MODA
• Es el valor de máxima frecuencia.
• Es el término que más aparece o se repite en una distribución.
• En la serie simple y la distribución de frecuencias, no existe fórmula para determinarla, sino que se obtiene mediante la observación de la frecuencia más alta o del término que más veces se repite.
MODAEn el caso de la serie de clases y frecuencias se utiliza una fórmula de interpolación:
Mo Lid
d di. ( )
1
1 2donde: Li = Límite inferior de la clase que contiene a Mo. d1= ym - y1
d2= ym - y2
ym= frecuencia de la clase que contiene a Mo. y1= frecuencia de la clase anterior que contiene a la Mo.
y2= frecuencia de la clase posterior que contiene a la Mo.
i= Amplitud del intervalo.
xi y yacde 54 a 62.82 5 5
de 62.83 a 71.66 5 10de 71.67 a 80.49 17 27de 80.50 a 89.32 6 33de 89.33 a 98.16 6 39de 98.17 a 107 1 40
SUMA 40
28.7683.81112
1267.71)(
21
1.
idd
dLiMo
MODADuración de 40 focos ...
Clasemodal
Ejercicio Moda
• Actualmente hay alrededor de 1.2 millones de hombres y mujeres en el activo del Ejército, la Marina, la Infantería de Marina y la Fuerza Aérea de Estados Unidos. A continuación se muestra una clasificación porcentual de las edades. ¿Cuál es la moda?
Edad (años) FrecuenciaDe 15 a menos de 20 años 15De 20 a menos de 25 años 33De 25 a menos de 30 años 19 De 30 a menos de 35 años 7De 35 a menos de 40 años 11De 40 a menos de 45 años 4De 45 a menos de 50 años 1
MEDIDAS DE DISPERSIÓN
• Nos indican la variabilidad que tienen los datos de la serie estadística respecto de una medida de tendencia central, que generalmente es la media. Son:
Rango Desviación media Desviación estándar
RANGO O RECORRIDO
Es la medida de dispersión más sencilla, y nos indica el campo de variación del
Rango, definida como la diferencia entre el mayor y el menor de los valores
observados.
Esta medida, no refleja en modo alguno la forma de la distribución.
Rango= Valor Max. – Valor Min.
DESVIACIÓN MEDIASe define como la suma de las
desviaciones en términos absolutos de los datos que integran la serie, respecto a la media, entre el número de términos
de la serie.
nxxi
MD ..
y
yxxiMD ..
Serie simple Serie de frecuencias
Desviación MediaSerie de Frecuencias
815.840
6.352..
y
yXXiMD
Xi y (Xi-Xm) IXi-Xm I IXi-Xm Iy54 2 -22.7 22.7 45.462 3 -14.7 14.7 44.166 5 -10.7 10.7 53.573 9 -3.7 3.7 33.378 8 1.3 1.3 10.483 6 6.3 6.3 37.890 3 13.3 13.3 39.996 3 19.3 19.3 57.9107 1 30.3 30.3 30.3
SUMA 40 352.6
Desviación MediaSerie de clases y Frecuencias
414.840
56.336..
y
yXXimMD
Xi Xim y (Xim-Xm) IXim-Xm I IXim-Xm IyDe 54.00 a 62.82 58.41 5 -19.00 19.00 94.98De 62.83 a 71.66 67.25 5 -10.16 10.16 50.78De 71.67 a 80.49 76.08 17 -1.33 1.33 22.53De 80.50 a 89.32 84.91 6 7.50 7.50 45.03De 89.33 a 98.16 93.75 6 16.34 16.34 98.07De 98.17 a107.00 102.59 1 25.18 25.18 25.18
SUMA 40 336.56
DESVIACIÓN MEDIARELATIVA
• SERIE DE FRECUENCIAS
• SERIE DE CLASES Y FRECUENCIAS
100XDMDMR
%49.11
1007.76
815.8
DMR
DMR
100XDMDMR
%87.10
10041.77
414.8
DMR
DMR
DESVIACIÓN ESTÁNDAR ()
• La desviación estándar, es la raíz cuadrada positiva del promedio de las desviaciones al cuadrado de los valores observados, respecto a la media aritmética;
• Indica el grado de dispersión que tienen los términos de la serie con respecto a su media aritmética.
DESVIACIÓN ESTÁNDAR ()
y
yXxim ))(( 2
nXXi 2)(
y
yXXi ))(( 2
Serie simple
Serie de frecuencias
Serie de clases y frecuencias
COEFICIENTE DE VARIACIÓN
• Se define como la razón porcentual entre la desviación estándar y la media aritmética:
C VX
. . *
100
DESVIACIÓN ESTÁNDAR ()
39.1140
4.192,5)( 2
yXXiy
SERIE DE FRECUENCIASXi y (Xi-Xm) (Xi-Xm)^2 (Xi-Xm)^2y54 2 -22.7 515.29 1030.5862 3 -14.7 216.09 648.2766 5 -10.7 114.49 572.4573 9 -3.7 13.69 123.2178 8 1.3 1.69 13.5283 6 6.3 39.69 238.1490 3 13.3 176.89 530.6796 3 19.3 372.49 1117.47107 1 30.3 918.09 918.09
SUMA 40 5,192.40
DESVIACIÓN ESTÁNDAR ()
10.1140
7.924,4)( 2
yXximy
SERIE DE CLASES Y FRECUENCIASXi Xim y (Xim-Xm) (Xim-Xm)^2 (Xim-Xm)^2y
De 54.00 a 62.82 58.41 5 -19.00 360.82 1,804.10 De 62.83 a 71.66 67.25 5 -10.16 103.13 515.65 De 71.67 a 80.49 76.08 17 -1.33 1.76 29.86 De 80.50 a 89.32 84.91 6 7.50 56.32 337.93 De 89.33 a 98.16 93.75 6 16.34 267.15 1,602.91 De 98.17 a107.00 102.59 1 25.18 634.27 634.27
SUMA 40 4,924.70
Coeficiente de Variación
• SERIE DE FRECUENCIAS
• SERIE DE CLASES Y FRECUENCIAS
%85.14
1007.76
39.11
100
CV
CV
XCV
%33.14
10041.7710.11
100
CV
CV
XCV
REGLA EMPÍRICA:
• Para una distribución de frecuencias simétrica de campana, cerca de 68% de las observaciones estará dentro de ±1σ de la media (µ); cerca de 95% de las observaciones estará dentro de ±2σ de la media (µ); alrededor de 99.7% estará dentro de ±3σ de la media (µ).
X
3
Curva en forma de campana
que muestra la relación entre y
2 1 1 2 3
Teorema de Chebyshev
• Para cualquier conjunto de observaciones, la proporción mínima de valores que está dentro de k desviaciones estándar desde la media es al menos 1 - 1/k , donde k2 es una constante mayor que 1.
Ejercicios Dispersión
• 1. El reporte anual de la empresa “A”, dio los siguientes rendimientos de capital para los accionistas, en un periodo de 5 años pasados: 13.2, 5.0, 10.2, 17.5 y 12.9.a) Calcular la amplitud de variación, la media aritmética, la desviación media y la desviación estándar
• 2. La Empresa “B”, reportó los siguientes rendimientos del capital para los accionistas, para cinco años pasados: 4.3, 4.9, 7.2,
6.7 y 11.6.– a) Calcular la amplitud de variación, la media aritmética, la desviación media y la desviación estándar. – b) Comparar los rendimientos de la empresa “B” con los de la empresa “A” del ejercicio anterior
• 3. A cada persona que se presenta como aspirante a un trabajo de ensamble en una empresa mueblera, se le aplica un examen
de aptitudes mecánicas. Una parte de la prueba consiste en ensamblar un armario basándose en instrucciones numeradas. En la siguiente distribución de frecuencias se tiene una muestra de los tiempos que necesitaron 42 personas para ensamblar un armario.
Tiempo Número(En minutos) 2 a 4 4 4 a 6 8
6 a 8 14 8 a 10 9
10 a 12 9 12 a 14 2
ASIMETRÍA
• Nos indica la tendencia o sesgo de la serie estadística.
• Indica la desproporcionalidad entre los valores distribuidos alrededor de la media ya sea que tiendan a los valores más pequeños, a los más grandes, o si se distribuyen proporcionalmente.
• Se puede determinar comparando las medidas de tendencia central.
• Se puede medir mediante los “Coeficientes de Pearson” o el “Método de momentos”.
ASIMETRÍASESGO CERO
Moda = Mediana = Media
ASIMETRÍA POSITIVA
Sesgo a la derecha:
Mo<Md<Xm
ASIMETRÍA NEGATIVA
Sesgo a la izquierda:
Xm<Md<Mo
MoXA
MdXA
2
13
Criterios de clasificación
A = 0 SimetríaA > 0 Asimetría
positivaA < 0 Asimetría
negativa
ASIMETRIACOEFICIENTES DE PEARSON
•Nos dan una medida relativa del sesgo.
ASIMETRIACOEFICIENTES DE PEARSON
(Serie de frecuencias)
PositivaAsimetríaA
MoXA
NegativaAsimetríaA
MdXA
2
2
1
1
3248.039.11
737.76
3424.039.11
787.7633
ASIMETRIACOEFICIENTES DE PEARSON
(Serie de clases y frecuencias)
PositivaAsimetríaA
MoXA
PositivaAsimetríaA
MdXA
2
2
1
1
1072.010.11
28.7647.77
1649.010.11
86.7647.7733
ASIMETRIAMÉTODO DE MOMENTOS
Se mide en el tercer
momento.
Corresponde al promedio
de las desviaciones elevadas al
cubo.
n
xxM3
i3
Seriesimple
Serie de frecuencias
Serie de clases y frecuencias
y
yxxM3
i3
yyxxim
M3
3
ASIMETRIAMÉTODO DE MOMENTOS
Criterios de clasificación
A = 0 SimetríaA > 0 Asimetría
positivaA < 0 Asimetría
negativa33
MA
Coeficiente deAsimetría
Asimetría (Serie de Frecuencias)
Xi y (Xi-Xm) (Xi-Xm)^3 (Xi-Xm)^3y54 2 -22.7 -11,697.08 -23,394.1762 3 -14.7 -3,176.52 -9,529.5766 5 -10.7 -1,225.04 -6,125.2273 9 -3.7 -50.65 -455.8878 8 1.3 2.20 17.5883 6 6.3 250.05 1,500.2890 3 13.3 2,352.64 7,057.9196 3 19.3 7,189.06 21,567.17107 1 30.3 27,818.13 27,818.13
SUMA 40 18,456.24
3123.039.1141.461A;41.461
4024.456,18M 33
Asimetría Positiva
Xi Xim y (Xim-Xm) (Xim-Xm)^3 (Xim-Xm)^3yDe 54.00 a 62.82 58.41 5 -19.00 -6,853.86 -34,269.29De 62.83 a 71.66 67.25 5 -10.16 -1,047.30 -5,236.51De 71.67 a 80.49 76.08 17 -1.33 -2.33 -39.57De 80.50 a 89.32 84.91 6 7.50 422.68 2,536.06De 89.33 a 98.16 93.75 6 16.34 4,366.51 26,199.08De 98.17 a107.00 102.59 1 25.18 15,973.97 15,973.97
SUMA 40 5,163.76
0944.0
10.1109.129;09.129
4076.163,5
33 AM
Asimetría(Serie de Clases y Frecuencias)
Asimetría Positiva
KURTOSISIndica la desproporcionalidad horizontal entre los valores distribuidos alrededor de la media ya sea que tiendan a concentrarse alrededor de la media, a estar dispersos, o si se distribuyen equitativamente alrededor de la media.
Se clasifican en: Leptokúrticas, Mesokúrticas y Platikúrticas
LEPTOKURTICA
µ
Curvas apuntadas con alta concentración
MESOKURTICA
µ
Curvas de apuntamiento medio consideradas normales
PLATIKURTICA
µ
Curvas dispersas y aplanadas
KURTOSIS
µ
Leptokúrtica
Mesokúrtica
Platikúrtica
KURTOSIS
Se mide en el cuarto momento.
Corresponde al promedio de las
desviaciones elevadas a la
cuarta potencia.
4
4 nXXi
M
yyXXi
M4
4
Seriesimple
Serie de frecuencias
Serie de clases y
frecuencias
yyXXim
M4
4
Coeficiente de Kurtosis
344
MK
CRITERIOS DE CLASIFICACIÓN
• K=0 Mesokúrtica
• K>0 Leptokúrtica
• K<0 Platikúrtica
KURTOSIS(Serie de frecuencias)
Xi y (Xi-Xm) (Xi-Xm)^4 (Xi-Xm)^4y54 2 -22.7 265,523.78 531,047.5762 3 -14.7 46,694.89 140,084.6666 5 -10.7 13,107.96 65,539.8073 9 -3.7 187.42 1,686.7478 8 1.3 2.86 22.8583 6 6.3 1,575.30 9,451.7890 3 13.3 31,290.07 93,870.2296 3 19.3 138,748.80 416,246.40107 1 30.3 842,889.25 842,889.25
SUMA 40 2,100,839.27
98.520,5240
27.839,100,24 M
1206.0339.11
98.520,524 A
Curva Leptokurtica
KURTOSIS(Serie de clases y frecuencias)
Xi Xim y (Xim-Xm) (Xim-Xm)^4 (Xim-Xm)^4yDe 54.00 a 62.82 58.41 5 -19.00 130,190.73 650,953.64 De 62.83 a 71.66 67.25 5 -10.16 10,635.61 53,178.06 De 71.67 a 80.49 76.08 17 -1.33 3.08 52.44 De 80.50 a 89.32 84.91 6 7.50 3,172.09 19,032.51 De 89.33 a 98.16 93.75 6 16.34 71,369.58 428,217.47 De 98.17 a107.00 102.59 1 25.18 402,300.50 402,300.50
SUMA 40 1,553,734.62
37.843,3840
62.734,553,14 M
4413.03
10.1137.843,384 A
Curva Platikurtica
Ejercicios de aplicación• Caso 1
Una Compañía de plomería, que fue fundada hace 40 años ha crecido hasta más de 500 empleados actualmente. Se esta considerando el asunto de varios puestos dentro de la compañía donde tiene a hombres y mujeres desarrollando el mismo trabajo pero recibiendo una retribución diferente. Para investigar, recolecto la siguiente información. Suponga que usted tiene la tarea de escribir un informe resumiendo la situación.
Sueldo Anual(Miles de dólares) Mujeres Hombres 20 a 30 2 0 30 a 40 3 1 40 a 50 17 4 50 a 60 17 24 60 a 70 8 21 70 a 80 3 7 80 a 90 0 3
Se debe calcular varias medidas de ubicación, elaborar gráficas, determinar los cuartiles para hombres y mujeres. Realizar gráficas y escribir el informe resumiendo los sueldos anuales. ¿Existe diferencia en lo que respecta al género?
• Caso 2En una reunión de ventas de una compañía, se le preguntó al ejecutivo en jefe cuál era la política de la compañía acerca de las comisiones pagadas a sus representantes de ventas. La empresa vende artículos deportivos a dos mercados importantes. Hay 40 representantes de ventas que tratan directamente con clientes grandes y 30 personas de ventas que se dedican al menudeo.
Se solicito la elaboración de un informe, comparando las comisiones ganadas el año pasado por las dos partes del equipo de ventas. La información se presenta a continuación. ¿Existe diferencia? Asegúrese de incluir información en el informe respecto a la dispersión y tendencia central en los dos grupos.
Comisiones ganadas por los representantes de ventas con clientes grandes
354 87 1676 1187 63 3202 680 39 16871106 883 3140 299 2197 175 159 1105 434615 149 1168 278 579 7 357 252 16022321 4 392 416 427 1738 526 13 1604249 557 635 527
Comisiones ganadas por los representantes de ventas al menudeo 1116 681 1294 12 754 1206 1448 870 944
1255 1213 1219 719 934 1313 1083 899 850886 1556 886 1315 1858 1262 1338 1066 8071244 758 918
Probabilidad• Mide la posibilidad de ocurrencia de algún
fenómeno o variable, basándose en la observación de sus eventos anteriores.
• La teoría de probabilidades tiene su origen en los juegos de azar, al tomar su mecánica.
• Se refiere a los posibles resultados de un experimento o evento que forman el conjunto universo, pero no conocemos lo que sucederá con certeza hasta que ocurre.
Experimento; forma de observación directa en la que se conocen los factores que influyen en su resultado, se basa en la experiencia.
Aleatorio; quetiene que ver con el azar.
Experimento Aleatorio; Es el que tiene resultadosinciertos, pero que se conocen sus probabilidades;es cualquier evento que resulte en uno y solo unode varios resultados bien definidos, pero que nopermite anticipar cuál prevalecerá en un caso
particular.
Evento (Resultado Básico): Cualquiera de los resultados posibles de un experimento
aleatorio, cuyo suceso gobierna todos los resultados
alternativos.
Espacio Muestral; contiene todos los posibles resultados de un experimento aleatorio, se representa por S (U ó Ω), se conoce también como Conjunto Universo en el que cada elemento es un punto muestral o evento.
6,5,4,3,2,1S
• Variable Aleatoria; Función real valorada definida en el espacio de muestra. Se da cuando se conoce su espacio muestral en forma total y exhaustiva, y se conoce además la probabilidad de ocurrencia de cada punto contenido en el espacio muestral
Variable Aleatoria Discreta; Sus valores
se interrumpen o separan, es finita
Variable AleatoriaContinua; Sus valores
posibles no seinterrumpen, es
infinita
Matemática o teóricaComo frecuencia relativaTeoría Clásica de la
ProbabilidadTeoría Estadística o
Subjetiva de la Probabilidad
Teoría Axiomática de la probabilidad
PROBABILIDAD MATEMÁTICA O TEÓRICA
Es aquella en la que podemos contar exactamente todas las formas diferentes
en las que un evento puede o no suceder, y que además podemos
suponer que todas las formas posibles ocurrirán sobre bases igualmente
probables
PROBABILIDAD COMO FRECUENCIA RELATIVA
Si contamos el numero de veces en que se presenta un evento en un numero n de
experimentos aleatorios, determinamos su “frecuencia absoluta” que simbolizamos con f.
En tanto que el cociente f/n, que establece la razón entre la frecuencia de ocurrencia del evento y el
total de experimentos se le denomina “frecuencia relativa”
EJEMPLO
Resultado FrecuenciaAbsoluta
Frecuencia Relativa oProbabilidad
1 2 2/20 = 0.102 3 3/20 = 0.153 4 4/20 = 0.204 5 5/20 = 0.255 3 3/20 = 0.156 3 3/20 = 0.15
Suma 20 20/20 = 1
Lanzamos 20 veces un dado y anotamos sus resultados:
TEORÍA CLÁSICA DE LA PROBABILIDAD
Si un experimento da lugar a n eventos mutuamente excluyentes e igualmente probables, en los que r se consideran éxitos, entonces, la probabilidad de tener un evento
exitoso es:
P=r/n
TEORÍA ESTADÍSTICA O SUBJETIVA DE LA PROBABILIDAD
Se basa en la experiencia sobre lo sucedido anteriormente en
situaciones similares. Se obtiene de datos estadísticos registrados de
experiencias o experimentos; también se compone de apreciaciones subjetivas
TEORÍA AXIOMÁTICA DE LA PROBABILIDAD
)A()Ac(
)(
)S(
)A(
P1P)4
0P)3
1P)2
1P0)1
REGLA DE ADICIÓN
BABA PPP
Cuando A y B son mutuamente excluyentes y colectivamente exhaustivos
BABABA PPPP
Especial
General
REGLA DE MULTIPLICACIÓN
BABA PPP
Cuando A y B son eventos independientes
; y A>0
; y B>0
Principio de independencia
ABABA PPP /
BABBA PPP /
Especial
General
PROBABILIDAD CONDICIONAL
P(B|A) = Probabilidad de B dado A
“Es la probabilidad de ocurrencia de B dependiendo de la
ocurrencia de A”
(Principio de independencia)
PRINCIPIO DE INDEPENDENCIA
Regla: Sea un evento cualquiera del espacio
muestral S, con P(x) > 0. La probabilidad de que ocurra un evento B
cuando A ya ha ocurrido, se le llama probabilidad condicional o principio de
independencia.
)()()/(
APBAPABP
Ejercicios Probabilidad1.- Una tienda de departamentos, vende camisas deportivas en 3 tallas, (pequeña, mediana y grande), en tres modelos (a cuadros, estampada y de franjas) y con dos largos de manga (corta y larga)
• ¿Cuál es la probabilidad de que la camisa vendida sea mediana de manga larga y estampada?• ¿Cuál es la probabilidad de que la camisa vendida sea mediana y estampada?• ¿Cuál es la probabilidad de que la camisa vendida sea de manga corta?• ¿Cuál es la probabilidad de que la camisa vendida sea de franjas o pequeña?• Dado que la camisa recién vendida era de cuadros y mediana. ¿Cuál es la probabilidad de que sea de manga
corta?• Dado que la camisa recién vendida era de cuadros y manga corta ¿Cuál es la probabilidad de que su talla
sea mediana?
Manga CortaModelo
Talla Cuadros Estampada Franjas TotalPequeña 4 3 5 12Mediana 9 8 12 29Grande 3 7 9 19Total 16 18 26 60
Manga LargaModelo
Talla Cuadros Estampada Franjas TotalPequeña 3 2 3 8Mediana 10 5 8 23Grande 4 2 8 14Total 17 9 19 45
TEOREMA DE BAYES
Se refiere a la probabilidad condicional; se usa para reformular un conjunto de probabilidades “a
priori”; para un conjunto de probabilidades “a posteriori”.
Su reformulación se basa en información adicional que se puede obtener de registros pasados o
muestras
𝑷 ( 𝑨𝒊|𝑩𝟏 )=𝑷 (𝑨𝒊 )𝑷 (𝑩𝟏∨𝑨𝒊)
𝑷 (𝑨𝟏)𝑷 (𝑩𝟏|𝑨𝟏 )+𝑷 (𝑨𝟐 )𝑷 (𝑩𝟏|𝑨𝟐 )………….+𝑷 (𝑨𝒊 )𝑷 (𝑩𝟏∨𝑨𝒊)
Ejercicios de Probabilidad
1.- En un programa de capacitación para el personal del área administrativa en la empresa Claremont Enterprises, 80% de los capacitados son mujeres, y 20% varones. El 90% de las mujeres asistió a una universidad, y 78% de los varones también.
Una persona del programa se selecciona al azar. ¿cuál es la probabilidad de que un empleado seleccionado sea una mujer dado que no asistió a una universidad?
2.- Una moneda se lanza al aire cuatro veces¿Cuál es la probabilidad de que en cada tirada salga una cara? 3.- La Probabilidad de que un avión de en el blanco, en una operación de bombardeo, es de 0.80. Si se envían cuatro bombardeos hacia el mismo objetivo, ¿Cuál es la probabilidad de que todos los aviones acierten en el blanco?
4.- El comisario de la policía, clasifica como delitos por edad (en años) del malhechor, y su el crimen es con violencia o no. Según se muestra a continuación, al comisario se le informo de un total de 150 delitos cometidos durante el pasado año.
– ¿Cuál es la probabilidad de seleccionar un caso para analizarlo y encontrar que se trato de un delito con violencia?– ¿Cuál es la probabilidad de seleccionar un caso para analizarlo y descubrir que el delito lo cometió alguien con menos de
40 años de edad?– ¿Cuál es la probabilidad de seleccionar un caso relacionado con un crimen violento o un delincuente de menos de 20
años de edad? – Dado que se selecciona para el análisis un delito con violencia, ¿Cuál es la probabilidad de que lo haya cometido una
persona de menos de 20 años de edad?– Un Juez selecciono dos casos para revisarlos ¿Cuál es la probabilidad de que ambos sean crímenes cometidos con
violencia?
5.- Una persona que vive en Los Ángeles, realiza viajes frecuentes de consultoría a Washington, D.C., 50% de las veces viaja en la aerolínea 1, 30% en la aerolínea 2 y 20% en la aerolínea 3. Para la aerolínea 1, los vuelos llegan con un retraso a Washington D.C., el 30% de las veces, para la aerolínea 2, 25% de las ocasiones tienen retraso y en la aerolínea 3, 40% de las veces.
– ¿Cuál es la probabilidad de que en un viaje cualquiera, el vuelo haya llegado retrasado a Washington y este haya sido por la aerolínea 3?
Edad (en años)
Tipo de delitoMenos de
20 40 40 o mas TotalCon violencia 27 41 14 82Sin violencia 12 34 22 68
Total 39 75 36 150
DISTRIBUCIÓN DE PROBABILIDAD
“Conjunto de probabilidades asociadas a la frecuencia con que ocurre cada elemento de
la variable aleatoria”
Asociación entre el valor que toma la variable aleatoria y su probabilidad de ocurrencia.
Espacio Muestral Discreto
“Es un espacio de muestra que contiene un número finito o numerable infinito de
puntos muestrales o eventos.”
Como el valor de un evento numérico varia al repetir el muestreo, a este tipo de eventos
se les conoce como variable aleatoria.
Una variable es una función de los puntos muestrales en S.
Distribuciones de Probabilidad:
DiscretaP(x)
0 1
Se ubica en el cuadrante (++) del plano cartesiano
Es entera, finita y positiva
Nace en el origen y termina en n donde corta el eje de las abscisas y completa el
área bajo la curva
Su área bajo la curva es igual a 1
S=1
X
Distribuciones de Probabilidad:
ContínuaP(x)
Se localiza en los cuadrantes (+,+) y (+,-) del plano cartesiano
No es finita y puede ser decimal.
Nace en - ∞ y va hasta ∞, nunca corta el eje de las x
Su área bajo la curva tiende a 1
-∞ ∞
S1
X
ESPERANZA MATEMÁTICA
Es la media probabilística, y se refiere al valor medio que se espera que ocurra.
Es el valor esperado que divide en el centro en 2 partes iguales a una distribución de probabilidades.
xii PX)x(E
Distribuciones de Probabilidad Discretas
E(X), se define como: E(X) = x f(x)
Donde es la suma sobre todos los valores de X y f(x) es la distribución de probabilidad de X
PROPIEDADES: 1. El valor esperado de una constante es la constante misma.
Así, si b es una constante, E(b) = b.2. Si a y b son constantes E(aX + b) = aE(X) + b
Distribuciones de Probabilidad Discretas
ESPERANZA MATEMÁTICA, CARACTERISTICAS:
3. Si x y Y son variables aleatorias independientes: E(XY) = E(X) E(Y)Es decir, la esperanza del producto XY es el producto de las esperanzas individuales de X y Y.
4. Si X es una variable aleatoria con FDP f(x) y si g(X) es cualquier función de X, entonces
E g(X) = g(X) f(x) Por tanto, si g(X) = X2
E(X2 ) = X2 f(X)
Distribuciones de Probabilidad Discretas
ESPERANZA MATEMÁTICA, PROPIEDADES:
Es la media del cuadrado de las desviaciones de las mediciones respecto de su media, mide la variabilidad promedio de la Distribución de probabilidad:
22i
2
x2
i2
2ix
xE
Px
xEV
Distribuciones de Probabilidad Discretas
VARIANZA
Momentos superiores:
El tercer y cuarto momentos de una distribución se utilizan a menudo para estudiar la “forma” de una distribución de probabilidad, en particular, su asimetría, A (es decir, falta de simetría) y su
apuntamiento o curtosis C (es decir, que tan alta o que tan plana es la distribución).
Distribuciones de Probabilidad Discretas
Tercer momento:
M3=E(X-μ)3, mide la asimetría de una distribución de probabilidades, en un
variable aleatoria discreta
Distribuciones de Probabilidad Discretas
x3
i3 PxM
Coeficiente de asimetría
Para las funciones simétricas, A =0, Para las distribuciones asimétricas, esta medida será positiva si la cola larga está en dirección positiva o hacia los valores mayores y viceversa;
Si A > 0, habrá asimetría positiva; Si A < 0, habrá asimetría negativa.
33MA
Distribuciones de Probabilidad DiscretasTercer momento:
Cuarto momento:
M4=E(X-μ)4, mide la concentración respecto de la esperanza matemática, en una
variable aleatoria discreta.
Distribuciones de Probabilidad Discretas
x4
i4 PxM
Coeficiente de curtosis
Mide el espesor en las colas de la distribución en el que mide su exceso de curtosis; estadísticamente su valor para una curva normal es 3, por lo que:
C=3 ó C-3 = 0 curva mesocúrticaC>3 ó C-3 > 0 curva leptocúrticaC<3 ó C-3 < 0 curva platicúrtica
3MC 44
Distribuciones de Probabilidad Discretas
Cuarto momento:
METODOS DE CONTEO Y COMBINATORIOS
Sirven para conocer los arreglos de posibles objetos en uno o varios conjuntos, los principales son permutaciones y combinaciones.
Permutaciones: Arreglo de todos o parte de los eventos del conjunto en un orden definido; se utiliza principalmente
cuando queremos formar muestras de eventos aleatorios en un muestreo sin reemplazo, en el que una parte importante del experimento se refiere al orden en el que son elegidos
los elementos de la muestra o en que ocurren los diferentes eventos.
!rn!nPrn
Combinaciones: Arreglo de todos o parte de los eventos de un conjunto sin considerar su orden,
solo se consideran los elementos que contienen. Se utiliza principalmente cuando realizamos
muestreo sin reemplazo en el que no es importante el orden en el que se obtienen los elementos de la muestra, sino los que forman
parte de ella.
!rn!r!nnCr
Es la distribución de probabilidad de los posibles resultados de un experimento
aleatoria repetido “n” veces en ocasiones sucesivas, en el cual los resultados son independientes entre sí y mutuamente
excluyentes, es decir, no puede ocurrir más de uno en cada intento.
Distribución Binomial de Probabilidades
El experimento consta de n pruebas idénticas
Cada prueba tiene solo 2 resultados posibles p (éxito) y q (fracaso). Variables dicotómicas
La probabilidad de tener éxito en una sola prueba es igual a p y permanece constante de prueba a prueba.
La probabilidad del fracaso es q = (1 – p).
Todas las pruebas son independientes
La variable aleatoria bajo estudio es x, el número de éxitos observados en n pruebas
Características de un Experimento Binomial:
xxn)x( pq
xn
P
Dónde:
n = Número total de elementos (muestra o intentos repetidos)x = Número de éxitos que se buscap = Probabilidad de éxitoq = Probabilidad de fracaso
138
Propiedades de la Distribución Binomial
µ = E(x) = np
2 = Var = npq
npq
Ejercicios Distribuciones Discretas
1.- Un 10% de los empleados de producción de una empresa, están ausentes del trabajo en un determinado día de verano. Supóngase que se seleccionan al azar 10 trabajadores de producción para un estudio riguroso de ausentismo.
– ¿Cuál es la probabilidad de que ninguno de los 10 empleados seleccionados esta ausente?
– ¿Cuál es la probabilidad de que menos de 3 estén ausentes?– ¿Cuál es la probabilidad de que al menos 3 estén ausentes?
2.- Se asegura que el 95% del correo de primera clase, se entrega dentro de la misma ciudad, a los dos días de haber hecho el envío. Se mandan aleatoriamente seis cartas a diferentes sitios.
– a) ¿Cuál es la probabilidad de que las seis cartas lleguen a su destino dentro de los dos días?
– b) ¿Cuál es la probabilidad de que exactamente 5 lleguen dentro de dos días?– c) ¿Cuál es la probabilidad de que menos de 2 cartas lleguen dentro de dos días?– d) Determinar la media y la desviación estándar de las cartas que llegan en el periodo
Distribución de Poisson
Es la distribución de una variable discreta que puede presentar todos los valores
enteros no negativos; donde X es el número de ocurrencias de algún evento
en el tiempo o espacio.
xx
Nos indica la probabilidad de que ocurran x eventos en un intervalo dado de tiempo y espacio.
Donde:x = variable aleatoria discretal= npe = 2.718281
!xe)x(P
x ll
PROPIEDADES:= l
2 = l
l
1.- Que la ocurrencia o no ocurrencia de un evento en un intervalo de tiempo o espacio dado, sea
independiente de su ocurrencia o no en otros intervalos de tiempo o espacio.
2.- Que la amplitud del intervalo de tiempo o espacio se pueda elegir lo suficientemente pequeña para que
la probabilidad de que ocurran 2 ó más eventos dentro de un mismo intervalo sea prácticamente nula.
Distribución de Poisson Condiciones de Aplicación:
3.- Que incrementando o disminuyendo la amplitud del intervalo de tiempo o espacio en una magnitud fija
y finita, el intervalo aumente o disminuya proporcionalmente a la probabilidad de ocurrencia del
evento dado.
4.- Que al aumentar o disminuir en forma continua el intervalo de tiempo o espacio por valores
infinitesimales, aumente o disminuya la probabilidad del evento dado en forma continua.
Distribución de Poisson Condiciones de Aplicación:
Distribución Hipergeométrica
Arreglo sistemático asociado a dos resultados, éxito o fracaso en un proceso caracterizado por la reducción del espacio de muestra y el cambio correspondiente en las probabilidades de intento a intento. La principal aplicación de la distribución de probabilidad hipergeométrica se presenta al extraer muestras sin reemplazo de un universo finito.
nN
xnNN
xN
xP
11
Donde:N = PoblaciónN1= Subconjunto de N, elementos con la característica que denota éxiton = Tamaño de la muestrax = Variable, (número de éxitos en la muestra)
Combinaciones de Éxito posibles Combinaciones de Fracaso posibles
Muestras posibles tamaño
n
Distribución HipergeométricaPropiedades:
; donde
; donde
; Factor de Corrección
El factor de corrección es una aproximación al 100%, para aproximar el cálculo a la realidad.
np
1NnNnpq
2
1NnNnpq
NN
p 1
NN
p 1
1
NnN
Distribución HipergeométricaEjercicio:
Se sabe que, en un hospital con 52 enfermos, 19 requieren ser intervenidos quirúrgicamente. Si se toma una muestra al azar de 10 personas, ¿Cuál es la probabilidad de que 2 requieran cirugía?
Donde:N = 52 enfermos es la Población N1= 19 requiriendo cirugía Subconjunto de N, elementos con la característica que denota éxito (por ser lo que se pregunta)n = 10 Tamaño de la muestrax = 2 Variable, (número de éxitos en la muestra)
1501.0)220,024,820,15(
156,884,13171
1052
2101952
219
)2(
11
xP
nN
xnNN
xN
xP
3.- Una fábrica de láminas de vidrio, produce 50 láminas cada hora, y 10 errores distribuidos al azar durante el día. Si la producción es de 12 horas por día. ¿Cuál es la probabilidad de encontrar en 1 lámina menos de 2 errores?
4.- En promedio, el 0.25% de la producción de un mes de partes de automóvil son defectuosas. ¿Cual es la probabilidad de que al elegir una remesa, esta contenga más de 3 partes defectuosas?
5.- Un pedido de vinos es de 10 cajas, cada caja contiene 12 botellas, en cada caja 1 botella es de reserva especial. Si se toma una muestra al azar de 6 botellas, ¿cual es la probabilidad de que menos de 2 sean de reserva especial? 6.- En un salón de clases con 35 alumnos, el 30% tienen 10 años cumplidos. Si tomamos una muestra al azar de 5 alumnos, ¿Cuál es la probabilidad de que al menos 2 no tengan 10 años cumplidos?
Ejercicios Distribuciones Discretas
Función de Densidad de Probabilidad ContinuaDISTRIBUCIÓN NORMAL
Es una distribución simétrica cuyo recorrido es ilimitado ya que es una distribución continua.
Su área bajo la curva está dada por:
dxxfxF
- 0
S1f(x) = Función de densidad de probabilidad
x = Variable de integración
X
Donde:Z = Área bajo la curva = Media poblacional = Desviación estándarX = Valor individualN = Población
DISTRIBUCIÓN NORMAL ESTANDARIZADA
Sus propiedades en términos probabilísticos son:
= 0; = 1
Características de la Curva Normal
Es simétrica y tiene forma de campana, su recorrido es ilimitado.
La media divide al área bajo la curva en exactamente 2 partes iguales (X = Mo = Md)
Es una distribución continua de probabilidad por lo que su número de eventos puede ser infinito.
El cálculo de la probabilidad de ocurrencia de un evento, se mide con el tamaño del área que representa el evento bajo la curva normal. (Tabla normal Z estandarizada)
El promedio de ingresos anuales de un profesionista especializado en determinada empresa es de 34,000 dlls, con una desviación estándar de 2,000 dlls.
Distribución NormalEjercicio
- 0 µ
S1
Distribución NormalEjercicio
- 0 µ=34,000 x= 35000
S1a) ¿Cuál es el porcentaje de las personas que ganan más de
35,000 dlls?
5.02000
000,34000,35
Z
Z
X
X= 35,000µ= 34,000σ= 2,000
Se busca el valor de Z en tablas* es igual a 0.1915
Por buscar el valor más de a 0.5, que es la mitad del área bajo la curva, se le resta el valor de Z en tablas es decir:0.5 - 0.1915 = 0.3085
Es decir, el 30.85% de las personas ganan más de 35,000 dlls.
* Ver siguiente lamina con explicación de tabla. Archivo anexo de Word, tabla Normal
.5.5
Se busca 0.5,
• En la 1er columna Z se busca la unidad y la Primera décima• y en el 1er renglón, se busca el segundo decimal.
La Tabla de Distribución Normal Z Estandarizada, es simétrica, por lo que al obtener un número negativo, se buscará igual, es decir, en términos absolutos.
(Esta tabla está en el Archivo de Word, anexo)
Distribución NormalEjercicio
- 0 x1=33,000 µ=34,000 x2= 35000
b) ¿Cuál es la probabilidad de elegir una persona, que gane entre 33,500 y 35,000 dlls?
5.02000
000,34000,355.0
2000000,34000,33
2
2
1
1
Z
Z
Z
Z
X
Z1= ? X1= 33,000µ= 34,000σ= 2,000
Se busca el valor de Z en tablas es igual a 0.1915
Por buscar el valor de -0.5 y 0.5 es el mismo valor por ser simétrica el área bajo la curva.Se suman ambos valores de la tabla Z1 y Z2:
0.1915 + 0.1915 = 0.3830
Es decir, el 38.30% de las personas ganan entre 33,000 y 35,000 dlls.
.5.5
Z2= ? X2= 35,000µ= 34,000σ= 2,000
Z1 Z2
Distribución NormalEjercicio
- 0 µ x1=34,500 x2= 35,600
c) ¿Qué porcentaje de las personas ganan entre 34,500 y 35,600 dlls?
25.02000
000,34500,3480.0
2000000,34600,35
2
2
1
1
Z
Z
Z
Z
X
Z1= ? X1= 35,600µ= 34,000σ= 2,000
Se busca el valor de Z en tablas es igual a:Z1 = 0.80 = 0.2881 en tablas yZ2 = 0.25 = 0.0987 en tablasEl valor Z va de la media al punto que se busca es decir XA Z1 se le restara el valor de Z2:
0.2881 – 0.0987 = 0.1894
Es decir, el 18.94% de las personas ganan entre 34,500 y 35,600 dlls.
.5.5
Z2= ? X2= 34,500µ= 34,000σ= 2,000
Z2
Z1
Distribución NormalEjercicio
- 0 x1 µ x2
d) ¿En qué intervalo de ingresos se encuentra el 96% de los profesionistas?
120,38120,4000,34880,29120,4000,34
)2000(06.2000,34
2
1
XXX
ZX
X
Z= 2.06 X1= ?µ= 34,000σ= 2,000
Ahora se conoce el valor de Z.
96%, que se divide entre 2 y se busca .4800 dentro de tablas, el valor exacto o el primero que se pase.
Las coordenadas es el valor de Z ±2.06 por ser simétrica.Se calcula X1 y X2 El intervalo del 96% estará entre
38,120 y 29,880
.48.48
Z= 2.06 X2= ?µ= 34,000σ= 2,000
96%
.5.5
•Se busca 96% ÷2= 0.48 dentro de la tabla
• Se elige el número entero ó el primero que se pase.
• Se buscan las coordenadas.
La Tabla de Distribución Normal Z estandarizada, es simétrica, por lo que el valor de las coordenadas, multiplicado por σ, se sumara y restará a la media.
Esta tabla está en el Archivo de Word, anexo .
Ejercicios Distribución Normal
1.- El tiempo promedio que recorre una persona para llegar de su casa al trabajo es de 24 min con una desviación estándar de 3.8 min.
– a) ¿Cuál es la probabilidad de que llegue en al menos 32 min?– b) Si la oficina la abren a las 9:00 am y sale de su casa a las 8:45am, ¿Qué porcentaje
de las veces no llega a tiempo a su trabajo?– c) Si sale a las 8:35am de su casa, y el café lo sirven de 8:50am a 9:00am, ¿Qué
porcentaje de las veces se pierde el café?– d) ¿El 75% de las ocasiones, en que intervalo de tiempo llega?
2.- El promedio de ingresos anuales de un profesionista especializado en determinada empresa es de 34,000 dlls, con una desviación estándar de 2,000 dlls.
– a) ¿Cuál es el porcentaje de las personas que ganan más de 35,000 dlls?– b) ¿Cuál es la probabilidad de elegir una persona, que gane entre 33,500 y 35,500 dlls?– c) ¿Qué porcentaje de las personas ganan entre 34,500 y 35,600 dlls?– d) ¿En qué intervalo de ingresos se encuentra el 96% de los profesionistas?
3.- Una máquina expendedora de refrescos, rellena vasos de 200ml con una desviación estándar de 5ml.
– a) ¿Cuál es el porcentaje de los vasos que se rellenan con menos de 190ml?– b) ¿En una remesa de 1000 vasos de 230ml, cuántos se derraman?– c) ¿Cuál es la probabilidad de que se rellenen entre 195 y 210ml?– d) ¿En qué intervalo de mililitros se rellena el 95% de los vasos?
4.- El peso promedio de ratas de laboratorio, utilizadas para experimentos, es de 189grs, con una desviación estándar de 5.7grs.
– a) ¿Qué porcentaje de los animales pesan más de 200grs?– b) ¿Qué porcentaje pesan entre 195 y 205 grs?– c) ¿Qué porcentaje pesan al menos 175grs?– d) ¿En qué intervalo de pesos se encuentra el 95% de los animales?
Ejercicios Distribución Normal
Apéndice D Áreas debajo de la curva normal
Ejemplo: Si z = 1.96, entonces p(0 a z) = 0.4750.
(Lind, Douglas A.. Estadistica Aplicada a Los Negocios y a la Economia, 12th Edition. McGraw-Hill Interamericana, 022006. 21.9).