Estadistica i
-
Upload
pedro-ruiz-gallo -
Category
Documents
-
view
61 -
download
9
Transcript of Estadistica i
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO
ESCUELA DE POST GRDO
MAESTRIA EN DOCENCIA UNIVERSITARIA E
INVESTIGACION EDUCATIVA
TALLER DE ESTADISTICA
MAG. MAX CORREA CABANILLAS
.
CONTENIDO
CAPITULO I: BASE TEORICA DE LA ESTADISTICA pag.
1.1. Definición de estadística 2
1.2. Población 2
1.3. Clases de población 2
1.4. Muestra 2
1.5. Unidad de análisis 3
1.6. Dato estadístico 3
1.7. Información 3
1.8. Indicador 3
1.9. Parámetro 3
1.10. Estadígrafo 3
1.11. Variable 4
1.12. Clasificación de las variables 4
1.12.1. Por su naturaleza 4
1.12.2. De acuerdo a la función que desempeña en un problema de investigación 4
1.13. Escalas de medición 4
1.14. Clasificación de la estadística 5
CAPITULO II: PRESENTACION DE DATOS 7
2.1. Encuesta 8
2.2. Tablas estadísticas 10
2.2.1. Cuadros estadísticos 10
2.2.1.1. Partes de un cuadro estadístico 10
2.2.1.2 Tipos de cuadros estadísticos 10
2.2.2. Tablas de distribución de frecuencias 14
2.2.2.1. De variable discreta 14
2.2.2.2. De variable continua 17
2.3. Representaciones gráficas 21
2.3.1. Construcción de Gráficos 21
2.3.2. Partes de un gráfico 21
2.3.3. Tipos de gráficos. 21
2.4. Ejercicios 27
CAPITULO III: MEDIDAS DE TENDENCIA CENTRAL 29
3.1. Medidas de Centralización 30
3.2. El Promedio 30
3.2.1. Promedio para datos originales 30
3.2.2. Promedio para datos tabulados 30
3.3. La Moda 32
3.3.1. Moda para Datos Cuantitativos 32
a. Moda para datos Originales 32
b. Moda para datos Tabulados 32
3.3.2. Moda para datos Cualitativos 34
3.4. La Mediana 35
3.4.1. Mediana para Datos Cuantitativos 35
a. Mediana para datos originales 35
b. Mediana para datos tabulados 36
3.4.2. Mediana para datos Cualitativos 40
3.5. Cuartiles 41
a. Cuartiles para datos Originales 42
b. Cuartiles para datos Tabulados 44
3.6. Medidas Descriptivas de Resumen Utilizando Cuartiles 46
3.6.1. El Eje Medio 46
3.6.2. Rango Intercuartilico 47
3.7. Diagrama de Bloques y Líneas 47
3.8. Deciles 48
a. Deciles para datos Originales 48
b. Deciles para Datos Tabulados 49
3.9. Percentiles 50
3.10. Tasas de crecimiento 51
3.11. La Media Geométrica 51
3.11.1. Media Geométrica Simple 51
3.11.2. Media Geométrica Ponderada 52
CAPITULO IV: MEDIDAS DE DISPERSION 54
4.1. Medidas de dispersión 55
4.2. Recorrido o Rango 55
4.3. La Varianza 55
4.3.1. Varianza para Datos Originales 55
4.3.2. Desviación Estándar 56
4.3.3. Varianza para datos tabulados 56
a. Para datos tabulados no agrupados en intervalos 56
b. Para datos tabulados agrupados en intervalos 57
4.3.4. Propiedades de la varianza 58
4.4. Coeficiente de variación 58
4.5. Medidas de Asimetría 59
4.6. Estadígrafos de apuntamiento 60
CAPITULO V: DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES 61
5.1. Generalidades 62
5.2. Distribución de Frecuencias Bidimensionales de Variable Discreta 62
5.3. Distribución de Frecuencias Bidimensionales de Variable Continua- Discreta69
5.4. Ejercicios. 72
CAPITULO VI: PROBABILIDADES 73
6.1. Experimento Aleatorio 74
6.2. Punto muestral 74
6.3. Espacio Muestral 74
6.4. Suceso o evento 74
6.5. Sucesos Mutuamente Excluyentes 74
6.6. Sucesos complementarios 74
6.7. Definición de Probabilidad 74
6.8. Definición 75
6.9. Reglas de Probabilidad 75
6.10. Ejercicios 80
CAPITULO VII: DISTRIBUCIONES DE PROBABILIDAD 82
7.1. Distribución Binomial 83
7.2. Distribución de Poisson 85
7.3. Distribución Normal 87
7.4. Distribución Normal Estándar 89
7.5. Distribución Chi- Cuadrado 95
7.6. Ejercicios 96
CAPITULO I: BASE TEORICA DE LA ESTADÍSTICA
1.1. DEFINICION DE ESTADISTICA:
Es la ciencia que nos proporciona los métodos más eficientes para la recolección,
organización, presentación, análisis e interpretación de un conjunto de datos, con la
finalidad de describirlos o de realizar generalizaciones válidas mediante técnicas
adecuadas.
1.2. POBLACION
Viene a ser el conjunto de personas, animales u objetos que poseen una o más
características comunes observables de naturaleza cualitativa o cuantitativa que se
pueden medir en ellos. La población está integrada por la totalidad de unidades de
análisis. Una población debe estar definida en el espacio y en el tiempo.
Ejemplo: Alumnos del Ciclo 2005-I, de la Facultad de Ciencias Físicas y
Matemáticas de la U.N.P.G.
1.3. CLASES DE POBLACION
Se tiene dos clases de población:
1.3.1. POBLACION FINITA
Es aquella que tiene un número limitado de elementos.
1.3.2. POBLACION INFINITA
Es aquella que tiene un número ilimitado de elementos.
Generalmente en las investigaciones no se conoce el número de elementos
de la población.
1.4. MUESTRA
Una muestra viene a ser una pequeña parte de la población y que se utiliza para
estudiar las características de la misma.
Una muestra se usa por dos razones: mayor economía y menor tiempo en la
realización de la investigación.
Generalmente las poblaciones de estudio son grandes lo cual dificulta la
investigación, en consecuencia se utiliza una muestra como medio de estudio.
Una muestra debe ser seleccionada de tal manera que sea representativa de la
población.
1.5. UNIDAD DE ANALISIS
Viene a ser cada elemento que será estudiado en un población, sobre los cuales se
va a obtener datos.
En el ejemplo anterior, la unidad de análisis viene a ser cada alumno.
1.6. DATO ESTADISTICO
Es el resultado de medir una característica observable de una unidad estadística
1.7. INFORMACION
Es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay
información sin datos.
1.8. INDICADOR
Es una cantidad o valor que permite conocer el estado de un hecho. Son elementos
característicos que describen una situación permitiendo su análisis. Como ejemplo
de indicador tenemos a las Tasas, medidas de resumen, etc.
1.9. PARAMETRO
Se denomina parámetro a una medida descriptiva que resume una característica de
la población, tal como la media () o la varianza (2), calculada a partir de los
datos observados en la población.
1.10. ESTADIGRAFO
Se denomina estadígrafo a una medida descriptiva que resume una característica de
la muestra, tal como la media ( X ) o la varianza (S2)calculada a partir de los datos
observados de una muestra.
1.11. VARIABLE
Es una característica que puede tomar diferentes valores. Las variables son
características observables, susceptibles de adoptar distintos valores o ser
expresadas en varias categorías.
La variable adquiere un valor determinado en cada unidad de análisis y que puede
ser medido o cuantificado.
1.12. CLASIFICACION DE LAS VARIABLES
1.12.1 De acuerdo a su naturaleza: las variables de clasifican en:
a. CUALITATIVAS:
Son aquellas que se expresan mediante palabras y pertenecen a una de varias
categorías que mutuamente se excluyen. Ejemplo: Sexo, Estado Civil,
Niveles de desnutrición, Grado de instrucción, Zona de residencia, etc.
b. CUANTITATIVAS:
Son aquellas que se expresan numéricamente y dan origen a dos tipos de
variables:
b.1. Variable Discreta:
Es aquella que toma valores enteros o específicos. Ejemplo: Número de
alumnos, Número de docentes, número de trabajadores de una empresa,
etc.
b.2. Variable Continua:
Es aquella que puede tomar cualquier valor dentro de un intervalo dado.
Ejemplo: Ingreso económico, Edad, Talla, peso, Tiempo, etc.
De acuerdo a la función que desempeñan en el planteamiento de un problema de
investigación:
a. Variable Independiente: Es la variable explicativa.
b. Variable Dependiente : Es la variable explicada
1.13. ESCALAS DE MEDICION
Se denomina escala de medición a un instrumento de medida que sirve para
cuantificar las variables.
La escala de medida orientará al investigador para el análisis estadístico que podrá
realizar. Entre las escalas de medición se tiene:
1. ESCALA NOMINAL
Es aquella que tiene como función clasificar las categorías de la variables.
Ejemplo: la variable “Sexo” asigna a las personas dos categorías o modalidades:
“masculino” y “femenino”. Las variables “Estado civil”, “Ocupación”, tienen
categorías o modalidades que son de escala nominal.
2. ESCALA ORDINAL
Es aquella que tiene como función clasificar y ordenar las categorías de las
variables en forma ascendente o descendente.
Ejemplo: “Grado de instrucción”, con sus modalidades: Primaria, Secundaria,
Superior.
Estatus “Socioeconómicos”, con sus modalidades: bajo, medio y alto.
3. ESCALA DE INTERVALO
Es aquella que tiene como función clasificar, ordenar, se puede conocer la
distancia entre dos puntos cualesquiera y además tiene un punto “cero relativo”
como punto de partida.
Ejemplo: la temperatura, si utilizamos las escala centígrada, esta empieza en
cero, pero si utilizamos la escala Fahrenheit, esta empieza en 32 grados. Como
otros ejemplo tenemos las calificaciones de un test, la medición de actitudes, etc.
4. ESCALA DE RAZON
Tiene como función clasificar, ordenar, se puede conocer la distancia entre dos
puntos y nos permite realizar las cuatro operaciones, además tiene un punto
“cero absoluto” como punto de partida. En esta escala se puede establecer
relaciones de igualdad. Los valores de esta escala se obtienen en general por
mediciones. Ejemplo: Talla, Peso, Edad, Ingresos económicos, volumen, etc.
1.14. CLASIFICACION DE LA ESTADISTICA:
De acuerdo a las funciones que realiza la estadística se clasifica en:
1.14.1. ESTADISTICA DESCRIPTIVA
Es aquella que utiliza un conjunto de métodos estadísticos con la finalidad de
describir (Tablas estadísticas, gráficos) y analizar (Medidas de resumen)
datos. La estadística descriptiva es aplicable a nivel de la población o a nivel
de la muestra.
La estadística descriptiva no intenta realizar generalizaciones.
1.14.2. ESTADISTICA INDUCTIVA O INFERENCIAL
Es aplicable a nivel de muestra y su función es generalizar las características
observadas en la muestra hacia la población. Es decir las conclusiones
obtenidas a partir de una muestra, son validas para toda la población. La
inferencia puede contener conclusiones que pueden no ser ciertas en forma
absoluta, por lo que es necesario que éstos sean dados con una medida de
confiabilidad que es la probabilidad.
Estas dos clases de estadística no son mutuamente excluyentes, ya que para utilizar
los métodos de la inferencia estadística, se requiere conocer los métodos de la
estadística descriptiva.
CAPITULO II: PRESENTACION DE DATOS
2.1. ENCUESTA: Es un instrumento que sirve para la recolección de
datos en un trabajo de investigación por observación.
Una encuesta se elabora teniendo en cuenta los objetivos de
estudio, consecuentemente debe contener las variables de interés.
La siguiente ilustración tuvo como objetivo, identificar los factores
socioeconómicos y culturales de los padres de familia relacionados
con el rendimiento de sus hijos. La encuesta es la siguiente:
DISEÑO DE LA ENCUESTA
Nota: La Encuesta será respondida por el responsable de la familia.
1. Nombres:………………………………………………………………….. . y
apellidos:..............................................................................................
2. Anote el ciclo de estudios de su
hijo: .......................................................................
3. Indique su Estado Civil:
a. Casado (a) ( ) c. Separado (a) ( )
b. Conviviente ( ) d. Divorciado (a) ( )
e. Viuda ( ) f. Madre Soltera ( )
4. Indique La Zona donde reside:
a. Zona Urbana. ( )
b. Zona Urbano Marginal ( )
c. Zona Rural ( )
5. Aspectos Relacionados con la Vivienda:
a. Su vivienda es: 1) Propia ( ) 2. Alquilada ( )
3) Otras Formas:...................................
b. Indique cuantas habitaciones tiene su
vivienda:..........................................
c. ¿En su vivienda existe un ambiente de estudio para su hijo?
Si ( ) No ( )
6. ¿Cuántos hijos tiene?:.............................................
7. Indique cual es su ocupación:
a. Empleado (a) ( ) d. Ama de casa ( )
b. Obrero ( ) e. Otras ( )
c. Trabajador (a) independiente ( )
8. Indique cual es su ingreso económico familiar mensual:
a. Menos de 500 soles ( )
b. de 500 a 700 soles ( )
c. de 701 a 900 soles ( )
d. de 901 a 1100 soles ( )
e. Más de 1100 soles ( )
9. ¿Cuál es la disponibilidad económica diaria del estudiante?
a. Un sol ( )
b. Dos Soles ( )
c. Tres Soles ( )
d. Más de tres Soles ( )
10. Indique su nivel de instrucción
a. Iletrado (a) ( )
b. Primaria ( )
c. Secundaria ( )
d. Superior No Universitaria ( )
e. Superior Universitaria ( )
11.¿Cuántas horas diarias en promedio dedica al estudio su hijo?
a. < 1 hora ( )
b. 1 a 2 horas ( )
c. 2.1 a 3 horas ( )
d. Más de 3 horas ( )
12.¿Cuál fue el rendimiento promedio de su hijo, en el ciclo anterior? (esta
nota será proporcionada por el profesor, del registro de notas)
a. 0 a 10 ( )
b. 11 a 15 ( )
c. 16 a 20 ( )
2.2. TABLAS ESTADISTICAS: Sirven para presentar los datos
estadísticos en filas y columnas, clasificados de acuerdo a las
categorías o indicadores de las variables.
Metodológicamente las tablas estadísticas se clasifican en:
Cuadros Estadísticos y tablas de distribución de frecuencias .
2.2.1. CUADROS ESTADISTICOS: Son arreglos ordenados en filas y
columnas de datos estadísticos de acuerdo a las variables de estudio,
para su interpretación y análisis. Los cuadros estadísticos se elaboran
para presentar los informes de trabajos de investigación.
Los cuadros estadísticos se diseñan teniendo en cuenta los objetivos
específicos de la investigación.
2.2.1.1. PARTES DE UN CUADRO ESTADISTICO: En general se consideran
las siguientes partes:
a. NUMERO: Es el código de identificación que permitirá la ubicación del
cuadro.
b. LUGAR: Se refiere al lugar donde se realizó el trabajo de
investigación
c. TITULO: Indica una descripción resumida del contenido de la tabla y
contendrá la variable o variables de estudio consideradas en la tabla.
d. CUERPO DEL CUADRO: En esta parte se registrará los datos
producto del procesamiento de las encuestas.
e. FUENTE: Se considerará cuando los datos se hayan obtenido de
alguna entidad o publicación. Cuando son datos obtenidos directamente
por el investigador (datos de primera mano), no se consignará fuente.
2.2.1.2. TIPOS DE CUADROS ESTADISTICOS:
a. De Variable Cualitativa: Los más usuales son:
a.1. Cuadros Unidimensionales: Se construyen cuando se analiza una
sola variable cualitativa ( Estado Civil, Zona de Residencia,
Ocupación, etc.).
Ejem.
CUADRO Nº 1
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1º CICLO
SEGÚN GRADO DE INSTRUCCIÓN
NIVEL DE INSTRUCCIÓN Nº %
Primaria
Secundaria
Sup. No Universitaria
Sup. Universitaria
2
11
42
15
2.86
15.71
60.00
21.43
Total 70 100.00
a.2. CUADROS BIDIMENSIONALES: Llamados también de doble
entrada, se construyen cuando se analiza a la vez dos variables
cualitativas. Ejem.
CUADRO Nº 2
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1º CICLO POR ZONA DE
RESIDENCIA Y NIVEL DE INSTRUCCIÓN
NIVEL DE INSTRUCCION
ZONA DE RESIDENCIA
TOTALUrbana Urbano
Marginal
Rural
Nº % Nº % Nº % Nº %
Primaria - - 1 1.43 1 1.43 2 2.86
Secundaria 3 4.29 6 8.57 2 2.85 11 15.71
Sup. No Universitaria 26 37.14 13 18.57 3 4.29 42 60.00
Sup. Universitaria 12 17.14 3 4.29 - - 15 21.43
TOTAL 41 58.57 23 32.86 6 8.57 70 100.00
También existen cuadros tridimensionales, estos dependen de la naturaleza de
los trabajos de investigación.
b. DE VARIABLE CUANTITATIVA:
b.1. CUADROS UNIDIEMNSIONALES:
Se construyen cuando se analiza una sola variable cuantitativa. (Ingresos
económicos, Rendimiento de alumnos, Peso, Edad,etc.). Ejem.
CUADRO Nº 3
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL 1º CICLO SEGÚN
INGRESO ECONOMICO
b.2. CUADROS BIDIMENSIONALES: Se construyen cuando se
analizan a la vez dos variables cuantitativas. Ejem.
CUADRO Nº 4
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGÚN
INGRESO ECONOMICO Y RENDIMIENTO DE LOS ALUMNOS
Ingreso
Económico
Rendimiento
Total0 -10 11-15 16-20
Nº % Nº % Nº % Nº %
500 - 700 3 4.29 2 2.85 - - 5 7.14
701 - 900 2 2.86 5 7.14 1 1.43 8 11.43
INGRESO ECONOMICO Nº %
500 – 700
701 – 900
901 – 1100
1101 - 1300
1301 - 1500
5
8
15
25
17
7.14
11.43
21.83
35.71
24.29
TOTAL 70 100.0
0
901 - 1100 4 5.71 8 11.43 3 4.29 15 21.43
1101-1300 4 5.71 21 30.0 - - 25 35.71
1301-1500 2 2.86 14 20.0 1 1.43 17 24.29
Total 15 21.43 50 71.42 5 7.15 70 100
c. DE VARIABLE CUANTITATIVA- CUALITATIVA: Se construyen cuando se
analiza una variable cuantitativa y una cualitativa. Ejem.
CUADRO Nº 5
ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE
PADRES DE FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGÚN
INGRESO ECONOMICO Y ZONA DE RESIDENCIA
Ingreso
Económico
Zona de Residencia
TotalUrbana Urbano
marginal
Rural
Nº % Nº % Nº % Nº %
500 - 700 - - 1 1.43 4 5.71 5 7.14
701 - 900 2 2.86 4 5.71 2 2.86 8 11.43
901 - 1100 9 12.86 6 8.57 - - 15 21.43
1101- 1300 18 25.71 7 10 - - 25 35.71
1301- 1500 12 17.14 5 13.15 - - 15 24.29
Total 41 58.57 23 32.86 6 8.57 70 100.00
2.2.2. TABLAS DE DISTRIBUCION DE FRECUENCIAS:
SIMBOLOGIA:
n : N° de datos
Li : Límite inferior de los datos
Ls : Límite superior de los datos
R : Recorrido o rango
m : N° de intervalos
c : amplitud interválica
Xi : Recorrido o valores que toma una variable discreta
ni : Frecuencias absolutas
hi : Frecuencias relativas
Ni : Frecuencias absolutas acumuladas
Hi : Frecuencias relativas acumuladas
hix100: Frecuencias relativas porcentuales
Hix100: Frecuencias relativas porcentuales acumuladas
[yi-1 – yi): Intervalo cerrado por la izquierda y abierto por la
derecha
(yi-1 – yi]: Intervalo abierto por la izquierda y cerrado por la
derecha
[yi-1 – yi]: Intervalo cerrado por ambos lados
2.2.2.2 DISRIBUCION DE FRECUENCIAS DE VARIABLE
DISCRETA:
Ejem : Los siguientes datos corresponde al número de
profesores de de 75 colegios:
49, 52, 50, 47, 49, 48, 50, 49, 51, 50, 52 47, 49, 48, 47, 46, 50, 49,
51, 50, 48, 46, 52, 49, 48, 48, 47, 51, 46, 51, 50, 47, 49, 46, 50, 49,
47, 50, 51, 48, 49, 47, 48, 48, 46, 48, 47, 51, 46, 49, 46, 48, 49, 48,
50, 52, 52, 48,48,49, 47, 48, 50, 49, 46, 51, 50,49, 47, 50, 48, 51,
52, 48, 51
a. Elabore una tabla de frecuencias para analizar los datos.
b. Interprete la tabla
Solución
TABLA Nº 6
DISTRIBUCION DE FRECUENCIAS DE LOS
PROFESORES DE 75 COLEGIOS
PROCEDIMIENTO
En la primera columna se colocan los valores que toma la
variable
Xi .
Las frecuencias absolutas ni, resultan de contar cuantas veces
se repite los valores que toma la variable, es decir, cuantas
veces se repite el 1, cuantas veces se repite el dos, etc.
Las frecuencias relativas hi, resultan de dividir cada frecuencia
absoluta entre el total de datos (80).
La fórmula para encontrar cada frecuencia relativa es , de
lo que resulta: ; ; ; etc.
- Frecuencias Absolutas Acumuladas Ni: Se calculan así:
Así sucesivamente.
Xi ni hi Ni Hi hix100 Hix100
46
47
48
49
50
51
52
8
10
16
14
12
9
6
0.11
0.13
0.21
0.19
0.16
0.12
0.08
8
18
34
48
60
69
75
0.11
0.24
0.45
0.64
0.80
0.92
1.00
11
13
21
19
16
12
8
11
24
45
64
80
92
100
75 1.00 100
- Frecuencias Relativas Acumuladas Hi: Se calculan así de
manera similar:
- Frecuencias Relativas Porcentuales (hi x 100): Se encuentran
multiplicando por 100 a cada frecuencia relativa simple (hi):
h1x 100 = 0.11 x 100 = 11
h2x 100 = 0.13 x 100 = 13
h3x 100 = 0.21 x 100 = 21
y así sucesivamente.
- Frecuencias Relativas Porcentuales Acumuladas(Hix100): Se
encuentran multiplicando por 100 a cada frecuencia relativa
acumulada (Hi):
H1x 100 = 0.11 x 100 = 11
H2x 100 = 0.24 x 100 = 24
H3x 100 = 0.45 x 100 = 45
y así sucesivamente.
INTERPRETACIÓN DE LOS VALORES DE LA TABLA
Vamos a interpretar dos valores de cada columna, el resto de
valores se interpreta de manera similar.
n3 = 16 : 16 colegios tienen 48 profesores
n5 = 12 : 12 colegios tienen 50 profesores
h2 = 0.13 : El 0.13 por uno de colegios tienen 47
profesores
h4 = 0.19 : El 0.19 por uno de colegios tienen 49
profesores
N3 = 34 : 34 colegios tienen de 46 a 48
profesores
N6 = 69 : 69 colegios tienen de 46 a 51
profesores
H3 = 0.45 : El 0.45 por uno de colegios tienen de
46 a 48 profesores
H5 = 0.80 El 0.80 por uno de colegios tienen de
46 a 50 profesores
h4 x 100 = 19 : El 19% de colegios tienen 49
profesores
h6 x 100 = 12 : El 12% de colegios tienen 12
profesores
H3 x 100= 45 : El 45% de colegios tienen de 46 a 48
profesores
H5 x 100= 80 : El 80% de colegios tienen de 46 a 5o
profesores
2.2.2.3. DISRIBUCIÓN DE FRECUENCIAS DE VARIABLE
CONTINUA:
Cuando la variable en estudio es continua los datos se
agrupan en intervalos.
Ejem. Los siguientes datos corresponde al ingreso
económico de 62 trabajadores.
910, 950, 1190, 620, 1040, 1100, 1070, 925, 800, 1380,
780, 456, 706, 1100, 860, 1370, 1240, 1120, 1020, 1060,
930, 1136, 1180, 990, 630,1070, 930, 1200, 920, 815, 495,
480, 460, 1090, 1220,456, 742, 1080, 1082, 1073, 1345,
790, 950,1073, 1170, 790, 1085, 820, 900, 780, 700, 650,
1020, 980, 950, 990, 935, 810, 790, 1382, 1384, 910
a. Elabore una tabla de distribución de frecuencias
utilizando un intervalo cerrado por la izquierda y abierto
por la derecha.
b. Interprete la tabla y haga la representación grafica
correspondiente
TABLA N° 7
[yi-1-yi) yi ni hi Ni Hi hix100 Hix100
454.5 - 587.5 521 5 0.08 5 0.08 8 8
587.5 – 720.5 654 5 0.08 10 0.16 8 16
720.5 – 853.5 787 10 0.16 20 0.32 16 32
853.5 – 986.5 920 13 0.21 33 0.53 21 53
986.5 – 1119.5 1053 16 0.26 49 0.79 26 79
1119.5 – 1252.5 1186 8 0.13 57 0.82 13 82
1252.5 – 1385.5 1319 5 0.08 62 1.00 8 100
TOTAL 62 1.00 100
PROCEDIMIENTO.
1. Para construir los intervalos se puede proceder de dos
maneras:
a. Por Conveniencia: De acuerdo a la naturaleza del trabajo
de investigación y en función a la utilidad de información
que le pueda brindar al investigador, se pueden construir
los intervalos. No necesariamente los intervalos deben
tener la misma amplitud.
b. Metodología para Construir los Intervalos: Existe una
metodología que se utiliza para construir los intervalos
para una tabla de frecuencias de variable continua.
1° Se determina el Rango, con la siguiente fórmula:
R = Ls – Li = 1384-456 = 928 R = 928
2° Se determina el número de intervalos:
m = 2.5
m = 7
3° Se determina la amplitud del intervalo ( c ):
C =
Si el valor de C, sale con muchos decimales es preferible hacer
ampliación de los límites de la información con la finalidad de no
tener problemas a la hora de construir los intervalos. Si esto
ocurre, la tabla se construirá con los nuevos límites obtenidos.
La ampliación de los límites de los datos se hace, agregando al
límite superior de los datos una cantidad pequeña y restando la
misma cantidad al límite inferior de los datos. Se debe ir
probando con varias cantidades ( 0.25, 0.50, 0.75, 1, 1.25. 1.50,
1.75, 2, etc). No necesariamente se busca que el valor de C sea
entero. Para nuestro caso la solución es agregar al límite
superior de los datos 1.5 y restar esta misma cantidad al límite
inferior, con lo que tendríamos los nuevos límites de las datos:
Ls = 1385.5 y Li = 454.5, por diferencia de ambos valores se
tiene R = 931, entonces el valor de la amplitud sería
C =
Para construir los intervalos de la tabla, se empieza del límite
inferior modificado y se va agregando el valor de la amplitud ( C=
133), hasta llegar al límite superior de los datos. Posteriormente,
con la finalidad de tener intervalos cerrados, a partir del segundo
intervalo, se va agregando un décimo al límite inferior del
intervalo. .
2. PUNTOS MEDIOS DEL INTERVALO: Los puntos medios de
los intervalos se encuentran, sumando el límite inferior más el
límite superior del mismo y luego se divide entre 2. Ejemplo:
; , etc.
3. Las frecuencias se encuentran de la misma manera que en la
tabla de distribución para variable discreta, descrita
anteriormente.
Para la interpretación de los valores de la tabla se procede de
manera similar que se hizo para la tabla de frecuencia de
variable discreta (Tabla anterior).
.Como ejemplo interpretaremos algunos valores:
n4 = 13: 13 trabajadores tienen un ingreso de 853.5 a 986.5
soles.
n3=10 Vrs. Y3=787: 10 trabajadores tienen un ingreso promedio
de
787 soles.
h5=0.24: El 0.24 por uno de trabajadores tienen un ingreso de
986.5 a 1119.5 soles.
N4=33 : 33 trabajadores tienen un ingreso de 454.5 a 986.5
soles.
H5 = 0.77: El 0.77 por uno de trabajadores tienen un ingreso de
454.5 a 1119.5 soles.
h3x100=16: El 16 % de trabajadores tienen un ingreso de 720.5 a
853.5 soles.
H6x100=90 : El 90 % de trabajadores tienen un ingreso de 454.5
a 1252.5 soles.
2.3. REPRESENTACIONES GRAFICAS
Un gráfico es un medio para representar de manera objetiva los datos de
una tabla estadística. Los gráficos se elaboran en función del tipo de
variable que se quiere representar.
2.3.1 CONSTRUCCION DE GRAFICOS:
Existen una diversidad de gráficos, cuya forma dependerá de las variables
de estudio y de los objetivos de estudio.
Los gráficos de una sola variable sirven para fines comparativos de cifras
absolutas o porcentuales y pueden tener la forma de barras, superficies o
líneas.
Los gráficos de dos variables se construyen en el plano de coordenadas
cartesianas.
2.3.2. PARTES DE UN GRAFICO:
a. Titulo: Indica la naturaleza del fenómeno representado.
b. Diagrama: Representa los datos contenidos en la tabla estadística
c. Escalas : Las escalas se construyen de acuerdo a la magnitud de las
frecuencias.
d. Fuente: Sirve para indicar la fuente de los datos representados, esto es
opcional puesto que la fuente se especifica en la tabla estadística de
donde provienen los datos.
2.3.3. TIPOS DE GRAFICOS: Entre los principales se tiene:
a. Gráficos de Área o de Superficie: Se construyen para una variable de
cualitativo. Para la ilustración tomaremos los datos del Cuadro Nº 1
b. Gráfico de Barras: Se construyen para dos variables de tipo cualitativo. Para su
ilustración tomamos los datos del cuadro Nº 2.
a. Gráfico de Bastones: Se construyen para variables de tipo discreto.
Para la ilustración tomaremos los datos de la tabla Nº 6
b. Histograma de Frecuencias:
Se construye para variables de tipo cuantitativo y consiste en barras
que van unidas. Para la ilustración tomaremos los datos de la tabla
Nº 7.
c. Gráficos para Series de Tiempo: Se denomina series de tiempo a los
datos ordenados en función del tiempo: ejemplo:
AÑOS Nº de Alumnos de la Facultad
De Ing. Informática y Sist.
1998
1999
2000
2001
2002
2003
2004
380
450
530
600
690
770
855
EJERCICIOS
1. La inversión mensual en compra de computadoras, en miles de dólares, por 48 pequeñas empresas fue:
31 17 27 20 28 10 34 25 14 24 40 35 15 39 18 30 41 26 12 46 18 23 36 19 29 37 33 27 27 24 26 31 32 28 25 28 33 28 22 23 31 29 35 21 30 25 38 31.
a. Construir una tabla de frecuencias para analizar los datos, considerando un intervalo abierto por la derecha y cerrado por la izquierda. Interprete.
b. Determinar el Nº de empresas con una inversión menor a 25 mil dólares.
c. Determinar el porcentaje de empresas con una inversión entre 14 mil y 20 mil dólares.
2. Con los datos del problema Nº 1, elabore una tabla de frecuencias utilizando un
intervalo cerrado por ambos lados. Interprete la tabla.
3. Los siguientes datos corresponde a las notas en el curso de estadística de 52 alumnos:
12 11 12 12 7 8 12 12.5 9.5 9 9 12 7.5 12.5 10 9 11.5 13 10.5 10 12 8 14 12 11 16 12 15 9 10.5 12 12 10 13.5 12 18 10 11 10 17 12.5 10.5 14 11 10.5 14.5 12.5 11.5 12 13 11 11.5 .Construir una tabla de frecuencias utilizando intervalos cerrados por ambos lados. Interprete la tabla y haga la representación gráfica correspondiente.
4. Los siguientes datos corresponde al Nº de libros de estadística consultados por
50 estudiantes para rendir su primer examen parcial.
2 3 4 4 0 4 0 2 1 1 0 3 0 2 2 0 3 0 4 1 0 1 2 0 1 1 50 5 0 3 2 0 5 4 1 1 0 4 2 1 1 4 6 2 1 2 3 0 3.Construir una tabla de frecuencias e interprete la tabla.
5. Con respecto a la tabla de frecuencias del problema anterior se pide:
a. ¿Qué porcentaje de alumnos consultó de 4 a 6 libros?b. ¿Qué porcentaje de alumnos no consultó ningún libro?c. ¿Qué porcentaje de alumnos consultó hasta 3 libros?
6. La demanda diaria de azúcar durante 190 días en un supermercado, se tabuló en una distribución de frecuencias simétrica de 5 intervalos de amplitudes
iguales a 4. Si la marca de clase del intervalo central es igual a 12 y si la curva de frecuencias absolutas satisface la relación :
f ( x ) = - ( x – 12 ) 2 + 70 . Reconstruir la distribución y graficar.
7. Los siguientes datos corresponde a las calificaciones de 60 alumnos de un curso de matemáticas: H4 x 100 = 85 ; H3 x 100 = 70 y H2 x 100 = 60 ; el límite inferior del 2º intervalo es 5 y el límite inferior del tercer intervalo es 9 . Complete la tabla de frecuencias. Interprete la tabla.
8. Los siguientes datos corresponde al peso en libras de 56 trabajadores de una empresa:167 154 134 175 184 158 175 120 115 125 136 146 148 134 126 143 178 163 152 134 145 168 129 132 118 154 115 127 135 167 183 174 156 162 165 169 170 154 160 145 134 156 166 145 134123 145 167 156 133 155 143 166 148 125 153.Construir una tabla de frecuencias utilizando intervalos cerrados por ambos lados. Interprete la tabla de frecuencias y haga el grafico correspondiente.
9. Los siguientes datos corresponde a 64 de alumnos del curso de matemáticas de los cuales 25 son mujeres, 42 del curso de estadística, de los cuales 12 son mujeres y 32 del curso de computación I , de los cuales 18 son mujeres. Haga una tabla para presentar los datos y grafique.
10. Complete la siguiente tabla de distribución de frecuencias, correspondiente a las calificaciones de 60 alumnos del curso de estadística.
Yi-1-Yi Hi x100 ni Yi hi Ni Hi hix100 12 0.20
05 6009 70
85
Totales
11. El peso en gramos de 30 objetos de un mismo tipo son los siguientes : 21.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 11.2 23.9 26.8 22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2 08.3 21.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1
a. Construir una tabla de frecuencias de 6 intervalos de clase. b. Calcular el porcentaje de objetos cuyo peso sea 21.5 gr. o más. c. Calcular el peso debajo del cual se encuentran el 25% de los objetos.
13. Las puntuaciones de un tes aplicado a un grupo de trabajadores de una empresa se tabularon en una distribución de frecuencias de 6 intervalos de igual amplitud. La marca de clase del segundo intervalo es 25 y el límite superior del quinto intervalo es 60, si las 4 primeras frecuencias relativas porcentuales son respectivamente de 15, 20, 35 y 14 y si el 94% de las puntuaciones son menores que 60. Elabore la tabla de frecuencias e indique el porcentaje de trabajadores que tienen entre 38 y 53 puntos.
CAPITULO III
MEDIDAS DE TENDENCIA CENTRAL PARA
EL ANALISIS DE LOS DATOS
MEDIDAS DE CENTRALIZACIÓN
Las Medidas de Centralización o de Tendencia Central son parámetros estadísticos que
expresan en forma resumida un conjunto de datos. Estos parámetros a través de sus
propiedades y sus definiciones hacen posible el análisis de un conjunto de datos.
3. EL PROMEDIO O MEDIA ARITMÉTICA
3.1. PROMEDIO PARA DATOS ORIGINALES: Se denomina datos originales a
un conjunto de datos de cualquier variable y copiados de cualquier manera. La
fórmula para su cálculo es:
Donde xi: Observaciones o Datos
n: N° de datos
Ejemplo: Los siguientes datos corresponde al ingreso de 8 padres de los alumnos de
ingeniería Informática: 1200, 900, 1250, 1350, 800, , 750, 1200, 1300. Encontrar el
ingreso promedio
soles
El ingreso económico promedio de 8 padres de familia es 1093.75 soles.
3.2. PROMEDIO PARA DATOS TABULADOS
3.2.1 Promedio para datos tabulados no agrupados en intervalos
(Variable Discreta)
FORMULA:
Ejemplo: Se tomarán los datos de la tabla N° 6
Xi ni
46 847 10
48 16 49 14 50 12 51 9 52 6
Total 75
Reemplazamos los valores en la fórmula:
El N° promedio de trabajadores por empresa es aproximadamente 49
3.2.2. Promedio para datos tabulados agrupados en intervalos (Variable
Continua)
FORMULA: yi : Puntos medios del
intervalo
Ejemplo: Se tomarán los datos de la tabla N° 7
Ingreso Económico
yi ni
454.5 - 587.5 521 5 587.5 – 720.5 654 5 720.5 – 853.5 787 10 853.5 – 986.5 920 13 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5
1053 1186 1319
16 85
Total 62
El ingreso económico promedio de los 80 padres de familia es de 950.03 soles.
3.2. LA MODA (Md)
La Moda en un conjunto de observaciones, viene a ser el valor de la
variable que se presenta con más frecuencia en la distribución de datos
3.2.1. MODA PARA DATOS CUANTITATIVOS:
2.1.1. Moda para Datos Originales
Ejemplo N° 1: Los siguientes datos corresponde a los ingresos económicos
de 10 padres de familia. Encontrar la moda.
970, 930, 860, 1040, 1020, 1380, 1410, 900, 1040, 1240
La moda es: Md = 1040
Ejemplo N° 2: Ingresos económicos de 8 trabajadores. Encontrar la moda.
1200, 1050, 1200, 910, 1300, 1550, 1420, 960
Estos datos no tienen moda.
Ejemplo N° 3: corresponde a los pesos de 10 alumnos:
65, 54, 72, 60, 58, 54, 66, 70, 58
Md1 = 54
Md2 = 58
Un conjunto de datos puede tener una moda o más de una moda o también no
tener ninguna moda.
3.2.2. Moda para Datos Tabulados
3.3.2.1 Moda para datos tabulados no agrupados en intervalos
(Variable Discreta)
FORMULA:
Donde: xj es el valor de la variable que corresponde a la máxima frecuencia
absoluta.
Ejemplo: Tomamos los datos de la tabla N° 5
Xi ni
46 8 47 10 48 16 49 14 50 12 51 9 52 6
Total 75
La Moda será el valor de la variable que corresponde a la máxima frecuencia
absoluta (n4 =16), en este caso Md = 48
El resultado significa que es más frecuente encontrar empresas con 48
trabajadores
3.3.2.2. Moda para datos tabulados agrupados en intervalos
(Variable Continua)
FORMULA:
Donde: nj = máxima frecuencia absoluta
nj-1 = frecuencia absoluta anterior a nj
nj+1 = frecuencia absoluta posterior a nj
yj-1 = límite inferior del intervalo que se encuentra en la misma fila
de nj
c = Amplitud del intervalo
Ejemplo: Vamos a tomar los datos de la tabla N° 7
Ingreso Económico
ni
454.5 – 587.5 5 587.5 – 720.5 5 720.5 – 853.5 10 853.5 – 986.5 13 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5
16 8 5
Total 62
De acuerdo a la teoría:
nj = 15 yj-i = 986.5
nj-1 = 13 c = 133
nj+1 = 8
Reemplazando valores en la fórmula se tiene:
Los sueldos o ingresos económicos más frecuente de 62 trabajadores
encuentran alrededor de 1016.06 soles.
3.2.2. MODA PARA DATOS CUALITATIVOS:
La moda estará dada por la categoría de la variable que corresponde a la
máxima frecuencia absoluta.
Ejemplo: Tomaremos los datos del cuadro N° 1
NIVEL DE INSTRUCCIÓN n %
Primaria
Secundaria
Sup. No Universitaria
Sup. Universitaria
2
11
42
15
2.86
15.71
60.00
21.43
Total 70 100.00
Li LsMe
50% 50%
La máxima frecuencia es 42, por lo tanto, la moda es la categoría superior no
universitaria, es decir: Md = Sup. No Universitaria.
3.3. LA MEDIANA
Es el valor que divide a la totalidad de datos, ordenados en forma creciente o
decreciente, en dos partes iguales, de tal manera que el 50% de los datos se encuentren a
la izquierda de la mediana y el otro 50% a la derecha de la mediana.
La mediana se aplica en lugar del promedio, cuando la variabilidad de los datos es muy
marcada. La mediana también se aplica a datos cualitativos ordenados de acuerdo a
rangos.
3.3.1. MEDIANA PARA DATOS CUANTITATIVOS:
3.3.1.1. Mediana para Datos Originales
Se presentan dos caso:
a. Cuando el N° de datos es Par
Se ordenan los datos en forma creciente o decreciente y se toma el promedio
de los dos valores del centro.
Ejemplo: Los siguientes datos corresponde a las edades de 10 ingenieros:.
50, 22, 61, 30, 55, 42, 46, 35, 38,28
Ordenamos en forma creciente:
22, 28, 30, 35, 38, 42, 46, 50, 55, 61
El 50% de los ingenieros tienen una edad máxima de 40 años
b. Cuando el N° de datos es Impar
Ejemplo: Los siguientes datos corresponde al nº de trabajadores de 9 empresas
63, 56, 94, 32, 58, 41, 90, 45, 104
Ordenamos de forma creciente
32, 41, 45, 56, 58, 63, 90, 94, 104
Se toma el valor del centro: Me = 58
El 50% de empresas tienen un número máximo de 58 trabajadores
3.3.1.2. Mediana para Datos Tabulados
a. Mediana para datos tabulados no agrupados en intervalos
1° Cuando
FORMULA: Me = xj
Donde:
xj : Es el valor de la variable que se encuentra en la misma fila de Nj
Nj : Frecuencia absoluta acumulada inmediatamente mayor que
Nj-1 : Frecuencia absoluta acumulada anterior a Nj
Ejemplo: Tomamos los datos de la tabla N° 6
Xi ni Ni
46 8 8 47 10 18 48 16 34 49 14 48 50 12 60 51 9 69 52 6 75
Total 75
Procedimiento:
1°
2°
3° efectivamente
4°
Por lo tanto: Me = 49
50% de las empresas tienen como máximo 49 trabajadores.
2° Cuando
FORMULA:
Ejemplo: Los siguientes datos corresponden al N° de hijos de 54 familias
Número de hijos Xi
ni Ni
1 5 52 10 153 12 274 15 425 8 506 4 54
Total 54
Procedimiento:
1°
2°
3° efectivamente
4°
5°
Reemplazando valores:
El 50% de las familias tienen como máximo aproximadamente 4 hijos.
b. Mediana para datos tabulados agrupados en intervalos
1° Cuando
FORMULA:
Donde: yj-1 = límite inferior del intervalo que se encuentra en la misma fila
de Nj
c = Amplitud del intervalo
Nj = frecuencia absoluta acumulada inmediatamente mayor que
Nj-1= frecuencia absoluta acumulada anterior a Nj
Ejemplo: Vamos a tomar los datos de la tabla N° 7
Ingreso Económico
ni Nj
454.5 – 587.5 5 5 587.5 – 720.5 5 10 720.5 – 853.5 10 20 853.5 – 986.5 13 33 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5
16 8 5
49 57 62
Total 62
procedimiento:
1°
2° Nj= 33
3° efectivamente
4°
5° c = 133
Reemplazando valores se tiene:
El 50% de trabajadores tienen un ingreso máximo de 966.04 soles.
2° Cuando
FORMULA:
Ejemplo: Los siguientes datos corresponden al peso en kilos de 120 alumnos.
Peso ni Ni
30 –33 10 1034 – 37 20 3038 – 41 30 6042 – 45 30 9046 – 49 16 10650 – 53 14 120Total 120
Procedimiento:
1°
2°
3° efectivamente
4°
5°
Reemplazando valores se tiene:
El 50% de los alumnos tienen un peso máximo de 42 kilogramos.
3.3.2. MEDIANA PARA DATOS CUALITATIVOS:
Es factible obtener la mediana cuando se tiene datos cualitativos, susceptibles de
ordenarse de acuerdo a rangos o categorías.
Li LsQ2
50%
75%
Q1 Q3
25%
Ejemplo: Tomaremos los datos de la tabla N° 01
Nivel de Instrucción ni Ni
Primaria 2 16Secundaria 11 54Superior No Universitaria 42 72Superior Universitaria 15 80
Total70
Procedimiento:
1°
2°
3°
La mediana esta dada por la categoría que se encuentra en la misma fila de Nj. Por lo
tanto, la mediana está dada por la categoría Secundaria.
El 50% de los padres de familia de los estudiantes tienen un grado de instrucción
máximo de secundaria.
3.4. CUARTILES (Qi)
Son medidas de posición que dividen a la distribución de datos ordenados, en cuatro
partes iguales, de tal manera que:
3.4.1. CUARTILES PARA DATOS ORIGINALES
Una ves ordenados los datos tales que . El cuartil i-ésimo
(i = 1, 2 o 3), es el valor del dato que ocupa la posición en el
ordenamiento.
Si la posición resulta entera, se hace una interpolación lineal entre los dos
valores correspondientes a las dos observaciones entre las cuales se encuentra
la fracción.
Ejemplo N° 1Tomaremos los datos, ordenados previamente, correspondiente a los ingresos
económicos semanales de 7 padres de familia.
200, 225, 300, 420, 450, 460, 540
x1 x2 x3 x4 x5 x6 x7
- Cálculo del Primer Cuartil (Q1): i =1, n =7
, posición entera, luego Q1 = x2 = 225.
El 25% de los padres de familia, es decir 20 de ellos, tienen un ingreso
máximo de 225 soles.
- Cálculo del Segundo Cuartil (Q2): i =2, n =7
, posición entera, luego Q2 = x4 = 420.
El 50% de los padres de familia, es decir 40 de ellos, tienen un ingreso
máximo de 420 soles.
- Cálculo del Tercer Cuartil (Q3): i =3, n =7
, posición entera, luego Q3 = x6 = 460.
El 75% de los padres de familia, es decir 60 de ellos, tienen un ingreso
máximo de 460 soles.
Ejemplo N° 2Tomaremos los datos, ordenados previamente, correspondiente a los ingresos
semanales de 10 padres de familia
200, 225, 300, 420, 450, 460, 540, 550, 600, 650
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
- Cálculo del Primer Cuartil (Q1): i =1, n =10
, posición no entera, luego Q1 estará entre las
observaciones x2 y x3.
Estableciendo proporciones se tiene:
El 25% de los padres de familia tienen un ingreso máximo de 281.25 soles.
- Cálculo del Segundo Cuartil (Q2): i =2, n =10
, posición no entera, luego Q2 estará entre las
observaciones x5 y x6.
Entonces:
El 50% de los padres de familia tienen un ingreso máximo de 455 soles.
- Cálculo del Tercer Cuartil (Q3): i =3, n =10
, posición no entera, luego Q3 estará entre
las observaciones x8 y x9.
Entonces:
El 75% de los padres de familia tienen un ingreso máximo de 562.5 soles.
3.4.2. CUARTILES PARA DATOS TABULADOS
FORMULA:
Donde i, tomará valores de 1 a 3, según se trate de calcular el 1°, 2° ó tercer
cuartil.
Ejemplo Para la tabla N° 7, calcular el primer, segundo y tercer cuartil.
- Cálculo del primer cuartil (Q1): i = 1
Procedimiento: Es parecido al de la mediana
1°
2° Nj = 20
3° Nj-1 = 10
4° yj-1 = 720.5
5° C = 133
Ingreso Económico
ni Ni
454.5 – 587.5 5 5 587.5 – 720.5 5 10 720.5 – 853.5 10 20 853.5 – 986.5 13 33 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5
16 8 5
49 57 62
Total 62
Reemplazando valores en la fórmula:
El 25% de los trabajadores, es decir 16, tienen un ingreso máximo de 787 soles.
- Cálculo del segundo cuartil (Q2): i = 2
Procedimiento:
1°
2° Nj = 33
3° Nj-1 = 20
4° Yj-1 = 853.5
5° C = 133
Reemplazando valores en la fórmula:
El 50% de los trabajadores, es decir 31, tienen un ingreso máximo de 966.04 soles.
- Cálculo del tercer cuartil (Q3): i = 3
Procedimiento:
1°
2° NJ = 48
3° Nj-1 = 33
4° Yj-1 = 986.5
5° C = 133
Reemplazando valores en la fórmula:
El 75% de los trabajadores, es decir 47, tienen un ingreso máximo de 1106.2 soles.
3.5. MEDIDAS DESCRIPTIVAS DE RESUMEN UTILIZANDO CUARTILES
Llos cuantiles son útiles no sólo como medidas de posición no central; también sirven
para elaborar otras medidas importantes de tendencia central y dispersión.
Describiremos dos medidas basadas en los cuarteles: el Eje Medio y el Rango
intercuartílico.
3.5.1. EL EJE MEDIO:
Es el promedio de los cuarteles Q1 y Q3 de un conjunto de datos:
EJE MEDIO =
Para el ejemplo anterior: Eje Medio =
Eje Medio = 941.25
3.5.2. RANGO INTERCUARTILICO (R.I.)
El rango intercuartílico ( llamado también dispersión media) es la diferencia entre los
cuartiles Q1 y Q3 de un conjunto de datos.
Para el ejemplo anterior R.I. = Q3 – Q1
R.I. = 302.50
Esta medida considera la dispersión en el 50% medio de los datos y, por ello, de
ninguna manera se ve influenciada por la posible ocurrencia de valores extremos.
3.6. DIAGRAMA DE BLOQUES Y LINEAS:
Para identificar y describir las principales características de los datos, el método de
“Análisis Exploratorio de Datos “ utiliza medidas de tendencia central y de dispersión
que tienen la propiedad de resistencia; es decir, estadísticos que son relativamente
insensibles a cambios extremos de algunos de los datos. La mediana, el eje medio y el
rango intercuartílico son tres estadísticos resistentes de uso común. Si se combinan
estas medidas resistentes con información referente a los extremos, se logra entonces
una mejor idea de la forma de la distribución de datos. Cinco son los números de
resumen:
Li , Q1 , Mediana , Q3 , Ls
Para los datos originales que sirvieron para el construir la tabla Nº 7 se tiene:
Li = 456 , Q1 = 790 , Me = 950 , Q3 = 1092.50 , Ls = 1384
El diagrama de bloques y líneas ofrece una representación gráfica de los datos a través
de los cinco números de resumen. En la siguiente figura se ilustra este diagrama.
Ingreso
1400,00
1200,00
1000,00
800,00
600,00
400,00
3.7. DECILES (Di)
Son medidas de posición que dividen a la distribución de datos, previamente ordenados,
en 10 partes.
El decil i –ésimo es el valor del dato que ocupa la posición en el
ordenamiento.
Si la posición no resulta entera, se hace una interpolación lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentre la posición.
3.7.1. DECILES PARA DATOS ORIGINALES
EJEMPLO : Tomaremos los datos correspondiente al ingreso semanal,
previamente ordenados. de 9 trabajadores de una empresa
320, 330, 345, 410, 460, 580, 900, 940, 940
x1 x2 x3 x4 x5 x6 x7 x8 x9
Calcular el Decil 2 y el Decil 6.
Decil 2 (D2): i = 2, n = 9
: Posición entera
Por tanto el decil 2 es el dato que ocupa la segunda posición: D2 = 330.
El 20% de los trabajadores tienen un ingreso máximo de 330 soles.
Decil 6 (D6): i = 6, n = 9
: Posición entera
Por tanto el decil 6 es el dato que ocupa la sexta posición: D6 = 580.
El 20% de los trabajadores tienen un ingreso máximo de 580 soles..
3.7.2. DECILES PARA DATOS TABULADOS
FORMULA:
Donde i, tomará valores de 1 a 9, según se trate del primero, segundo, hasta el
noveno decil.
Ejemplo Para la tabla N° 7, calcular el cuarto decil.
Procedimiento:
1°
2° Nj = 33
3° Nj-1 = 20
4° Yj-1 = 853.5
5° C = 133
Reemplazando valores en la fórmula:
El 40% de los trabajadores, tienen un ingreso máximo de 902.61 soles.
3.8. PERCENTILES
Para el cálculo de los centiles o percentiles (Pi) se procede de manera similar y las
fórmulas correspondientes son:
- Para datos originales:
- Para datos tabulados:
Ingreso Económico
ni Ni
454.5 – 587.5 5 5 587.5 – 720.5 5 10 720.5 – 853.5 10 20 853.5 – 986.5 13 33 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5
16 8 5
48 56 62
Total 62
3.9. TASAS DE CRECIMIENTO ( T.C.):
Sirve para encontrar el crecimiento de una cantidad de un periodo t con respecto a
un periodo t-1. Se calcula con la siguiente fórmula:
T.C.=
Ejemplo: Calcular las tasas de creciminto para los siguientes datos, correspondiente al
N° de alumnos matriculados de una universidad, durante el periodo 2005 – 2010
Año N° alumnosTasa (%)
xi
2005 1250 -2006 1500 20.002007 1850 23.332008 2120 14.592009 2430 14.622010 2870 18.11
3.10. LA MEDIA GEOMÉTRICA (MG)
Se usa cuando hay que promediar tasas de crecimiento, razones o proporciones.
3.10.1. Media geométrica Simple:
FORMULA:
Ejemplo:
Calcular la media geométrica para los siguientes datos, correspondiente al N°
de alumnos matriculados de una universidad, durante el periodo 2000 – 2005.
Año N° alumnosTasa (%)
xiLog xi
2005 1250 - -2006 1500 20.00 1.3010302007 1850 23.33 1.3679152008 2120 14.59 1.1640552009 2430 14.62 1.1649472010 2870 18.11 1.257918
6.255865
Reemplazando en la fórmula:
El incremento promedio anual de alumnos matriculados es del 17.83%.
3.10.2. Media geométrica Ponderada:
FORMULA:
Consideremos los datos de la tabla N° 7 para ilustrar el cálculo.
Ingreso Económico
Yi ni
ni logYi
454.5 - 587.5 521 5 13.584189 587.5 – 720.5 654 5 14.077889 720.5 – 853.5 787 10 28.959747 853.5 – 986.5 920 13 38.529242 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5
1053 1186 1319
16 8 5
48.358854 24.592678 15.601224
Total 62 183.703823
Reemplazando valores en la fórmula:
MG = Antilog
MG = 918.26
El ingreso económico promedio de los 62 trabajadores es de 918.26 soles.
En este caso la medida más adecuada para el análisis de los datos es el
Promedio.
Ejercicios
Para los ejercicios del capitulo anterior, calcular el promedio, moda ,mediana,
Cuartiles,y Media Geométrica ponderada.
CAPITULO IV
MEDIDAS DE DISPERSION
4.1. MEDIDAS DE DISPERSION
Son medidas o parámetros estadísticos que sirven de complemento a las medidas de
centralización en el análisis de los datos. Es necesario tener una idea del grado de
concentración o dispersión de las observaciones alrededor de una medida de tendencia
central.
4.2. RECORRIDO O RANGO: (R)
Viene a ser la diferencia entre el valor mayor y el valor menor de los datos, es decir:
R = Xmáx – Xmín
Ejem. Tomaremos los datos originales que dieron origen a la tabla Nº 7.
R = 1384 – 456 = 928 soles.
El recorrido a rango como estadígrafo de posición es muy limitado, porque sólo
considera los valores extremos de la distribución de datos y no nos indican nada sobre el
comportamiento de los datos.
4.3. VARIANZA: ( σ2 )
Es el promedio de las desviaciones con respecto al promedio elevado al cuadrado. La
varianza no tiene interpretación .
4.3.1. Varianza para datos originales:
Ejem. Los siguientes datos corresponde a los ingresos económicos por semana de 12
trabajadores de una empresa
Xi: 600, 650, 200, 710, 300, 550, 420, 460, 450, 540, 850, 225.
Para poder aplicar la fórmula, primero debemos encontrar el promedio y luego
aplicar la fórmula de la varianza.
1°
2°
4.3.2 DESVIACIÓN ESTANDAR:
Se define como la raíz cuadrada de la varianza.
Es uno de los estadígrafos de dispersión de mayor uso, en el cual las unidades de la
variable ya no están elevadas al cuadrado.
En general los estadígrafos de dispersión se usan para comparar dos o más
distribuciones de datos poblaciones. A mayor dispersión entre los valores o
elementos de una población, le corresponde un valor mayor para el estadígrafo de
dispersión.
EJEMPLO: Encontrar la desviación estándar para el caso anterior.
La dispersión promedio que existe entre los datos y la media aritmética es de
186.89 soles.
4.3.3 VARIANZA PARA DATOS TABULADOS
a. Varianza para Datos Tabulados No Agrupados en Intervalos:
FORMULA:
EJEMPLO: Tomaremos los datos de la tabla N° 6
Xi ni xini
46 8 368 8.0656 64.5248 47 10 470 3.3856 33.856 48 16 768 0.7056 11.2896 49 14 686 0.0256 0.3584 50 12 600 1.3456 16.1472 51 9 459 4.6656 41.9904 52 6 312 9.9856 59.9136
Total 75 3663 228.08
Las dos primeras columnas corresponden a la tabla N° 6. Las tres
columnas siguientes son columnas de trabajo para llegar a obtener la
varianza.
La columna de trabajo N° 3 sirve para encontrar el promedio.
Reemplazando valores de la tabla se tiene:
***
Desviación estándar:
La variabilidad promedio del N° de trabajadores por empresa es
aproximadamente de dos trabajadores
b. Varianza para Datos Tabulados Agrupados en Intervalos:
FORMULA:
EJEMPLO: Consideremos los datos de la tabla N° 07 para ilustrar el
cálculo.
Ingreso Económico
yi ni yini
454.5 – 587.5 521 5 2605 920343.5722 587.5 – 720.5 654 5 3270 438175.6132 720.5 – 853.5 787 10 7870 265795.3084 853.5 – 986.5 920 13 11960 11725.2076 986.5 – 1119.51119.5 – 1252.51252.5 – 1385.5
1053 16 16848 159035.20861186 8 9488 445446.04351319 5 6595 816822.9819
Total 62 58636 2930667.8712
Reemplazando los valores en la fórmula:
Desviación estándar:
-
La variación promedio que existe entre los ingresos económicos de los trabajadores
con respecto al ingreso promedio (945.74 soles) es de 217.41 Soles.
4.3.4. PROPIEDADES DE LA VARIANZA
a. La varianza de una constante es cero:
V ( K ) = 0
b. La varianza del producto de una constante por una variable, es igual :
V ( K.X ) = K2 X
c. La varianza de la suma de una variable más una constante, es igual a la varianza de
la variable: V ( X + K ) = V(X)
4.3.5. COEFICIENTE DE VARIACIÓN (C.V)
Es una medida de variabilidad relativa que se utiliza para comparar dos o mas
distribuciones de datos cuando las unidades de medida de las variables están
expresadas en diferentes unidades a escalas de medida, por ejemplo los sueldos
expresados en soles y dólares.
Si comparamos dos distribuciones, será más homogénea, la que presente menor
coeficiente de variación.
FORMULA:
EJEMPLO: Calcular el coeficiente de variación para el ejemplo anterior.
Los ingresos de los trabajadores tienen una dispersión relativa de 23.37 %.
4.3.6. MEDIDAS DE ASIMETRIA
COEFICIENTES DE ASIMETRÍA (As)
Miden el grado de deformación horizontal de la distribución de frecuencias.
Indices de Asimetría de Pearson (As). Se definen:
El primero es el más usual.
Interpretación1. Si la distribución es Simétrica, entonces As = 0, en este caso coinciden
.
2. Si la distribución es Asimétrica Positiva ó sesgada a la derecha si: As > 0.
3. Si la distribución es Asimétrica Negativa ó sesgada a la izquierda si: As < 0.
EJEMPLO: Tomando los datos de la tabla N° 7 correspondiente a los ingresos
económicos de los trabajadores de 62 empresas.
Los ingresos tienen una distribución asimétrica positiva
4.3.7. ESTADIGRAFOS DE APUNTAMIENTO O KURTUOSIS
La kurtuosis viene a ser el grado de apuntamiento de una distribución.
a. Si una distribución tiene una elevada punta o apuntamiento, se llama Leptokúrtica.
b. Si la distribución se asemeja a una distribución normal se llama Mesocúrtica
c. Si la distribución es aplanada se denomina Platikúrtica.
El estadígrafo para analizar el apuntamiento es:
Coeficiente de Kurtuosis: a =
Donde σ4 = ( σ2 )2
m4 =
- Si a = 3 : La distribución es Mesokúrtica ( Normal).
- Si a > 3 : La distribución es Leptokúrtica ( apuntada)
- Si a < 3 : La distribución es Platikúrtica ( aplanada )
Ejem. Para los datos de la tabla Nº 6
M4 = 19.45254
σ4 = 9.2416
Reemplazando valores: a =
a = 2.10
Como a = 2.10 es menor que 3, la distribución es platikúrtica (aplanada).
Ejercicios.
Para las tablas de frecuencias del capitulo II calcular: La varianza, la desviación
estándar, el coeficiente de variación, el apuntamiento y la asimetría.
CAPITULO V
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
5.1 Generalidades
Cuando en un trabajo de investigación se observa simultáneamente dos
variables en cada elemento de análisis, entonces estamos en el campo
de las estadísticas bidimensionales, cuya agrupación, da origen a las
distribuciones de frecuencias bidimensionales.
En el caso bidimensional puede darse el caso de que se tenga:
1. Las dos variables discretas
2. Una variable discreta y la otra continua
3. Las dos variables continuas.
5.2.DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES DE
VARIABLE DISCRETA
Una tabla bidimensional de frecuencias se construye colocando en el margen
izquierdo los distintos valores de X y en el margen superior los distintos valores de
Y, generándose una tabla de p filas y q columnas.
5.2.1. Frecuencias Marginales
Las frecuencias marginales de la variable X, se obtiene sumando las frecuencias
absolutas que figuran en cada fila ( línea horizontal)
ni. =
Las frecuencias marginales de la variable Y, se obtiene sumando las frecuencias
absolutas que figuran en cada columna ( línea vertical)
n.j =
Ejem. Los siguientes datos corresponde al número de computadoras (X) y al
número de Ing. Informáticos (Y) de 60 empresas tomada de la ciudad de chiclayo:
X 7 6 4 6 7 4 7 5 6 4 6 7 3 7 6 5 6 4 7 5 7 6 3 7 5 5 7 6 4 6 7 5
Y 4 4 2 3 3 1 4 3 5 3 3 3 1 2 2 2 4 2 6 3 3 3 2 6 4 3 4 4 3 2 5 3
X 6 4 6 6 5 5 7 6 7 5 6 7 6 7 7 7 7 6 5 7 7 3 7 7 6 4 7 6
Y 3 1 5 4 4 2 4 3 5 3 5 5 3 4 5 6 6 3 3 5 6 2 5 6 5 2 6 6
1. Elabore tablas de frecuencias absolutas bidimensionales para analizar los datos e
interprete las tablas.
2. Encuentre el promedio y la varianza para la variable X y Y
TABLA N º 8
Distribución de Frecuentas Absolutas Bidimensionales (nij) de 60 empresas por número de computadoras (X) según número de Ing. Informáticos (Y) por empresa
X : computadoras
Y : Ing. Informáticos
ni. = Frecuencias marginales de la variable X
n.j = Frecuencias marginales de la variable Y
INTERPRETACIÓN:
n23 = 2: 2 empresas tienen 4 computadoras y 3 Ing. Informáticos
n45 = 4 : 4 empresas tienen 6 computadoras y 5 Ing. Informáticos
Frecuencias Marginales:
- De la variable X
n2. = 7 : 7 empresas tienen 4 computadoras
Y
X 1 2 3 4 5 6ni.
3 1 2 - - - - 3
4 2 3 2 - - - 7
5 - 2 6 2 - - 10
6 2 7 4 4 1 18
7 1 3 5 6 7 22
n.j 3 10 18 11 10 8 60
n4. = 18 : 18 empresas tienen 6 computadoras
- De la variable Y
n.3 = 18: 18 empresas tienen 3 Ing. Informáticos
n.5 = 10: 10 empresas tienen 5 Ing. Informáticos
TABLA N º 9
Distribución de Frecuentas Relativas Bidimensionales (hij) de 60 empresas por número de computadoras (X) según número de Ingenieros Informáticos (Y) por
empresa
Y
X 1 2 3 4 5 6hi.
3 0.02 0.03 - - - - 0.05
4 0.03 0.05 0.03 - - - 0.11
5 - 0.03 0.10 0.03 - - 0.16
6 - 0.03 0.12 0.07 0.07 0.02 0.31
7 - 0.02 0.05 0.08 0.10 0.12 0.37
h.j 0.05 0.16 0.30 0.18 0.17 0.14 1.00
Interpretación:
h23 = 0.03 : El 0.08 por uno de empresas tienen 4 computadoras y 3 Ing. Informáticos
h45 = 0.07: El 0.07 por uno de empresas tienen 6 computadoras y 5 Ing. informáticos
Frecuencias Relativas Marginales:
- De la variable X:
h2. = 0.11: El 0.11 por uno de empresas tienen 4 computadoras
h4. = 0.31: El 0.31 por uno de empresas tienen 6 computadoras
- De la variable Y:
h.3 = 0.30 :El 0.30 por uno de empresas tienen 3 Ing. Informáticos
h.5 = 0.17: En el 0.17 por uno de empresas tienen 5 Ing. Informáticos
TABLA N º 10
Distribución de Frecuentas Absolutas Bidimensionales Acumuladas (Nij) de 60 empresas por número de computadoras (X) según número de ingenieros (Y) por
empresa
Interpretación:
N23 = 10: 10 empresas tienen de 3 a 4 computadoras y de 1 a 3 Ing. Informáticos
N35 = 20: 20 empresas tienen de 3 a 5 computadoras y de 1 a 5 Ing. Informáticos
Y
X 1 2 3 4 5 6
3 1 5 5 5 5 5
4 3 8 10 10 10 10
5 3 10 18 20 20 20
6 3 12 27 31 35 36
7 3 13 31 42 52 60
TABLA N º 11
Distribución de Frecuentas Relativas Bidimensionales Acumuladas (Hij) de 60 empresas por número de computadoras (X) según número de Ingenieros
Informáticos (Y) por empresa
Interpretación :
H25 = 0.16: El 0.16 por uno de empresas tienen de 3 a 4 computadoras y de 1 a 5
ingenieros informáticos
H34 = 0.32: El 0.32 por uno de empresas tienen de 3 a 5 computadoras y de 1 a 4 ing.
Informáticos
Y
X 1 2 3 4 5 6
3 0.02 0.08 0.08 0.08 0.08 0.08
4 0.05 0.13 0.16 0.16 0.16 0.16
5 0.05 0.16 0.29 0.32 0.32 0.32
6 0.05 0.19 0.44 0.54 0.61 0.63
7 0.05 0.21 0.51 0.69 0.86 1.00
TABLA Nº 12
Distribución de Frecuentas Relativas Bidimensionales Porcentuales (hijx100) de 60 empresas (X) según número de Ing. Informáticos (Y) por empresa
Y
X 1 2 3 4 5 6hi.
3 2 3 - - - - 5
4 3 5 3 - - - 11
5 - 3 10 3 - - 16
6 - 3 12 7 7 2 31
7 - 2 5 8 10 12 37
h.j 5 16 30 18 17 14 100
Interpretación:
h34 = 3: El 3% de empresas tienen 5 computadoras y cuatro ingenieros informáticos
h45= 7: El 7% de empresas 6 computadoras y 5 ingenieros informáticos
TABLA N º 13
Distribución de Frecuentas Relativas Bidimensionales Porcentuales Acumuladas (Hijx100) de 60 empresas según Numero de computadoras (X)y número de Ing.
Informáticos ( Y) empresa
Y
X 1 2 3 4 5 6
3 2 8 8 8 -
4 5 13 16 16 -
5 5 16 29 32 -
6 5 19 44 54 0.61 0.63
7 5 21 51 69 0.86 1.00
Interpretación:
H22x100 = 13: El 13% de empresas tienen de 3 a 4 computadoras y de uno a dos ing.
Informático.
H43x100 = 44: El44 % de empresas tienen de 3 a 6 computadoras y de uno a tres Ing.
Informáticos
2. Calculo del promedio
a. PARA X1 :
El número promedio de computadoras por empresa es de aproximadamente 6
PARA Y:
El número promedio de ing. Informáticos por empresa es de aproximadamente 4
CALCULO DE LA VARIANZA
a. PARA X :
Reemplazando valores:
b. PARA Y:
Reemplazando valores:
5.3. DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES DE VARIABLE
CONTINUA Y VARIABLE DISCRETA
Las variables bidimensionales (X,Y) conservan la misma nomenclatura y las tablas
tienen la misma forma.
Ejem. Los siguientes datos corresponde al ingreso mensual (X) y al Nº de hijos (Y)
De 60 trabajadores de una empresa:
X 1095 1060 1450 1520 1320 1580 1600 1080 1150 1200 1190 1475
Y 5 3 3 2 3 3 1 4 3 4 3 2
X 1515 1100 1420 1580 1280 1200 1550 1170 1800 1020 1525 1435
Y 3 4 3 2 4 3 2 4 1 4 6 2
X 932 1180 1365 932 1415 1553 1225 1650 1181 932 1429 1300 1030
Y 3 5 4 2 5 4 4 1 5 6 5 3 6
X 1620 1485 1305 1425 1390 1450 1380 1700 1515 1200 1320 1650 1650
Y 2 5 4 6 4 2 6 2 5 3 6 2 3
X 1380 1540 1120 1305 1750 1300 1250 1415 1670 1380
Y 3 3 4 5 2 4 3 4 2 3
1. Construir tablas de frecuencias bidimensionales, utilice intervalos cerrados, interprete los datos
2. Calcular el promedio y la varianza para la variable X y Y
Solución:
Variable Ingresos X:
Ls = 1800 -Li = 932R = 868m = 2.5m = 7
C = R/m C = 868/7 C = 124
Variable Nº de hijos: Li = 1, Ls = 6
Tabla Nº 14Distribución de frecuencias absolutas bidimensionales (nij) de ingresos económicos (X) y Número de hijos (Y) de 60 trabajadores de una empresa
Yi 1 2 3 4 5 6 ni.[Xi-1 – Xi] Xi 932 - 1056 994 1 1 1 - 2 51057 - 1180 1118.5 - - 2 4 2 - 81181 - 1304 1242. - - 5 4 1 101305 - 1428 1366.5 - - 4 4 2 3 131429 - 1552 1490.5 - 5 3 - 3 1 121553 - 1676 1614.5 2 4 2 1 - - 91677 - 1800 1738.5 1 2 3n.j 3 12 17 14 8 6 60
n52 = 5 : 5 trabajadores tienen un ingreso de 1429 a 1552 soles y tienen 2 hijos por trabajador.n4. = 13: 13 trabajadores tienen un ingreso de 1305 a 1428 solesn.5 = 8 : 8 trabajadores tienen 5 hijos cada unon3. = 10 Vrs. Y3 = 1242: 10 trabajadores tienen un ingreso promedio de 1242 soles.
El resto de tablas de frecuencias bidimensionales se construyen de manera similar a las tablas anteriores.2. Variable X: a. Promedio:
=
El ingreso promedio mensual de los 60 trabajadores de la empresa es 1362.24 solesb. Varianza:
σ = 203.84La variación promedio que existe entre los ingresos de los trabajadores con respecto al ingreso promedio es de 203.84 soles.5.4. EJERCICIOS:1. Los siguientes datos corresponde la edad y al número de hijos de 50 padres:Edad: 34 33 44 40 33 50 32 44 36 43 38 39 42 39 31 28 28 21 44 Hijos 3 2 5 4 3 6 3 4 3 5 3 2 4 5 3 2 2 1 5
Edad: 46 32 46 34 30 34 42 39 48 36 32 39 30 45 26 40 38 47 36 60 Hijos 6 2 6 3 2 3 4 3 5 3 2 3 2 3 2 3 2 5 4 6
Edad: 40 45 33 32 45 28 25 35 48 40 30 Hijos: 3 2 2 3 4 2 2 3 4 3 2
Construya tablas bidimensionales para analizar los datos.
2. Encuentre el promedio y la varianza para cada una de las variables del problema anterior.
3. Los siguientes datos corresponde a los ingresos económicos mensuales de 52 trabajadores de una empresa y a los años de servicio:
Ingresos: 750 693 789 890 1240 945 1320 1200 1350 780 865 946 1050 830Años de 4 3 4 4 6 5 8 6 7 4 5 6 6 5Servicio
Ingresos : 1560 1450 1000 1230 1500 1680 984 960 1380 1400 1600 1284Años de : 10 12 10 14 12 16 10 9 13 20 18 14
Ingresos : 1320 1245 965 845 760 896 1300 840 730 645 798 1620 1740 840Años de : 15 17 12 14 11 10 18 9 8 4 6 22 24 8Servicio
Ingresos : 1350 1000 1120 1040 1080 1600 1750 1800 960 830 977 1120Años de 16 10 14 12 11 22 20 28 20 12 14 15ServicioConstruir tablas de frecuencias bidimensionales para analizar los datos.
4. Para la tabla de frecuencias absolutas bidimensionales del problema anterior, calcular el promedio , la varianza y la desviación estándar.
CAPITULO VI :
PROBABILIDADES
6.1. Experimento aleatorio: Es aquel cuyos resultados dependen del azar.
6.2. Punto muestral: Viene a ser cada uno de los resultados de un
experimento.
Ejem. Cuando se lanza una moneda, existen dos puntos maestrales: cara, sello.
6.3. Espacio muestral (S): Viene a ser todos los resultados posibles de un
experimento.
Ejem. Si se arroja una moneda: S = { C, S }
Ejem. Si arrojamos dos monedas: S = { CC, CS, SC, SS }
Ejem. Si arrojamos un dado: S = { 1, 2, 3, 4, 5, 6 }
6.4. Suceso o evento: Viene a ser un subconjunto del espacio muestral y -
puede ser
Simple o compuesto.
6.4.1. Evento Simple: Es aquel que consta de un solo punto muestral.
6.4.2. Evento compuesto: Es aquel que consta de dos o más puntos maestrales.
Ejem. Si arrojamos un dado: S = { 1, 2, 3, 4, 5, 6 }
Sucesos o eventos simples: E1 = {1} E2 = {2} E3 = {5}
Sucesos o eventos compuestos: E1 = {1, 3}; E2 = {1, 4, 5}
A los sucesos o eventos se les puede simbolizar con cualquier letra.
6.5. Sucesos mutuamente excluyentes: Dos sucesos A y B son mutuamente excluyentes si: AWB = Ø . Ejem. A = {1, 3, 5}; B = {2, 4, 6}, entonces c se puede ver, la intersección es igual al conjunto nulo o vacío
6.6. Sucesos complementarios: Dos sucesos son complementarios, cuando
la ocurrencia de uno implica la no ocurrencia del otro.
Ejem. Si arrojamos un dado: S = {1, 2, 3, 4, 5, 6}.
y tenemos los eventos E = { 1 , 2, 3, 4 } y E´ = { 5, 6 }, entonces estos
eventos son complementarios.
6.7. Definición de probabilidad: Si un experimento puede ocurrir en “n”
posibles resultados mutuamente excluyentes y si “m “de estos resultados
constituyen el evento E, entonces, la probabilidad del evento E esta dado por: P
(E) = m/n.
La probabilidad del complemento del evento esta dado por:
P (E´) = 1 – P (E)
Ejem. Si arrojamos un dado: S = {1, 2, 3, 4, 5, 6} y sea los eventos:
E1 = {1, 2}, entonces P (E1) = 2/ 6 = 0.5
E2 = {3, 4, 5, 6}, entonces P (E2) = 4/6 = 0.67.
Ejem. Se tiene 6 Ing Informáticos , 8 ing. Civiles y 2 ing. Industriales
a. ¿Cuál es la probabilidad de elegir un ing. Informático?
b. ¿Cuál es la probabilidad de elegir un Ing. Civil?
c. ¿Cuál es la probabilidad de elegir un Ing. Informático
Solución:
a. P (H) = 6/16 = 0.38
b. P ( A ) = 8/ 16 = 050
c. P ( V ) = 2/16 = 0.13
6.8. Definición: Sea “S” un espacio muestral y sea “E” un evento cualquiera,
perteneciente al espacio muestral “S”, entonces se cumple que:
a. 0 ≤ P ( E ) ≤ 1
b. P ( S ) = 1
La parte a, significa que toda probabilidad de un evento siempre varía entre cero
y uno.
La parte b, significa que siempre la probabilidad de un espacio muestral es igual
a la unidad
6.9. Reglas de Probabilidad:
a. Regla de la Adición o de la Suma: Sean A y B dos eventos pertenecientes al
espacio muestral “S “, entonces se cumple que :
P(AUB) = P(A) + P(B) – P(AWB)
Ejem. Se tiene 5 ing. Informáticos, 7 ing. Civiles y 2 ing. que tienen ambos
títulos. Se elige un ing. Cuál es la probabilidad de que el ing. elegido sea
Informático o civil?
Solución: Con una letra simbolizaremos a los eventos:
Ing. Infórmaticos: I , Ing. Civiles: C , entonces aplicamos la regla:
P(I U C) = P(I) + P(C) – P(IWC) P(G U F) = 5/14 + 7/14 – 2/14 = 10/14 = 0.71
Ejem. En la Facultad de Ingeniería de una universidad se tiene 20 Ingenieros:
14 son Ing. Informáticos de los cuales 11 tienen grado de maestría y 3 tienen
doctorado . 6 son Ing. Industriales, de los cuales 4 tienen grado de maestría y
2 tienen doctorado. Se elige un Ing. al azar ¿Cual es la probabilidad de que el
ing. elegido sea Ing. Informático o que tenga grado de maestría?
Solución: Los datos vamos a colocar en una tabla de dos entradas puesto que
en el problema tenemos dos variables (especialidad y grado académico ).
Luego con una letra vamos a simbolizar a los eventos.
Especialidad
Grado Académico
TOTALMaestría
(C)
Doctorado
(D)
Ing. Infórmático
(A)11 3 14
Ing. Industrial
(B)4 2 6
TOTAL15 5 20
P(A U C) = P(A) + P(C) – P(AWC)
P( AUB ) = 14/20 + 15/20 – 11/20 = 18/20 = 0.90
b. Regla de la Adición para sucesos independientes: Sean A y B dos eventos
independientes pertenecientes al espacio muestral “S”, entonces se cumple que:
P(AUB) = P(A) + P(B).
Ejem. En el aula A de una universidad se tiene 18 alumnos varones y 8 alumnas
mujeres. Se elige un alumno ¿ cual es la probabilidad de que el alumno elegido sea
hombre o mujer?.
Solución:
Sea H alumnos hombres y M alumnas mujeres, entonces: P(HUM) = P(H) + P (M) ,
reemplazando valores:
P(HUM) = 18/26 + 8/26 = 1.
c. Regla de la Probabilidad Condicional
Sean A y B dos eventos pertenecientes al espacio muestral “S” , con P(B) > 0 , entonces se cumple que: P(A/B) = P(AWB)/ P(B).
Ejem. Tomaremos los datos de la tabla anterior. ¿Cuál es la probabilidad de que el
profesional elegido sea Ing. Industrial dado que tenga grado de doctor?
P(B/D) = P(BWD)/P(D) = = 2/5 = 0.40
d. Regla de la multiplicación:
Sean A y B dos eventos pertenecientes al espacio muestral “S” , entonces se cumple
que : P(AWB) = P(A) P(B/A).
Ejem. En un curso de programación, 22 alumnos aprobaron el curso y 10
desaprobaron. Se extraen dos alumnos, uno tras otro y sin reposición ¿Cuál es la
probabilidad de que el primer alumno elegido y el segundo hayan aprobado el curso:
Sea A , alumnos aprobados y sea D, alumnos desaprobados, entonces
P(A1WA2) = P(A1) P(A2/A1), remplazando valores se tiene:
P(VWH) = 22/32* 21/31 = 462/992 = 0.47
e. Regla de la multiplicación para sucesos independientes
Sean A y B dos sucesos independientes pertenecientes al espacio muestral “S”,
entonces se cumple que : P(AWB) = P(A) P(B)
Ejem Se tiene dos grupos de alumnos, A y B que llevan el curso de matemáticas. En el
grupo A se tiene 32 alumnos aprobados y 10 desaprobados. En el grupo B se tiene 36
alumnos aprobados y 8 desaprobados . Se extrae un alumno del grupo A y luego un
alumno del grupo B . Cual es la probabilidad de que el primer alumno elegido haya
sido un aprobado y el segundo un desaprobado.
Solución:
Sea a , alumnos aprobados y sea d, desaprobados, entonces P(aWd) = 32/40* 8/44 =
256/1760 = 0.15.
f. Regla de Bayes
Sean A1, A2, A3, ……., An , n eventos pertenecientes al espacio muestral “S”y sea B
un evento cualquiera, con P(B) > 0, entonces se cumple que :
Ejem. En una empresa A se tiene 10 obreros , 18 empleados y 5 ejecutivos. En la sala
B , se tiene 13 obreros ,25 empleados y 4 ejecutivos. En la empresa C, se tiene 8
obreros, 14 empleados y 3 ejecutivos Se elige una empresa y se extrae un trabajador, el
mismo que resulto que era empleado. Cual es la probabilidad de que el trabajador
elegido proceda de la empresa:
a. A
b. B
c. C
Solución
Simbolizaremos con O, a los obreros; con E, a los empleados y con Ej. a los
ejecutivos. Ahora aplicamos la fórmula:
a)
b)
c)
6.10. EJERCICIOS
1. Construir el espacio muestral para los siguientes experimentos:a. Cuatro electores elegidos al azar deben expresar su opinión favorable o contraria a un determinado proyecto.b. Un experimento consiste en seleccionar tres libros de un proceso de elaboración y observar si son defectuosos o no.c. Se lanzan dos dadosd. Se lanzan cuatro monedas.
2. Con respecto a los electores del problema Nº 1 (a),cual es la probabilidad de obtener:
a. Exactamente 3 electores con opiniones favorables sobre el proyecto.b. A lo mas dos electores con opiniones favorables sobre el proyecto.
2. Se realizo una evaluación de su estado nutricional de 56 alumnos de un centro educativo , obteniéndose los siguientes resultados: El estado nutricional de 20 alumnos fue normal, de los cuales 6 tuvieron una edad de 6 a 7 años y 8 de 8 a 9 años. 17 presentaron desnutrición leve, de los cuales 4 presentaron edades de 10 a 11 años y 7 de 8 a 9 años. 12 presentaron desnutrición moderada, de los cuales 5 presentaron edades de 6 a 7 años y 3 de 10 a 11 años. 7 presentaron desnutrición severa, de los cuales 3 presento edades de 6 a 7 años y 2 de 8 a 9 años. Se elige un alumno, cual es la probabilidad de que:
a. Presente desnutrición leve o que tenga una edad de 6 a 7 años.b. Presente desnutrición severa y que tenga una edad de 8 a 9 años.c. Presente desnutrición moderada dado que tenga una edad de 10 a 11
años.
3. Se lanzan dos dados, cual es la probabilidad de que:a. La suma que aparece sobre los dados sea un número par.b. El primer resultado sea un número menor que 3 y el segundo un número
impar.
4. El centro educativo 1021, cuenta con 10 profesores de física y 08 de química. El centro educativo 1130, cuenta con 14 profesores de física y 6 de química. Se traslada un docente del C.E. Nº 1021 al centro educativo Nº 1130 y luego se extraen 2 docentes de este centro educativo, uno tras otro y sin reposición. Cuál es la probabilidad de que:
a. El primer docente extraído sea de física y el segundo también.b. El primer docente extraído sea de la especialidad de física y el segundo
de ciencias químicas.
5. En un aula A hay 16 alumnos de la especialidad de primaria, 12 de secundaria y 7 de inicial. En el aula B, 14 son de la especialidad de primaria, 8 de secundaria y 5 de inicial. En el aula C, 20 son de la especialidad de primaria, 12 de secundaria y 8de inicial. Se elige un aula y se extrae un alumno, el mismo que fue de la especialidad de secundaria. Cuál es la probabilidad de que provenga:
a. Del aula A.b. Del aula B.c. Del aula C.
6. En el aula A estudian, 25 alumnos hombres y 16 mujeres. En el aula B estudian 35 Hombres y 26 mujeres. Se elige al azar una aula y se extrae un alumno. Cuál es la probabilidad de que el alumno elegido sea hombre.
7. La probabilidad de que a lo mas 20 alumnos aprueben el curso de estadística Aplicada es 0.35. Cual es la probabilidad de que aprueben el curso más de 20 alumnos.
8. Se lanza un dado normal. Se gana 30 dólares si el resultado es un número par o Divisible por 3. ¿Cuál es la probabilidad de ganar?...
9. Se lanza un dado normal. Dado que el resultado es un número impar. ¿Cuál es la probabilidad de que sea mayor que 3?.
10. Una urna A contiene 18 libros buenos y 2 con fallas. Una urna B, contiene 24
libros buenos y 4 con fallas. Se elige una urna y se extrae un libro. Si ellibro elegido es bueno se recibe un premio de 30 dólares. Cuál es la probabilidadde ganar el premio?.
11. Se tiene 4 aulas, en el aula Nº 1, se tiene 22 alumnos aprobados y 8 desaprobados enun curso de matemáticas. En el aula Nº 2, se tiene 18 alumnos aprobados y 6 desaprobados. En el aula Nº 3 , se tiene 15 alumnos aprobados y 10 desaprobados. En el aula Nº 4, se tiene 26 aprobados y 15 desaprobados. Se elige una aula y se extrae un alumno, el mismo que resultó ser un aprobado. Cuál es la probabilidad de que el alumno provenga:
a. Del aula Nº 1.b. Del aula Nº 2.c. Del aula Nº 3.
CAPITULO VII
DISTRIBUCIONES DE PROBABILIDAD
7.1. DISTRIBUCIÓN BINOMIAL
Es una distribución de variable discreta que trata de una serie de pruebas
repetidas e independientes y donde a cada resultado se le puede clasificar
(arbitrariamente) en dos categorías mutuamente excluyentes: éxitos y fracasos,
como por ejemplo macho o hembra, alivio o enfermedad.
A la probabilidad de éxito se representa como “p” y a la probabilidad de fracaso
como “q”, de tal manera que p + q = 1
La función de probabilidad es la siguiente:
Promedio: = np
Varianza : σ2 = npq
Ejemplo 1. Una familia tiene 8 hijos ¿Cuál es la probabilidad de que la familia
tenga:
a. Exactamente 5 hijos varones
b. Por lo menos 6 hijos varones
c. A lo mas 2 hijos varones
SOLUCIÓN
N = 8
S = (Espacio muestral de acuerdo al sexo)
Entonces:
P(H)=
P(M)=
a) X = 5
Reemplazando valores:
b) X = 6, 7, 8
c) X = 0, 1, 2
Ejemplo 2. El 20% de los alumnos que llevan un curso de matemáticas están
desaprobados. Se elige una muestra de 12 alumnos. Cual es la probabilidad de
que:
a) Exactamente 3 alumnos estén desaprobados
b) Por lo menos 10 alumnos estén desaprobados
c) A lo más 1 alumno haya sido desaprobado
SOLUCIÓN
p = 20% = 0.20 alumnos desaprobados
q = 80% = 0.80 alumnos aprobados
n = 12
a) x = 3
b) x = 10, 11, 12
7.2. DISTRIBUCIÓN DE POISSON
Es una distribución discreta, donde la ocurrencia de los eventos son
independientes. Esta distribución se emplea cuando recuentan los eventos o
cantidades, distribuidas al azar en espacio o tiempo.
Si X es el número de ocurrencias de algún evento aleatorio en un intervalo de
espacio o tiempo (o algún volumen de materia), la probabilidad de que X ocurra
esta dada por:
, x = 0, 1, 2, 3
Donde:
= es el N° promedio de ocurrencias del evento aleatorio dentro del intervalo de
espacio o tiempo (volumen)
e = 2.7183 es una constante
Media = λ Varianza = λ
EJEM. Parte de una vía pavimentada por una compañía A recientemente, tuvo
en promedio, dos fallas por Km. Después de haber sido utilizada durante 6
meses . Si esta compañía sigue pavimentando el resto de la vía,
a. Cual es la probabilidad de que se presenten 3 fallas en cualquier Km. de la
vía después de haber tenido un tráfico durante 6 meses?.
b. Cual es la probabilidad de que se presenten 3 o más fallas en cualquier km de
la via?
SOLUCIÓN
a) , x = 3
f (x) =
f(x) = 0.18
b)
En este caso vamos ha resolver por el complemento
f(x) = 1 - P(xi ) donde xi = 0,1,2
f(x) = 1 – [
f(x) = 0.05
Para resolver este problema también se puede hacer uso de la tabla de la distribución de
POISSON acumulada
EJEM 2.
Un líquido contiene ciertas bacterias cuyo promedio es de 4 por cm3. Hallar la probabilidad de
que no exista bacteria alguna:
a) En 0.5 cm3
b) En 1 cm3
SOLUCIÓN
por cm3 de liquido
a) En 0.5 cm3 por 0.5 cm3 de líquido
X = 0
f (X = 0) =
f (X = 0) = 0.1353
b) En 1 cm3 , x = 0
f (X = 0) =
f (X = 0) = 0.0183
7.3. DISTRIBUCIÓN NORMAL
Es una distribución de variable continua muy utilizada en trabajo de
investigación, fue descubierta por GAUSS. Se conoce también con el nombre de
Curva de GAUSS y presenta las siguientes características:
1. La mayor frecuencia se ubica en el centro
2. El promedio (u), la moda (Md) y la mediana (Me) coinciden
3. Es una curva simétrica, donde e área o probabilidad bajo la curva es igual a 1
o al 100%
4. Los extremos de la curva se acercan al eje horizontal pero no cortan a este
eje.
uMdMe
0.50.5
La función de probabilidad de a curva esta dada por:
donde
En la ecuación, los dos parámetros de la distribución son, la media (u) y la desviación
estándar ( ). y son constantes con valores de 3.1416 y 2.7183 respectivamente.
Los parámetros u y determinan completamente la distribución normal. Es decir para
cada valor diferente de u y se tiene una distribución normal diferente. Valores
diferentes de u trasladan el gráfico de la distribución al lo largo del eje X. Los valores
de determinan el grado de aplanamiento o levantamiento (apuntamiento de la
gráfica). Ejm.
u1 u2 u3
1
2
3
Usando la tabla correspondiente de la distribución normal se puede comprobar que:
El área comprendida entre es aproximadamente 68.26% del área total.
El área comprendida entre es aproximadamente 95.4% del área
total.
El área comprendida entre es aproximadamente 99.7% del área
total.
La esperanza y la varianza de una variable aleatoria con distribución normal es:
7.4. DISTRIBUCIÓN NORMAL ESTÁNDAR O TIPIFICADA
Esta distribución se obtiene creando una variable aleatoria y haciendo u=0 y
, entonces:
Para calcular el área entre dos puntos Zo y Z1 es necesario calcular la siguiente integral:
Pero como existen tablas que proporcionan los resultados de las integraciones, no es
necesario realizar la integración.
La tabla que utilizaremos nos da las áreas bajo la curva normal a partir del centro de la
curva hacia la derecha y como la curva es simétrica para valores negativos de Z se
leerán con valores positivos en la tabla correspondiente de la distribución normal. (La
tabla se encuentra en el apéndice )
Ejem.
1. a) Calcular:
Graficamos la curva y marcamos los puntos Z=0 y Z=2 y luego sombreamos
el área comprendida entre los dos puntos.
La tabla de la distribución normal de una probabilidad de 0.4772.
47720.
3Z 2Z 1Z 0Z 3Z2Z1Z
b) Calcular:
0.4951 – 0.3944 = 0.1007
c) Calcular
0.5 – 0.4265 = 0.0736
d) Calcular:
393420.
3Z 2Z 1Z 0Z 3Z2Z1Z
49510.
?
0.4842 – 0.3289 = 1.1553
d) Calcular:
0.5 – 0.4878 = 0.0122
Ejem. El coeficiente de inteligencia de un grupo de alumnos tiene aproximadamente
una distribución normal con un puntaje promedio de 100 y una desviación estándar
de 10.5. Encontrar:
a) La proporción de alumnos con coeficientes de inteligencia mayores que
120
48420.
b) La proporción de alumnos con coeficientes de inteligencia menores que
115
c) La proporción de alumnos con coeficientes de inteligencia entre 114 y
124
d) Si el Nº total de alumnos es 180, Cual es el número de alumnos que
tienen coeficiente de inteligencia entre 114 y 124?
SOLUCIÓN
Datos:
= 100
σ = 10.5
a) X = 120
Sabemos que
Remplazando valores se tiene:
0.5 – 0.4713 = 0.0287
b) X = 115
0.5
Z=
Z = 1.43
0.5 + 0.4236 = 0.9236
c) X1 = 114 y X2 = 124
z1 = z2 =
z1 = 1.33 z2 = 2.29
0.5
0.4082
0.4890
0.4890 - 0.4082 = 0.0808
d) Ya sabemos que la probabilidad ante 114 y 124 años es 0.0808, entonces el N° de
alumnos será: 180x 0.0808 = 14.54
7.5. DISTRIBUCION CHI- CUADRADO
Es una prueba no parametrica que se utiliza para determinar la asociación entre
variables. La fórmula es la siguiente:
2 =
Ejem. A un grupo de 132 alumnos se les enseñó la matemática por tres métodos I, II y
III. Por el método I se enseño a 35 alumnos de los cuales 25 aprobaron. Por el método II
se enseño a 47 alumnos, de los cuales 12 desaprobaron. Por el método III se enseño a 50
alumnos , de los cuales 42 desaprobaron . Pruebe la hipótesis para verificar si los
métodos de enseñanza están asociados al rendimiento de los alumnos. Utilice α = 5%.
Solución
Vamos ha elaborar la tabla de datos:
Métodos de enseñanza Aprobados
fo fe
Desaprobados
fo fe
Total
I 25 27.05 10 7.95 35
II 35 36.32 12 10.68 47
III 42 38.64 8 11.36 50
TOTAL 102 30 132
Hipótesis :
Ho: Los métodos de enseñanza no están asociados al rendimiento de los alumnos
H1: Los métodos de enseñanza si están asociados al rendimiento de los alumnos
Reemplazando en la formula:
2 =
2 = 2.18 Valor calculado
Ahora encontramos el valor en la tabla de la chi cuadrado para poder comparar con el
valor calculado. Si el valor calculado es mayor que el valor de la tabla, rechazamos la
hipótesis nula ( Ho), Caso contrario aceptamos Ho .
Valor de la tabla: 20.95,(c-1)(f-1) = 2
0.95,1x2 = 20.95,2 = 5.99
Conclusión: Aceptamos Ho
7.6. EJERCICIOS
1. Se lanza 5 veces una moneda . Cual es la probabilidad de obtener:
a. Exactamente 3 caras
b. Por lo menos 3 caras
c. A lo mas dos caras
2. Se lanza un dado 7 veces. Cual es la probabilidad de obtener exactamente 4 veces el
Nº 6.
3. Un estudio de las corrientes de carga en sistemas de alimentación de computadoras en
instalaciones reveló que el 10% de las instalaciones tenían razones de corriente neutral a
corriente de carga total altas. Se escoge una muestra aleatoria de 5 sistemas de
alimentación de computadoras de un gran número de instalaciones , Que probabilidad
hay de que:
a. Exactamente tres tengan una relación de corriente neutral a corriente de carga total
alta.
b. Por lo menos 3 tengan una relación alta
c. Menos de 3 tengan una relación alta.
4. Calcule la media, la varianza y la desviación estándar de una variable aleatoria
binomial con n=20 y p = 0.6. Construya el intervalo ± 2σ.
5. El Nº de grietas por plancha de concreto hechas con cierto tipo de mezcla de
cemento tiene una distribución de probabilidad de poisson aproximada. Además , se
sabe que el Nº medio de grietas por plancha de concreto es 2.5.
a. Calcula la media y la desviación estándar .
b. Cual es la probabilidad de que una plancha de concreto escogido al azar tenga
exactamente 5 grietas.
c. Calcule la probabilidad de que una plancha de concreto escogido al azar tenga dos o
más grietas.
6. Un ingeniero de transito desea diseñar un sistema de control de tráfico. Estima que el
número medio de automóviles por minuto que llegan a una intersección es de 2. Que
probabilidad hay de que:
a. En un minuto dado, el número de llegadas sea de tres o más.
b. El número de llegadas sea a lo más 4.
7. En una central Telefónica se recibe en promedio 3 llamadas por minuto. Calcular la
probabilidad de que ocurran
a. Exactamente 4 llamadas en un minuto
b. A lo más 5 llamadas en un minuto.
c. Por lo menos 4 llamadas en un minuto.
8. Supongamos que el coeficiente de fricción para cierto sistema de copiado tiene una
distribución normal , con media igual a 0.55 y desviación estándar igual a 0.013.
Durante el funcionamiento del sistema, se mide el coeficiente de fricción en un
momento escogido al azar.
a. Calcular la probabilidad de que el coeficiente de fricción esté entre 0.53 y 0.56
b. Es verosímil observar un coeficiente de fricción por debajo de 0.50?
9. Una compañía de comunicación por cable ha determinado que el número de
interruptores terminales de de botón solicitados diariamente tiene una distribución
normal con una media de 200 y una varianza de 2500.
a. En que porcentaje de los días la demanda será de menos de 90 interruptores.
b. En que porcentaje de los días la demanda estará entre 225 y 275 interruptores.
10. Encontrar:
a. P ( Z 2.15 )
b. P ( Z ≥ - 1.95 )
c. P ( -0.95 Z – ¼ 1.75 )
d. P ( 2Z 2.86)
e. P ( | Z | 1.26
f. P ( -0.75 Z/ 2 1.05 )
BIBLIOGRAFIA
1. Canavos, G. “Probabilidad y Estadística. Aplicaciones y Métodos”
McGraw Hill, 1992.
2. Bury, K. Distribuciones Estadísticas para Ingenieros, Cambridge
University Press, New York, 1999.
3. Devore, J. “Estadística y Probabilidad para Ingeniería y Ciencias”
International Thomson Editores, 1998.
4. Hoog, R. y Craig, J. “Introduction to Mathematical Statistics”, Prentice
Hall, 1995.
5. Meyer, P., Probabilidad y Aplicaciones Estadísticas, Addison Wesley
Iberoamericana, Wilgminton, Delaware, 2002.
6. Miller, J.E. Freund y Johnson, R. Probabilidad y Estadística para
Ingenieros, Prentice Hall Hispanoamericana, Mexico, 1992.
7. Montgomery, D. y Runger, G. “Probabilidad y Estadística Aplicada a la
Ingeniería”, McGraw Hill ,1997.
8. Raymond, H., y Myers, S. “Probabilidad y Estadística para Ingenieros".
Sexta edición. 1998
9. Ross, S. Introducción a la Probabilidad y estadística para Ingenieros,
John Wiley and Sons, New york, 2000.
10.Walpole, R. “Estadística Matemática con Aplicaciones”. Prentice Hall
Hispanoamericana S.A, 1998.