Estadistica i

149
UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO ESCUELA DE POST GRDO MAESTRIA EN DOCENCIA UNIVERSITARIA E INVESTIGACION EDUCATIVA TALLER DE ESTADISTICA MAG. MAX CORREA CABANILLAS .

Transcript of Estadistica i

Page 1: Estadistica i

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO

ESCUELA DE POST GRDO

MAESTRIA EN DOCENCIA UNIVERSITARIA E

INVESTIGACION EDUCATIVA

TALLER DE ESTADISTICA

MAG. MAX CORREA CABANILLAS

.

Page 2: Estadistica i

CONTENIDO

CAPITULO I: BASE TEORICA DE LA ESTADISTICA pag.

1.1. Definición de estadística 2

1.2. Población 2

1.3. Clases de población 2

1.4. Muestra 2

1.5. Unidad de análisis 3

1.6. Dato estadístico 3

1.7. Información 3

1.8. Indicador 3

1.9. Parámetro 3

1.10. Estadígrafo 3

1.11. Variable 4

1.12. Clasificación de las variables 4

1.12.1. Por su naturaleza 4

1.12.2. De acuerdo a la función que desempeña en un problema de investigación 4

1.13. Escalas de medición 4

1.14. Clasificación de la estadística 5

CAPITULO II: PRESENTACION DE DATOS 7

2.1. Encuesta 8

2.2. Tablas estadísticas 10

2.2.1. Cuadros estadísticos 10

2.2.1.1. Partes de un cuadro estadístico 10

2.2.1.2 Tipos de cuadros estadísticos 10

2.2.2. Tablas de distribución de frecuencias 14

2.2.2.1. De variable discreta 14

2.2.2.2. De variable continua 17

2.3. Representaciones gráficas 21

2.3.1. Construcción de Gráficos 21

Page 3: Estadistica i

2.3.2. Partes de un gráfico 21

2.3.3. Tipos de gráficos. 21

2.4. Ejercicios 27

CAPITULO III: MEDIDAS DE TENDENCIA CENTRAL 29

3.1. Medidas de Centralización 30

3.2. El Promedio 30

3.2.1. Promedio para datos originales 30

3.2.2. Promedio para datos tabulados 30

3.3. La Moda 32

3.3.1. Moda para Datos Cuantitativos 32

a. Moda para datos Originales 32

b. Moda para datos Tabulados 32

3.3.2. Moda para datos Cualitativos 34

3.4. La Mediana 35

3.4.1. Mediana para Datos Cuantitativos 35

a. Mediana para datos originales 35

b. Mediana para datos tabulados 36

3.4.2. Mediana para datos Cualitativos 40

3.5. Cuartiles 41

a. Cuartiles para datos Originales 42

b. Cuartiles para datos Tabulados 44

3.6. Medidas Descriptivas de Resumen Utilizando Cuartiles 46

3.6.1. El Eje Medio 46

3.6.2. Rango Intercuartilico 47

3.7. Diagrama de Bloques y Líneas 47

3.8. Deciles 48

a. Deciles para datos Originales 48

b. Deciles para Datos Tabulados 49

3.9. Percentiles 50

3.10. Tasas de crecimiento 51

3.11. La Media Geométrica 51

3.11.1. Media Geométrica Simple 51

3.11.2. Media Geométrica Ponderada 52

Page 4: Estadistica i

CAPITULO IV: MEDIDAS DE DISPERSION 54

4.1. Medidas de dispersión 55

4.2. Recorrido o Rango 55

4.3. La Varianza 55

4.3.1. Varianza para Datos Originales 55

4.3.2. Desviación Estándar 56

4.3.3. Varianza para datos tabulados 56

a. Para datos tabulados no agrupados en intervalos 56

b. Para datos tabulados agrupados en intervalos 57

4.3.4. Propiedades de la varianza 58

4.4. Coeficiente de variación 58

4.5. Medidas de Asimetría 59

4.6. Estadígrafos de apuntamiento 60

CAPITULO V: DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES 61

5.1. Generalidades 62

5.2. Distribución de Frecuencias Bidimensionales de Variable Discreta 62

5.3. Distribución de Frecuencias Bidimensionales de Variable Continua- Discreta69

5.4. Ejercicios. 72

CAPITULO VI: PROBABILIDADES 73

6.1. Experimento Aleatorio 74

6.2. Punto muestral 74

6.3. Espacio Muestral 74

6.4. Suceso o evento 74

6.5. Sucesos Mutuamente Excluyentes 74

6.6. Sucesos complementarios 74

6.7. Definición de Probabilidad 74

6.8. Definición 75

6.9. Reglas de Probabilidad 75

6.10. Ejercicios 80

Page 5: Estadistica i

CAPITULO VII: DISTRIBUCIONES DE PROBABILIDAD 82

7.1. Distribución Binomial 83

7.2. Distribución de Poisson 85

7.3. Distribución Normal 87

7.4. Distribución Normal Estándar 89

7.5. Distribución Chi- Cuadrado 95

7.6. Ejercicios 96

Page 6: Estadistica i

CAPITULO I: BASE TEORICA DE LA ESTADÍSTICA

Page 7: Estadistica i

1.1. DEFINICION DE ESTADISTICA:

Es la ciencia que nos proporciona los métodos más eficientes para la recolección,

organización, presentación, análisis e interpretación de un conjunto de datos, con la

finalidad de describirlos o de realizar generalizaciones válidas mediante técnicas

adecuadas.

1.2. POBLACION

Viene a ser el conjunto de personas, animales u objetos que poseen una o más

características comunes observables de naturaleza cualitativa o cuantitativa que se

pueden medir en ellos. La población está integrada por la totalidad de unidades de

análisis. Una población debe estar definida en el espacio y en el tiempo.

Ejemplo: Alumnos del Ciclo 2005-I, de la Facultad de Ciencias Físicas y

Matemáticas de la U.N.P.G.

1.3. CLASES DE POBLACION

Se tiene dos clases de población:

1.3.1. POBLACION FINITA

Es aquella que tiene un número limitado de elementos.

1.3.2. POBLACION INFINITA

Es aquella que tiene un número ilimitado de elementos.

Generalmente en las investigaciones no se conoce el número de elementos

de la población.

1.4. MUESTRA

Una muestra viene a ser una pequeña parte de la población y que se utiliza para

estudiar las características de la misma.

Una muestra se usa por dos razones: mayor economía y menor tiempo en la

realización de la investigación.

Generalmente las poblaciones de estudio son grandes lo cual dificulta la

investigación, en consecuencia se utiliza una muestra como medio de estudio.

Una muestra debe ser seleccionada de tal manera que sea representativa de la

población.

Page 8: Estadistica i

1.5. UNIDAD DE ANALISIS

Viene a ser cada elemento que será estudiado en un población, sobre los cuales se

va a obtener datos.

En el ejemplo anterior, la unidad de análisis viene a ser cada alumno.

1.6. DATO ESTADISTICO

Es el resultado de medir una característica observable de una unidad estadística

1.7. INFORMACION

Es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay

información sin datos.

1.8. INDICADOR

Es una cantidad o valor que permite conocer el estado de un hecho. Son elementos

característicos que describen una situación permitiendo su análisis. Como ejemplo

de indicador tenemos a las Tasas, medidas de resumen, etc.

1.9. PARAMETRO

Se denomina parámetro a una medida descriptiva que resume una característica de

la población, tal como la media () o la varianza (2), calculada a partir de los

datos observados en la población.

1.10. ESTADIGRAFO

Se denomina estadígrafo a una medida descriptiva que resume una característica de

la muestra, tal como la media ( X ) o la varianza (S2)calculada a partir de los datos

observados de una muestra.

1.11. VARIABLE

Es una característica que puede tomar diferentes valores. Las variables son

características observables, susceptibles de adoptar distintos valores o ser

expresadas en varias categorías.

La variable adquiere un valor determinado en cada unidad de análisis y que puede

ser medido o cuantificado.

Page 9: Estadistica i

1.12. CLASIFICACION DE LAS VARIABLES

1.12.1 De acuerdo a su naturaleza: las variables de clasifican en:

a. CUALITATIVAS:

Son aquellas que se expresan mediante palabras y pertenecen a una de varias

categorías que mutuamente se excluyen. Ejemplo: Sexo, Estado Civil,

Niveles de desnutrición, Grado de instrucción, Zona de residencia, etc.

b. CUANTITATIVAS:

Son aquellas que se expresan numéricamente y dan origen a dos tipos de

variables:

b.1. Variable Discreta:

Es aquella que toma valores enteros o específicos. Ejemplo: Número de

alumnos, Número de docentes, número de trabajadores de una empresa,

etc.

b.2. Variable Continua:

Es aquella que puede tomar cualquier valor dentro de un intervalo dado.

Ejemplo: Ingreso económico, Edad, Talla, peso, Tiempo, etc.

De acuerdo a la función que desempeñan en el planteamiento de un problema de

investigación:

a. Variable Independiente: Es la variable explicativa.

b. Variable Dependiente : Es la variable explicada

1.13. ESCALAS DE MEDICION

Se denomina escala de medición a un instrumento de medida que sirve para

cuantificar las variables.

La escala de medida orientará al investigador para el análisis estadístico que podrá

realizar. Entre las escalas de medición se tiene:

1. ESCALA NOMINAL

Es aquella que tiene como función clasificar las categorías de la variables.

Ejemplo: la variable “Sexo” asigna a las personas dos categorías o modalidades:

“masculino” y “femenino”. Las variables “Estado civil”, “Ocupación”, tienen

categorías o modalidades que son de escala nominal.

Page 10: Estadistica i

2. ESCALA ORDINAL

Es aquella que tiene como función clasificar y ordenar las categorías de las

variables en forma ascendente o descendente.

Ejemplo: “Grado de instrucción”, con sus modalidades: Primaria, Secundaria,

Superior.

Estatus “Socioeconómicos”, con sus modalidades: bajo, medio y alto.

3. ESCALA DE INTERVALO

Es aquella que tiene como función clasificar, ordenar, se puede conocer la

distancia entre dos puntos cualesquiera y además tiene un punto “cero relativo”

como punto de partida.

Ejemplo: la temperatura, si utilizamos las escala centígrada, esta empieza en

cero, pero si utilizamos la escala Fahrenheit, esta empieza en 32 grados. Como

otros ejemplo tenemos las calificaciones de un test, la medición de actitudes, etc.

4. ESCALA DE RAZON

Tiene como función clasificar, ordenar, se puede conocer la distancia entre dos

puntos y nos permite realizar las cuatro operaciones, además tiene un punto

“cero absoluto” como punto de partida. En esta escala se puede establecer

relaciones de igualdad. Los valores de esta escala se obtienen en general por

mediciones. Ejemplo: Talla, Peso, Edad, Ingresos económicos, volumen, etc.

1.14. CLASIFICACION DE LA ESTADISTICA:

De acuerdo a las funciones que realiza la estadística se clasifica en:

1.14.1. ESTADISTICA DESCRIPTIVA

Es aquella que utiliza un conjunto de métodos estadísticos con la finalidad de

describir (Tablas estadísticas, gráficos) y analizar (Medidas de resumen)

datos. La estadística descriptiva es aplicable a nivel de la población o a nivel

de la muestra.

La estadística descriptiva no intenta realizar generalizaciones.

1.14.2. ESTADISTICA INDUCTIVA O INFERENCIAL

Page 11: Estadistica i

Es aplicable a nivel de muestra y su función es generalizar las características

observadas en la muestra hacia la población. Es decir las conclusiones

obtenidas a partir de una muestra, son validas para toda la población. La

inferencia puede contener conclusiones que pueden no ser ciertas en forma

absoluta, por lo que es necesario que éstos sean dados con una medida de

confiabilidad que es la probabilidad.

Estas dos clases de estadística no son mutuamente excluyentes, ya que para utilizar

los métodos de la inferencia estadística, se requiere conocer los métodos de la

estadística descriptiva.

Page 12: Estadistica i

CAPITULO II: PRESENTACION DE DATOS

2.1. ENCUESTA: Es un instrumento que sirve para la recolección de

datos en un trabajo de investigación por observación.

Una encuesta se elabora teniendo en cuenta los objetivos de

estudio, consecuentemente debe contener las variables de interés.

La siguiente ilustración tuvo como objetivo, identificar los factores

socioeconómicos y culturales de los padres de familia relacionados

con el rendimiento de sus hijos. La encuesta es la siguiente:

DISEÑO DE LA ENCUESTA

Page 13: Estadistica i

Nota: La Encuesta será respondida por el responsable de la familia.

1. Nombres:………………………………………………………………….. . y

apellidos:..............................................................................................

2. Anote el ciclo de estudios de su

hijo: .......................................................................

3. Indique su Estado Civil:

a. Casado (a) ( ) c. Separado (a) ( )

b. Conviviente ( ) d. Divorciado (a) ( )

e. Viuda ( ) f. Madre Soltera ( )

4. Indique La Zona donde reside:

a. Zona Urbana. ( )

b. Zona Urbano Marginal ( )

c. Zona Rural ( )

5. Aspectos Relacionados con la Vivienda:

a. Su vivienda es: 1) Propia ( ) 2. Alquilada ( )

3) Otras Formas:...................................

b. Indique cuantas habitaciones tiene su

vivienda:..........................................

c. ¿En su vivienda existe un ambiente de estudio para su hijo?

Si ( ) No ( )

6. ¿Cuántos hijos tiene?:.............................................

7. Indique cual es su ocupación:

a. Empleado (a) ( ) d. Ama de casa ( )

b. Obrero ( ) e. Otras ( )

c. Trabajador (a) independiente ( )

8. Indique cual es su ingreso económico familiar mensual:

a. Menos de 500 soles ( )

b. de 500 a 700 soles ( )

c. de 701 a 900 soles ( )

d. de 901 a 1100 soles ( )

Page 14: Estadistica i

e. Más de 1100 soles ( )

9. ¿Cuál es la disponibilidad económica diaria del estudiante?

a. Un sol ( )

b. Dos Soles ( )

c. Tres Soles ( )

d. Más de tres Soles ( )

10. Indique su nivel de instrucción

a. Iletrado (a) ( )

b. Primaria ( )

c. Secundaria ( )

d. Superior No Universitaria ( )

e. Superior Universitaria ( )

11.¿Cuántas horas diarias en promedio dedica al estudio su hijo?

a. < 1 hora ( )

b. 1 a 2 horas ( )

c. 2.1 a 3 horas ( )

d. Más de 3 horas ( )

12.¿Cuál fue el rendimiento promedio de su hijo, en el ciclo anterior? (esta

nota será proporcionada por el profesor, del registro de notas)

a. 0 a 10 ( )

b. 11 a 15 ( )

c. 16 a 20 ( )

2.2. TABLAS ESTADISTICAS: Sirven para presentar los datos

estadísticos en filas y columnas, clasificados de acuerdo a las

categorías o indicadores de las variables.

Metodológicamente las tablas estadísticas se clasifican en:

Cuadros Estadísticos y tablas de distribución de frecuencias .

2.2.1. CUADROS ESTADISTICOS: Son arreglos ordenados en filas y

columnas de datos estadísticos de acuerdo a las variables de estudio,

para su interpretación y análisis. Los cuadros estadísticos se elaboran

para presentar los informes de trabajos de investigación.

Page 15: Estadistica i

Los cuadros estadísticos se diseñan teniendo en cuenta los objetivos

específicos de la investigación.

2.2.1.1. PARTES DE UN CUADRO ESTADISTICO: En general se consideran

las siguientes partes:

a. NUMERO: Es el código de identificación que permitirá la ubicación del

cuadro.

b. LUGAR: Se refiere al lugar donde se realizó el trabajo de

investigación

c. TITULO: Indica una descripción resumida del contenido de la tabla y

contendrá la variable o variables de estudio consideradas en la tabla.

d. CUERPO DEL CUADRO: En esta parte se registrará los datos

producto del procesamiento de las encuestas.

e. FUENTE: Se considerará cuando los datos se hayan obtenido de

alguna entidad o publicación. Cuando son datos obtenidos directamente

por el investigador (datos de primera mano), no se consignará fuente.

2.2.1.2. TIPOS DE CUADROS ESTADISTICOS:

a. De Variable Cualitativa: Los más usuales son:

a.1. Cuadros Unidimensionales: Se construyen cuando se analiza una

sola variable cualitativa ( Estado Civil, Zona de Residencia,

Ocupación, etc.).

Ejem.

CUADRO Nº 1

ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE

PADRES DE FAMILIA DE LOS ALUMNOS DEL 1º CICLO

SEGÚN GRADO DE INSTRUCCIÓN

NIVEL DE INSTRUCCIÓN Nº %

Primaria

Secundaria

Sup. No Universitaria

Sup. Universitaria

2

11

42

15

2.86

15.71

60.00

21.43

Total 70 100.00

Page 16: Estadistica i

a.2. CUADROS BIDIMENSIONALES: Llamados también de doble

entrada, se construyen cuando se analiza a la vez dos variables

cualitativas. Ejem.

CUADRO Nº 2

ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE

PADRES DE FAMILIA DE LOS ALUMNOS DEL 1º CICLO POR ZONA DE

RESIDENCIA Y NIVEL DE INSTRUCCIÓN

NIVEL DE INSTRUCCION

ZONA DE RESIDENCIA

TOTALUrbana Urbano

Marginal

Rural

Nº % Nº % Nº % Nº %

Primaria - - 1 1.43 1 1.43 2 2.86

Secundaria 3 4.29 6 8.57 2 2.85 11 15.71

Sup. No Universitaria 26 37.14 13 18.57 3 4.29 42 60.00

Sup. Universitaria 12 17.14 3 4.29 - - 15 21.43

TOTAL 41 58.57 23 32.86 6 8.57 70 100.00

También existen cuadros tridimensionales, estos dependen de la naturaleza de

los trabajos de investigación.

b. DE VARIABLE CUANTITATIVA:

b.1. CUADROS UNIDIEMNSIONALES:

Se construyen cuando se analiza una sola variable cuantitativa. (Ingresos

económicos, Rendimiento de alumnos, Peso, Edad,etc.). Ejem.

CUADRO Nº 3

Page 17: Estadistica i

ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE

PADRES DE FAMILIA DE LOS ALUMNOS DEL 1º CICLO SEGÚN

INGRESO ECONOMICO

b.2. CUADROS BIDIMENSIONALES: Se construyen cuando se

analizan a la vez dos variables cuantitativas. Ejem.

CUADRO Nº 4

ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE

PADRES DE FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGÚN

INGRESO ECONOMICO Y RENDIMIENTO DE LOS ALUMNOS

Ingreso

Económico

Rendimiento

Total0 -10 11-15 16-20

Nº % Nº % Nº % Nº %

500 - 700 3 4.29 2 2.85 - - 5 7.14

701 - 900 2 2.86 5 7.14 1 1.43 8 11.43

INGRESO ECONOMICO Nº %

500 – 700

701 – 900

901 – 1100

1101 - 1300

1301 - 1500

5

8

15

25

17

7.14

11.43

21.83

35.71

24.29

TOTAL 70 100.0

0

Page 18: Estadistica i

901 - 1100 4 5.71 8 11.43 3 4.29 15 21.43

1101-1300 4 5.71 21 30.0 - - 25 35.71

1301-1500 2 2.86 14 20.0 1 1.43 17 24.29

Total 15 21.43 50 71.42 5 7.15 70 100

c. DE VARIABLE CUANTITATIVA- CUALITATIVA: Se construyen cuando se

analiza una variable cuantitativa y una cualitativa. Ejem.

CUADRO Nº 5

ESCUELA DE COMPUTACION E INFORMATICA (UNPRG): LAMBAYEQUE

PADRES DE FAMILIA DE LOS ALUMNOS DEL PRIMER CICLO SEGÚN

INGRESO ECONOMICO Y ZONA DE RESIDENCIA

Ingreso

Económico

Zona de Residencia

TotalUrbana Urbano

marginal

Rural

Nº % Nº % Nº % Nº %

500 - 700 - - 1 1.43 4 5.71 5 7.14

701 - 900 2 2.86 4 5.71 2 2.86 8 11.43

901 - 1100 9 12.86 6 8.57 - - 15 21.43

1101- 1300 18 25.71 7 10 - - 25 35.71

1301- 1500 12 17.14 5 13.15 - - 15 24.29

Total 41 58.57 23 32.86 6 8.57 70 100.00

2.2.2. TABLAS DE DISTRIBUCION DE FRECUENCIAS:

SIMBOLOGIA:

n : N° de datos

Li : Límite inferior de los datos

Ls : Límite superior de los datos

R : Recorrido o rango

m : N° de intervalos

c : amplitud interválica

Page 19: Estadistica i

Xi : Recorrido o valores que toma una variable discreta

ni : Frecuencias absolutas

hi : Frecuencias relativas

Ni : Frecuencias absolutas acumuladas

Hi : Frecuencias relativas acumuladas

hix100: Frecuencias relativas porcentuales

Hix100: Frecuencias relativas porcentuales acumuladas

[yi-1 – yi): Intervalo cerrado por la izquierda y abierto por la

derecha

(yi-1 – yi]: Intervalo abierto por la izquierda y cerrado por la

derecha

[yi-1 – yi]: Intervalo cerrado por ambos lados

2.2.2.2 DISRIBUCION DE FRECUENCIAS DE VARIABLE

DISCRETA:

Ejem : Los siguientes datos corresponde al número de

profesores de de 75 colegios:

49, 52, 50, 47, 49, 48, 50, 49, 51, 50, 52 47, 49, 48, 47, 46, 50, 49,

51, 50, 48, 46, 52, 49, 48, 48, 47, 51, 46, 51, 50, 47, 49, 46, 50, 49,

47, 50, 51, 48, 49, 47, 48, 48, 46, 48, 47, 51, 46, 49, 46, 48, 49, 48,

50, 52, 52, 48,48,49, 47, 48, 50, 49, 46, 51, 50,49, 47, 50, 48, 51,

52, 48, 51

a. Elabore una tabla de frecuencias para analizar los datos.

b. Interprete la tabla

Solución

TABLA Nº 6

DISTRIBUCION DE FRECUENCIAS DE LOS

PROFESORES DE 75 COLEGIOS

Page 20: Estadistica i

PROCEDIMIENTO

En la primera columna se colocan los valores que toma la

variable

Xi .

Las frecuencias absolutas ni, resultan de contar cuantas veces

se repite los valores que toma la variable, es decir, cuantas

veces se repite el 1, cuantas veces se repite el dos, etc.

Las frecuencias relativas hi, resultan de dividir cada frecuencia

absoluta entre el total de datos (80).

La fórmula para encontrar cada frecuencia relativa es , de

lo que resulta: ; ; ; etc.

- Frecuencias Absolutas Acumuladas Ni: Se calculan así:

Así sucesivamente.

Xi ni hi Ni Hi hix100 Hix100

46

47

48

49

50

51

52

8

10

16

14

12

9

6

0.11

0.13

0.21

0.19

0.16

0.12

0.08

8

18

34

48

60

69

75

0.11

0.24

0.45

0.64

0.80

0.92

1.00

11

13

21

19

16

12

8

11

24

45

64

80

92

100

75 1.00 100

Page 21: Estadistica i

- Frecuencias Relativas Acumuladas Hi: Se calculan así de

manera similar:

- Frecuencias Relativas Porcentuales (hi x 100): Se encuentran

multiplicando por 100 a cada frecuencia relativa simple (hi):

h1x 100 = 0.11 x 100 = 11

h2x 100 = 0.13 x 100 = 13

h3x 100 = 0.21 x 100 = 21

y así sucesivamente.

- Frecuencias Relativas Porcentuales Acumuladas(Hix100): Se

encuentran multiplicando por 100 a cada frecuencia relativa

acumulada (Hi):

H1x 100 = 0.11 x 100 = 11

H2x 100 = 0.24 x 100 = 24

H3x 100 = 0.45 x 100 = 45

y así sucesivamente.

INTERPRETACIÓN DE LOS VALORES DE LA TABLA

Vamos a interpretar dos valores de cada columna, el resto de

valores se interpreta de manera similar.

n3 = 16 : 16 colegios tienen 48 profesores

n5 = 12 : 12 colegios tienen 50 profesores

h2 = 0.13 : El 0.13 por uno de colegios tienen 47

profesores

h4 = 0.19 : El 0.19 por uno de colegios tienen 49

Page 22: Estadistica i

profesores

N3 = 34 : 34 colegios tienen de 46 a 48

profesores

N6 = 69 : 69 colegios tienen de 46 a 51

profesores

H3 = 0.45 : El 0.45 por uno de colegios tienen de

46 a 48 profesores

H5 = 0.80 El 0.80 por uno de colegios tienen de

46 a 50 profesores

h4 x 100 = 19 : El 19% de colegios tienen 49

profesores

h6 x 100 = 12 : El 12% de colegios tienen 12

profesores

H3 x 100= 45 : El 45% de colegios tienen de 46 a 48

profesores

H5 x 100= 80 : El 80% de colegios tienen de 46 a 5o

profesores

2.2.2.3. DISRIBUCIÓN DE FRECUENCIAS DE VARIABLE

CONTINUA:

Cuando la variable en estudio es continua los datos se

agrupan en intervalos.

Ejem. Los siguientes datos corresponde al ingreso

económico de 62 trabajadores.

910, 950, 1190, 620, 1040, 1100, 1070, 925, 800, 1380,

780, 456, 706, 1100, 860, 1370, 1240, 1120, 1020, 1060,

930, 1136, 1180, 990, 630,1070, 930, 1200, 920, 815, 495,

480, 460, 1090, 1220,456, 742, 1080, 1082, 1073, 1345,

790, 950,1073, 1170, 790, 1085, 820, 900, 780, 700, 650,

1020, 980, 950, 990, 935, 810, 790, 1382, 1384, 910

Page 23: Estadistica i

a. Elabore una tabla de distribución de frecuencias

utilizando un intervalo cerrado por la izquierda y abierto

por la derecha.

b. Interprete la tabla y haga la representación grafica

correspondiente

TABLA N° 7

[yi-1-yi) yi ni hi Ni Hi hix100 Hix100

454.5 - 587.5 521 5 0.08 5 0.08 8 8

587.5 – 720.5 654 5 0.08 10 0.16 8 16

720.5 – 853.5 787 10 0.16 20 0.32 16 32

853.5 – 986.5 920 13 0.21 33 0.53 21 53

986.5 – 1119.5 1053 16 0.26 49 0.79 26 79

1119.5 – 1252.5 1186 8 0.13 57 0.82 13 82

1252.5 – 1385.5 1319 5 0.08 62 1.00 8 100

TOTAL 62 1.00 100

PROCEDIMIENTO.

1. Para construir los intervalos se puede proceder de dos

maneras:

a. Por Conveniencia: De acuerdo a la naturaleza del trabajo

de investigación y en función a la utilidad de información

que le pueda brindar al investigador, se pueden construir

los intervalos. No necesariamente los intervalos deben

tener la misma amplitud.

b. Metodología para Construir los Intervalos: Existe una

metodología que se utiliza para construir los intervalos

para una tabla de frecuencias de variable continua.

1° Se determina el Rango, con la siguiente fórmula:

R = Ls – Li = 1384-456 = 928 R = 928

Page 24: Estadistica i

2° Se determina el número de intervalos:

m = 2.5

m = 7

3° Se determina la amplitud del intervalo ( c ):

C =

Si el valor de C, sale con muchos decimales es preferible hacer

ampliación de los límites de la información con la finalidad de no

tener problemas a la hora de construir los intervalos. Si esto

ocurre, la tabla se construirá con los nuevos límites obtenidos.

La ampliación de los límites de los datos se hace, agregando al

límite superior de los datos una cantidad pequeña y restando la

misma cantidad al límite inferior de los datos. Se debe ir

probando con varias cantidades ( 0.25, 0.50, 0.75, 1, 1.25. 1.50,

1.75, 2, etc). No necesariamente se busca que el valor de C sea

entero. Para nuestro caso la solución es agregar al límite

superior de los datos 1.5 y restar esta misma cantidad al límite

inferior, con lo que tendríamos los nuevos límites de las datos:

Ls = 1385.5 y Li = 454.5, por diferencia de ambos valores se

tiene R = 931, entonces el valor de la amplitud sería

C =

Para construir los intervalos de la tabla, se empieza del límite

inferior modificado y se va agregando el valor de la amplitud ( C=

133), hasta llegar al límite superior de los datos. Posteriormente,

con la finalidad de tener intervalos cerrados, a partir del segundo

intervalo, se va agregando un décimo al límite inferior del

intervalo. .

2. PUNTOS MEDIOS DEL INTERVALO: Los puntos medios de

los intervalos se encuentran, sumando el límite inferior más el

Page 25: Estadistica i

límite superior del mismo y luego se divide entre 2. Ejemplo:

; , etc.

3. Las frecuencias se encuentran de la misma manera que en la

tabla de distribución para variable discreta, descrita

anteriormente.

Para la interpretación de los valores de la tabla se procede de

manera similar que se hizo para la tabla de frecuencia de

variable discreta (Tabla anterior).

.Como ejemplo interpretaremos algunos valores:

n4 = 13: 13 trabajadores tienen un ingreso de 853.5 a 986.5

soles.

n3=10 Vrs. Y3=787: 10 trabajadores tienen un ingreso promedio

de

787 soles.

h5=0.24: El 0.24 por uno de trabajadores tienen un ingreso de

986.5 a 1119.5 soles.

N4=33 : 33 trabajadores tienen un ingreso de 454.5 a 986.5

soles.

H5 = 0.77: El 0.77 por uno de trabajadores tienen un ingreso de

454.5 a 1119.5 soles.

h3x100=16: El 16 % de trabajadores tienen un ingreso de 720.5 a

853.5 soles.

H6x100=90 : El 90 % de trabajadores tienen un ingreso de 454.5

a 1252.5 soles.

2.3. REPRESENTACIONES GRAFICAS

Un gráfico es un medio para representar de manera objetiva los datos de

una tabla estadística. Los gráficos se elaboran en función del tipo de

variable que se quiere representar.

Page 26: Estadistica i

2.3.1 CONSTRUCCION DE GRAFICOS:

Existen una diversidad de gráficos, cuya forma dependerá de las variables

de estudio y de los objetivos de estudio.

Los gráficos de una sola variable sirven para fines comparativos de cifras

absolutas o porcentuales y pueden tener la forma de barras, superficies o

líneas.

Los gráficos de dos variables se construyen en el plano de coordenadas

cartesianas.

2.3.2. PARTES DE UN GRAFICO:

a. Titulo: Indica la naturaleza del fenómeno representado.

b. Diagrama: Representa los datos contenidos en la tabla estadística

c. Escalas : Las escalas se construyen de acuerdo a la magnitud de las

frecuencias.

d. Fuente: Sirve para indicar la fuente de los datos representados, esto es

opcional puesto que la fuente se especifica en la tabla estadística de

donde provienen los datos.

2.3.3. TIPOS DE GRAFICOS: Entre los principales se tiene:

a. Gráficos de Área o de Superficie: Se construyen para una variable de

cualitativo. Para la ilustración tomaremos los datos del Cuadro Nº 1

Page 27: Estadistica i
Page 28: Estadistica i

b. Gráfico de Barras: Se construyen para dos variables de tipo cualitativo. Para su

ilustración tomamos los datos del cuadro Nº 2.

Page 29: Estadistica i

a. Gráfico de Bastones: Se construyen para variables de tipo discreto.

Para la ilustración tomaremos los datos de la tabla Nº 6

b. Histograma de Frecuencias:

Se construye para variables de tipo cuantitativo y consiste en barras

que van unidas. Para la ilustración tomaremos los datos de la tabla

Nº 7.

Page 30: Estadistica i
Page 31: Estadistica i

c. Gráficos para Series de Tiempo: Se denomina series de tiempo a los

datos ordenados en función del tiempo: ejemplo:

AÑOS Nº de Alumnos de la Facultad

De Ing. Informática y Sist.

1998

1999

2000

2001

2002

2003

2004

380

450

530

600

690

770

855

Page 32: Estadistica i

EJERCICIOS

1. La inversión mensual en compra de computadoras, en miles de dólares, por 48 pequeñas empresas fue:

31 17 27 20 28 10 34 25 14 24 40 35 15 39 18 30 41 26 12 46 18 23 36 19 29 37 33 27 27 24 26 31 32 28 25 28 33 28 22 23 31 29 35 21 30 25 38 31.

a. Construir una tabla de frecuencias para analizar los datos, considerando un intervalo abierto por la derecha y cerrado por la izquierda. Interprete.

b. Determinar el Nº de empresas con una inversión menor a 25 mil dólares.

c. Determinar el porcentaje de empresas con una inversión entre 14 mil y 20 mil dólares.

2. Con los datos del problema Nº 1, elabore una tabla de frecuencias utilizando un

intervalo cerrado por ambos lados. Interprete la tabla.

3. Los siguientes datos corresponde a las notas en el curso de estadística de 52 alumnos:

12 11 12 12 7 8 12 12.5 9.5 9 9 12 7.5 12.5 10 9 11.5 13 10.5 10 12 8 14 12 11 16 12 15 9 10.5 12 12 10 13.5 12 18 10 11 10 17 12.5 10.5 14 11 10.5 14.5 12.5 11.5 12 13 11 11.5 .Construir una tabla de frecuencias utilizando intervalos cerrados por ambos lados. Interprete la tabla y haga la representación gráfica correspondiente.

4. Los siguientes datos corresponde al Nº de libros de estadística consultados por

50 estudiantes para rendir su primer examen parcial.

2 3 4 4 0 4 0 2 1 1 0 3 0 2 2 0 3 0 4 1 0 1 2 0 1 1 50 5 0 3 2 0 5 4 1 1 0 4 2 1 1 4 6 2 1 2 3 0 3.Construir una tabla de frecuencias e interprete la tabla.

5. Con respecto a la tabla de frecuencias del problema anterior se pide:

a. ¿Qué porcentaje de alumnos consultó de 4 a 6 libros?b. ¿Qué porcentaje de alumnos no consultó ningún libro?c. ¿Qué porcentaje de alumnos consultó hasta 3 libros?

6. La demanda diaria de azúcar durante 190 días en un supermercado, se tabuló en una distribución de frecuencias simétrica de 5 intervalos de amplitudes

Page 33: Estadistica i

iguales a 4. Si la marca de clase del intervalo central es igual a 12 y si la curva de frecuencias absolutas satisface la relación :

f ( x ) = - ( x – 12 ) 2 + 70 . Reconstruir la distribución y graficar.

7. Los siguientes datos corresponde a las calificaciones de 60 alumnos de un curso de matemáticas: H4 x 100 = 85 ; H3 x 100 = 70 y H2 x 100 = 60 ; el límite inferior del 2º intervalo es 5 y el límite inferior del tercer intervalo es 9 . Complete la tabla de frecuencias. Interprete la tabla.

8. Los siguientes datos corresponde al peso en libras de 56 trabajadores de una empresa:167 154 134 175 184 158 175 120 115 125 136 146 148 134 126 143 178 163 152 134 145 168 129 132 118 154 115 127 135 167 183 174 156 162 165 169 170 154 160 145 134 156 166 145 134123 145 167 156 133 155 143 166 148 125 153.Construir una tabla de frecuencias utilizando intervalos cerrados por ambos lados. Interprete la tabla de frecuencias y haga el grafico correspondiente.

9. Los siguientes datos corresponde a 64 de alumnos del curso de matemáticas de los cuales 25 son mujeres, 42 del curso de estadística, de los cuales 12 son mujeres y 32 del curso de computación I , de los cuales 18 son mujeres. Haga una tabla para presentar los datos y grafique.

10. Complete la siguiente tabla de distribución de frecuencias, correspondiente a las calificaciones de 60 alumnos del curso de estadística.

Yi-1-Yi Hi x100 ni Yi hi Ni Hi hix100 12 0.20

05 6009 70

85

Totales

11. El peso en gramos de 30 objetos de un mismo tipo son los siguientes : 21.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 11.2 23.9 26.8 22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2 08.3 21.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1

a. Construir una tabla de frecuencias de 6 intervalos de clase. b. Calcular el porcentaje de objetos cuyo peso sea 21.5 gr. o más. c. Calcular el peso debajo del cual se encuentran el 25% de los objetos.

13. Las puntuaciones de un tes aplicado a un grupo de trabajadores de una empresa se tabularon en una distribución de frecuencias de 6 intervalos de igual amplitud. La marca de clase del segundo intervalo es 25 y el límite superior del quinto intervalo es 60, si las 4 primeras frecuencias relativas porcentuales son respectivamente de 15, 20, 35 y 14 y si el 94% de las puntuaciones son menores que 60. Elabore la tabla de frecuencias e indique el porcentaje de trabajadores que tienen entre 38 y 53 puntos.

Page 34: Estadistica i

CAPITULO III

MEDIDAS DE TENDENCIA CENTRAL PARA

EL ANALISIS DE LOS DATOS

Page 35: Estadistica i

MEDIDAS DE CENTRALIZACIÓN

Las Medidas de Centralización o de Tendencia Central son parámetros estadísticos que

expresan en forma resumida un conjunto de datos. Estos parámetros a través de sus

propiedades y sus definiciones hacen posible el análisis de un conjunto de datos.

3. EL PROMEDIO O MEDIA ARITMÉTICA

3.1. PROMEDIO PARA DATOS ORIGINALES: Se denomina datos originales a

un conjunto de datos de cualquier variable y copiados de cualquier manera. La

fórmula para su cálculo es:

Donde xi: Observaciones o Datos

n: N° de datos

Ejemplo: Los siguientes datos corresponde al ingreso de 8 padres de los alumnos de

ingeniería Informática: 1200, 900, 1250, 1350, 800, , 750, 1200, 1300. Encontrar el

ingreso promedio

soles

El ingreso económico promedio de 8 padres de familia es 1093.75 soles.

3.2. PROMEDIO PARA DATOS TABULADOS

3.2.1 Promedio para datos tabulados no agrupados en intervalos

(Variable Discreta)

FORMULA:

Page 36: Estadistica i

Ejemplo: Se tomarán los datos de la tabla N° 6

Xi ni

46 847 10

48 16 49 14 50 12 51 9 52 6

Total 75

Reemplazamos los valores en la fórmula:

El N° promedio de trabajadores por empresa es aproximadamente 49

3.2.2. Promedio para datos tabulados agrupados en intervalos (Variable

Continua)

FORMULA: yi : Puntos medios del

intervalo

Ejemplo: Se tomarán los datos de la tabla N° 7

Ingreso Económico

yi ni

454.5 - 587.5 521 5 587.5 – 720.5 654 5 720.5 – 853.5 787 10 853.5 – 986.5 920 13 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5

1053 1186 1319

16 85

Total 62

Page 37: Estadistica i

El ingreso económico promedio de los 80 padres de familia es de 950.03 soles.

3.2. LA MODA (Md)

La Moda en un conjunto de observaciones, viene a ser el valor de la

variable que se presenta con más frecuencia en la distribución de datos

3.2.1. MODA PARA DATOS CUANTITATIVOS:

2.1.1. Moda para Datos Originales

Ejemplo N° 1: Los siguientes datos corresponde a los ingresos económicos

de 10 padres de familia. Encontrar la moda.

970, 930, 860, 1040, 1020, 1380, 1410, 900, 1040, 1240

La moda es: Md = 1040

Ejemplo N° 2: Ingresos económicos de 8 trabajadores. Encontrar la moda.

1200, 1050, 1200, 910, 1300, 1550, 1420, 960

Estos datos no tienen moda.

Ejemplo N° 3: corresponde a los pesos de 10 alumnos:

65, 54, 72, 60, 58, 54, 66, 70, 58

Md1 = 54

Md2 = 58

Un conjunto de datos puede tener una moda o más de una moda o también no

tener ninguna moda.

3.2.2. Moda para Datos Tabulados

3.3.2.1 Moda para datos tabulados no agrupados en intervalos

(Variable Discreta)

FORMULA:

Donde: xj es el valor de la variable que corresponde a la máxima frecuencia

absoluta.

Page 38: Estadistica i

Ejemplo: Tomamos los datos de la tabla N° 5

Xi ni

46 8 47 10 48 16 49 14 50 12 51 9 52 6

Total 75

La Moda será el valor de la variable que corresponde a la máxima frecuencia

absoluta (n4 =16), en este caso Md = 48

El resultado significa que es más frecuente encontrar empresas con 48

trabajadores

3.3.2.2. Moda para datos tabulados agrupados en intervalos

(Variable Continua)

FORMULA:

Donde: nj = máxima frecuencia absoluta

nj-1 = frecuencia absoluta anterior a nj

nj+1 = frecuencia absoluta posterior a nj

yj-1 = límite inferior del intervalo que se encuentra en la misma fila

de nj

c = Amplitud del intervalo

Page 39: Estadistica i

Ejemplo: Vamos a tomar los datos de la tabla N° 7

Ingreso Económico

ni

454.5 – 587.5 5 587.5 – 720.5 5 720.5 – 853.5 10 853.5 – 986.5 13 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5

16 8 5

Total 62

De acuerdo a la teoría:

nj = 15 yj-i = 986.5

nj-1 = 13 c = 133

nj+1 = 8

Reemplazando valores en la fórmula se tiene:

Los sueldos o ingresos económicos más frecuente de 62 trabajadores

encuentran alrededor de 1016.06 soles.

3.2.2. MODA PARA DATOS CUALITATIVOS:

La moda estará dada por la categoría de la variable que corresponde a la

máxima frecuencia absoluta.

Ejemplo: Tomaremos los datos del cuadro N° 1

NIVEL DE INSTRUCCIÓN n %

Primaria

Secundaria

Sup. No Universitaria

Sup. Universitaria

2

11

42

15

2.86

15.71

60.00

21.43

Total 70 100.00

Page 40: Estadistica i

Li LsMe

50% 50%

La máxima frecuencia es 42, por lo tanto, la moda es la categoría superior no

universitaria, es decir: Md = Sup. No Universitaria.

3.3. LA MEDIANA

Es el valor que divide a la totalidad de datos, ordenados en forma creciente o

decreciente, en dos partes iguales, de tal manera que el 50% de los datos se encuentren a

la izquierda de la mediana y el otro 50% a la derecha de la mediana.

La mediana se aplica en lugar del promedio, cuando la variabilidad de los datos es muy

marcada. La mediana también se aplica a datos cualitativos ordenados de acuerdo a

rangos.

3.3.1. MEDIANA PARA DATOS CUANTITATIVOS:

3.3.1.1. Mediana para Datos Originales

Se presentan dos caso:

a. Cuando el N° de datos es Par

Se ordenan los datos en forma creciente o decreciente y se toma el promedio

de los dos valores del centro.

Ejemplo: Los siguientes datos corresponde a las edades de 10 ingenieros:.

50, 22, 61, 30, 55, 42, 46, 35, 38,28

Ordenamos en forma creciente:

22, 28, 30, 35, 38, 42, 46, 50, 55, 61

El 50% de los ingenieros tienen una edad máxima de 40 años

b. Cuando el N° de datos es Impar

Ejemplo: Los siguientes datos corresponde al nº de trabajadores de 9 empresas

63, 56, 94, 32, 58, 41, 90, 45, 104

Ordenamos de forma creciente

Page 41: Estadistica i

32, 41, 45, 56, 58, 63, 90, 94, 104

Se toma el valor del centro: Me = 58

El 50% de empresas tienen un número máximo de 58 trabajadores

3.3.1.2. Mediana para Datos Tabulados

a. Mediana para datos tabulados no agrupados en intervalos

1° Cuando

FORMULA: Me = xj

Donde:

xj : Es el valor de la variable que se encuentra en la misma fila de Nj

Nj : Frecuencia absoluta acumulada inmediatamente mayor que

Nj-1 : Frecuencia absoluta acumulada anterior a Nj

Ejemplo: Tomamos los datos de la tabla N° 6

Xi ni Ni

46 8 8 47 10 18 48 16 34 49 14 48 50 12 60 51 9 69 52 6 75

Total 75

Procedimiento:

Page 42: Estadistica i

3° efectivamente

Por lo tanto: Me = 49

50% de las empresas tienen como máximo 49 trabajadores.

2° Cuando

FORMULA:

Ejemplo: Los siguientes datos corresponden al N° de hijos de 54 familias

Número de hijos Xi

ni Ni

1 5 52 10 153 12 274 15 425 8 506 4 54

Total 54

Procedimiento:

3° efectivamente

Reemplazando valores:

Page 43: Estadistica i

El 50% de las familias tienen como máximo aproximadamente 4 hijos.

b. Mediana para datos tabulados agrupados en intervalos

1° Cuando

FORMULA:

Donde: yj-1 = límite inferior del intervalo que se encuentra en la misma fila

de Nj

c = Amplitud del intervalo

Nj = frecuencia absoluta acumulada inmediatamente mayor que

Nj-1= frecuencia absoluta acumulada anterior a Nj

Ejemplo: Vamos a tomar los datos de la tabla N° 7

Ingreso Económico

ni Nj

454.5 – 587.5 5 5 587.5 – 720.5 5 10 720.5 – 853.5 10 20 853.5 – 986.5 13 33 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5

16 8 5

49 57 62

Total 62

procedimiento:

2° Nj= 33

3° efectivamente

Page 44: Estadistica i

5° c = 133

Reemplazando valores se tiene:

El 50% de trabajadores tienen un ingreso máximo de 966.04 soles.

2° Cuando

FORMULA:

Page 45: Estadistica i

Ejemplo: Los siguientes datos corresponden al peso en kilos de 120 alumnos.

Peso ni Ni

30 –33 10 1034 – 37 20 3038 – 41 30 6042 – 45 30 9046 – 49 16 10650 – 53 14 120Total 120

Procedimiento:

3° efectivamente

Reemplazando valores se tiene:

El 50% de los alumnos tienen un peso máximo de 42 kilogramos.

3.3.2. MEDIANA PARA DATOS CUALITATIVOS:

Es factible obtener la mediana cuando se tiene datos cualitativos, susceptibles de

ordenarse de acuerdo a rangos o categorías.

Page 46: Estadistica i

Li LsQ2

50%

75%

Q1 Q3

25%

Ejemplo: Tomaremos los datos de la tabla N° 01

Nivel de Instrucción ni Ni

Primaria 2 16Secundaria 11 54Superior No Universitaria 42 72Superior Universitaria 15 80

Total70

Procedimiento:

La mediana esta dada por la categoría que se encuentra en la misma fila de Nj. Por lo

tanto, la mediana está dada por la categoría Secundaria.

El 50% de los padres de familia de los estudiantes tienen un grado de instrucción

máximo de secundaria.

3.4. CUARTILES (Qi)

Son medidas de posición que dividen a la distribución de datos ordenados, en cuatro

partes iguales, de tal manera que:

Page 47: Estadistica i

3.4.1. CUARTILES PARA DATOS ORIGINALES

Una ves ordenados los datos tales que . El cuartil i-ésimo

(i = 1, 2 o 3), es el valor del dato que ocupa la posición en el

ordenamiento.

Si la posición resulta entera, se hace una interpolación lineal entre los dos

valores correspondientes a las dos observaciones entre las cuales se encuentra

la fracción.

Ejemplo N° 1Tomaremos los datos, ordenados previamente, correspondiente a los ingresos

económicos semanales de 7 padres de familia.

200, 225, 300, 420, 450, 460, 540

x1 x2 x3 x4 x5 x6 x7

- Cálculo del Primer Cuartil (Q1): i =1, n =7

, posición entera, luego Q1 = x2 = 225.

El 25% de los padres de familia, es decir 20 de ellos, tienen un ingreso

máximo de 225 soles.

- Cálculo del Segundo Cuartil (Q2): i =2, n =7

, posición entera, luego Q2 = x4 = 420.

El 50% de los padres de familia, es decir 40 de ellos, tienen un ingreso

máximo de 420 soles.

- Cálculo del Tercer Cuartil (Q3): i =3, n =7

, posición entera, luego Q3 = x6 = 460.

El 75% de los padres de familia, es decir 60 de ellos, tienen un ingreso

máximo de 460 soles.

Page 48: Estadistica i

Ejemplo N° 2Tomaremos los datos, ordenados previamente, correspondiente a los ingresos

semanales de 10 padres de familia

200, 225, 300, 420, 450, 460, 540, 550, 600, 650

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

- Cálculo del Primer Cuartil (Q1): i =1, n =10

, posición no entera, luego Q1 estará entre las

observaciones x2 y x3.

Estableciendo proporciones se tiene:

El 25% de los padres de familia tienen un ingreso máximo de 281.25 soles.

- Cálculo del Segundo Cuartil (Q2): i =2, n =10

, posición no entera, luego Q2 estará entre las

observaciones x5 y x6.

Entonces:

El 50% de los padres de familia tienen un ingreso máximo de 455 soles.

- Cálculo del Tercer Cuartil (Q3): i =3, n =10

, posición no entera, luego Q3 estará entre

las observaciones x8 y x9.

Entonces:

Page 49: Estadistica i

El 75% de los padres de familia tienen un ingreso máximo de 562.5 soles.

3.4.2. CUARTILES PARA DATOS TABULADOS

FORMULA:

Donde i, tomará valores de 1 a 3, según se trate de calcular el 1°, 2° ó tercer

cuartil.

Ejemplo Para la tabla N° 7, calcular el primer, segundo y tercer cuartil.

- Cálculo del primer cuartil (Q1): i = 1

Procedimiento: Es parecido al de la mediana

2° Nj = 20

3° Nj-1 = 10

4° yj-1 = 720.5

5° C = 133

Ingreso Económico

ni Ni

454.5 – 587.5 5 5 587.5 – 720.5 5 10 720.5 – 853.5 10 20 853.5 – 986.5 13 33 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5

16 8 5

49 57 62

Total 62

Page 50: Estadistica i

Reemplazando valores en la fórmula:

El 25% de los trabajadores, es decir 16, tienen un ingreso máximo de 787 soles.

- Cálculo del segundo cuartil (Q2): i = 2

Procedimiento:

2° Nj = 33

3° Nj-1 = 20

4° Yj-1 = 853.5

5° C = 133

Reemplazando valores en la fórmula:

El 50% de los trabajadores, es decir 31, tienen un ingreso máximo de 966.04 soles.

- Cálculo del tercer cuartil (Q3): i = 3

Page 51: Estadistica i

Procedimiento:

2° NJ = 48

3° Nj-1 = 33

4° Yj-1 = 986.5

5° C = 133

Reemplazando valores en la fórmula:

El 75% de los trabajadores, es decir 47, tienen un ingreso máximo de 1106.2 soles.

3.5. MEDIDAS DESCRIPTIVAS DE RESUMEN UTILIZANDO CUARTILES

Llos cuantiles son útiles no sólo como medidas de posición no central; también sirven

para elaborar otras medidas importantes de tendencia central y dispersión.

Describiremos dos medidas basadas en los cuarteles: el Eje Medio y el Rango

intercuartílico.

3.5.1. EL EJE MEDIO:

Es el promedio de los cuarteles Q1 y Q3 de un conjunto de datos:

EJE MEDIO =

Para el ejemplo anterior: Eje Medio =

Eje Medio = 941.25

Page 52: Estadistica i

3.5.2. RANGO INTERCUARTILICO (R.I.)

El rango intercuartílico ( llamado también dispersión media) es la diferencia entre los

cuartiles Q1 y Q3 de un conjunto de datos.

Para el ejemplo anterior R.I. = Q3 – Q1

R.I. = 302.50

Esta medida considera la dispersión en el 50% medio de los datos y, por ello, de

ninguna manera se ve influenciada por la posible ocurrencia de valores extremos.

3.6. DIAGRAMA DE BLOQUES Y LINEAS:

Para identificar y describir las principales características de los datos, el método de

“Análisis Exploratorio de Datos “ utiliza medidas de tendencia central y de dispersión

que tienen la propiedad de resistencia; es decir, estadísticos que son relativamente

insensibles a cambios extremos de algunos de los datos. La mediana, el eje medio y el

rango intercuartílico son tres estadísticos resistentes de uso común. Si se combinan

estas medidas resistentes con información referente a los extremos, se logra entonces

una mejor idea de la forma de la distribución de datos. Cinco son los números de

resumen:

Li , Q1 , Mediana , Q3 , Ls

Para los datos originales que sirvieron para el construir la tabla Nº 7 se tiene:

Li = 456 , Q1 = 790 , Me = 950 , Q3 = 1092.50 , Ls = 1384

El diagrama de bloques y líneas ofrece una representación gráfica de los datos a través

de los cinco números de resumen. En la siguiente figura se ilustra este diagrama.

Page 53: Estadistica i

Ingreso

1400,00

1200,00

1000,00

800,00

600,00

400,00

3.7. DECILES (Di)

Son medidas de posición que dividen a la distribución de datos, previamente ordenados,

en 10 partes.

El decil i –ésimo es el valor del dato que ocupa la posición en el

ordenamiento.

Si la posición no resulta entera, se hace una interpolación lineal entre los dos valores

correspondientes a las dos observaciones entre las cuales se encuentre la posición.

3.7.1. DECILES PARA DATOS ORIGINALES

EJEMPLO : Tomaremos los datos correspondiente al ingreso semanal,

previamente ordenados. de 9 trabajadores de una empresa

Page 54: Estadistica i

320, 330, 345, 410, 460, 580, 900, 940, 940

x1 x2 x3 x4 x5 x6 x7 x8 x9

Calcular el Decil 2 y el Decil 6.

Decil 2 (D2): i = 2, n = 9

: Posición entera

Por tanto el decil 2 es el dato que ocupa la segunda posición: D2 = 330.

El 20% de los trabajadores tienen un ingreso máximo de 330 soles.

Decil 6 (D6): i = 6, n = 9

: Posición entera

Por tanto el decil 6 es el dato que ocupa la sexta posición: D6 = 580.

El 20% de los trabajadores tienen un ingreso máximo de 580 soles..

3.7.2. DECILES PARA DATOS TABULADOS

FORMULA:

Donde i, tomará valores de 1 a 9, según se trate del primero, segundo, hasta el

noveno decil.

Ejemplo Para la tabla N° 7, calcular el cuarto decil.

Page 55: Estadistica i

Procedimiento:

2° Nj = 33

3° Nj-1 = 20

4° Yj-1 = 853.5

5° C = 133

Reemplazando valores en la fórmula:

El 40% de los trabajadores, tienen un ingreso máximo de 902.61 soles.

3.8. PERCENTILES

Para el cálculo de los centiles o percentiles (Pi) se procede de manera similar y las

fórmulas correspondientes son:

- Para datos originales:

- Para datos tabulados:

Ingreso Económico

ni Ni

454.5 – 587.5 5 5 587.5 – 720.5 5 10 720.5 – 853.5 10 20 853.5 – 986.5 13 33 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5

16 8 5

48 56 62

Total 62

Page 56: Estadistica i

3.9. TASAS DE CRECIMIENTO ( T.C.):

Sirve para encontrar el crecimiento de una cantidad de un periodo t con respecto a

un periodo t-1. Se calcula con la siguiente fórmula:

T.C.=

Ejemplo: Calcular las tasas de creciminto para los siguientes datos, correspondiente al

N° de alumnos matriculados de una universidad, durante el periodo 2005 – 2010

Año N° alumnosTasa (%)

xi

2005 1250 -2006 1500 20.002007 1850 23.332008 2120 14.592009 2430 14.622010 2870 18.11

3.10. LA MEDIA GEOMÉTRICA (MG)

Se usa cuando hay que promediar tasas de crecimiento, razones o proporciones.

3.10.1. Media geométrica Simple:

FORMULA:

Ejemplo:

Calcular la media geométrica para los siguientes datos, correspondiente al N°

de alumnos matriculados de una universidad, durante el periodo 2000 – 2005.

Page 57: Estadistica i

Año N° alumnosTasa (%)

xiLog xi

2005 1250 - -2006 1500 20.00 1.3010302007 1850 23.33 1.3679152008 2120 14.59 1.1640552009 2430 14.62 1.1649472010 2870 18.11 1.257918

6.255865

Reemplazando en la fórmula:

El incremento promedio anual de alumnos matriculados es del 17.83%.

3.10.2. Media geométrica Ponderada:

FORMULA:

Consideremos los datos de la tabla N° 7 para ilustrar el cálculo.

Ingreso Económico

Yi ni

ni logYi

454.5 - 587.5 521 5 13.584189 587.5 – 720.5 654 5 14.077889 720.5 – 853.5 787 10 28.959747 853.5 – 986.5 920 13 38.529242 986.5 – 1119.5 1119.5 – 1252.5 1252.5 – 1385.5

1053 1186 1319

16 8 5

48.358854 24.592678 15.601224

Total 62 183.703823

Reemplazando valores en la fórmula:

MG = Antilog

Page 58: Estadistica i

MG = 918.26

El ingreso económico promedio de los 62 trabajadores es de 918.26 soles.

En este caso la medida más adecuada para el análisis de los datos es el

Promedio.

Ejercicios

Para los ejercicios del capitulo anterior, calcular el promedio, moda ,mediana,

Cuartiles,y Media Geométrica ponderada.

Page 59: Estadistica i

CAPITULO IV

MEDIDAS DE DISPERSION

Page 60: Estadistica i

4.1. MEDIDAS DE DISPERSION

Son medidas o parámetros estadísticos que sirven de complemento a las medidas de

centralización en el análisis de los datos. Es necesario tener una idea del grado de

concentración o dispersión de las observaciones alrededor de una medida de tendencia

central.

4.2. RECORRIDO O RANGO: (R)

Viene a ser la diferencia entre el valor mayor y el valor menor de los datos, es decir:

R = Xmáx – Xmín

Ejem. Tomaremos los datos originales que dieron origen a la tabla Nº 7.

R = 1384 – 456 = 928 soles.

El recorrido a rango como estadígrafo de posición es muy limitado, porque sólo

considera los valores extremos de la distribución de datos y no nos indican nada sobre el

comportamiento de los datos.

4.3. VARIANZA: ( σ2 )

Es el promedio de las desviaciones con respecto al promedio elevado al cuadrado. La

varianza no tiene interpretación .

4.3.1. Varianza para datos originales:

Ejem. Los siguientes datos corresponde a los ingresos económicos por semana de 12

trabajadores de una empresa

Xi: 600, 650, 200, 710, 300, 550, 420, 460, 450, 540, 850, 225.

Para poder aplicar la fórmula, primero debemos encontrar el promedio y luego

aplicar la fórmula de la varianza.

Page 61: Estadistica i

4.3.2 DESVIACIÓN ESTANDAR:

Se define como la raíz cuadrada de la varianza.

Es uno de los estadígrafos de dispersión de mayor uso, en el cual las unidades de la

variable ya no están elevadas al cuadrado.

En general los estadígrafos de dispersión se usan para comparar dos o más

distribuciones de datos poblaciones. A mayor dispersión entre los valores o

elementos de una población, le corresponde un valor mayor para el estadígrafo de

dispersión.

EJEMPLO: Encontrar la desviación estándar para el caso anterior.

La dispersión promedio que existe entre los datos y la media aritmética es de

186.89 soles.

4.3.3 VARIANZA PARA DATOS TABULADOS

a. Varianza para Datos Tabulados No Agrupados en Intervalos:

FORMULA:

EJEMPLO: Tomaremos los datos de la tabla N° 6

Page 62: Estadistica i

Xi ni xini

46 8 368 8.0656 64.5248 47 10 470 3.3856 33.856 48 16 768 0.7056 11.2896 49 14 686 0.0256 0.3584 50 12 600 1.3456 16.1472 51 9 459 4.6656 41.9904 52 6 312 9.9856 59.9136

Total 75 3663 228.08

Las dos primeras columnas corresponden a la tabla N° 6. Las tres

columnas siguientes son columnas de trabajo para llegar a obtener la

varianza.

La columna de trabajo N° 3 sirve para encontrar el promedio.

Reemplazando valores de la tabla se tiene:

***

Desviación estándar:

La variabilidad promedio del N° de trabajadores por empresa es

aproximadamente de dos trabajadores

b. Varianza para Datos Tabulados Agrupados en Intervalos:

FORMULA:

EJEMPLO: Consideremos los datos de la tabla N° 07 para ilustrar el

cálculo.

Page 63: Estadistica i

Ingreso Económico

yi ni yini

454.5 – 587.5 521 5 2605 920343.5722 587.5 – 720.5 654 5 3270 438175.6132 720.5 – 853.5 787 10 7870 265795.3084 853.5 – 986.5 920 13 11960 11725.2076 986.5 – 1119.51119.5 – 1252.51252.5 – 1385.5

1053 16 16848 159035.20861186 8 9488 445446.04351319 5 6595 816822.9819

Total 62 58636 2930667.8712

Reemplazando los valores en la fórmula:

Desviación estándar:

-

La variación promedio que existe entre los ingresos económicos de los trabajadores

con respecto al ingreso promedio (945.74 soles) es de 217.41 Soles.

4.3.4. PROPIEDADES DE LA VARIANZA

a. La varianza de una constante es cero:

V ( K ) = 0

b. La varianza del producto de una constante por una variable, es igual :

V ( K.X ) = K2 X

c. La varianza de la suma de una variable más una constante, es igual a la varianza de

la variable: V ( X + K ) = V(X)

4.3.5. COEFICIENTE DE VARIACIÓN (C.V)

Es una medida de variabilidad relativa que se utiliza para comparar dos o mas

distribuciones de datos cuando las unidades de medida de las variables están

expresadas en diferentes unidades a escalas de medida, por ejemplo los sueldos

expresados en soles y dólares.

Si comparamos dos distribuciones, será más homogénea, la que presente menor

coeficiente de variación.

Page 64: Estadistica i

FORMULA:

EJEMPLO: Calcular el coeficiente de variación para el ejemplo anterior.

Los ingresos de los trabajadores tienen una dispersión relativa de 23.37 %.

4.3.6. MEDIDAS DE ASIMETRIA

COEFICIENTES DE ASIMETRÍA (As)

Miden el grado de deformación horizontal de la distribución de frecuencias.

Indices de Asimetría de Pearson (As). Se definen:

El primero es el más usual.

Interpretación1. Si la distribución es Simétrica, entonces As = 0, en este caso coinciden

.

2. Si la distribución es Asimétrica Positiva ó sesgada a la derecha si: As > 0.

3. Si la distribución es Asimétrica Negativa ó sesgada a la izquierda si: As < 0.

EJEMPLO: Tomando los datos de la tabla N° 7 correspondiente a los ingresos

económicos de los trabajadores de 62 empresas.

Los ingresos tienen una distribución asimétrica positiva

4.3.7. ESTADIGRAFOS DE APUNTAMIENTO O KURTUOSIS

La kurtuosis viene a ser el grado de apuntamiento de una distribución.

a. Si una distribución tiene una elevada punta o apuntamiento, se llama Leptokúrtica.

b. Si la distribución se asemeja a una distribución normal se llama Mesocúrtica

c. Si la distribución es aplanada se denomina Platikúrtica.

El estadígrafo para analizar el apuntamiento es:

Page 65: Estadistica i

Coeficiente de Kurtuosis: a =

Donde σ4 = ( σ2 )2

m4 =

- Si a = 3 : La distribución es Mesokúrtica ( Normal).

- Si a > 3 : La distribución es Leptokúrtica ( apuntada)

- Si a < 3 : La distribución es Platikúrtica ( aplanada )

Ejem. Para los datos de la tabla Nº 6

M4 = 19.45254

σ4 = 9.2416

Reemplazando valores: a =

a = 2.10

Como a = 2.10 es menor que 3, la distribución es platikúrtica (aplanada).

Ejercicios.

Para las tablas de frecuencias del capitulo II calcular: La varianza, la desviación

estándar, el coeficiente de variación, el apuntamiento y la asimetría.

Page 66: Estadistica i

CAPITULO V

DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

Page 67: Estadistica i

5.1 Generalidades

Cuando en un trabajo de investigación se observa simultáneamente dos

variables en cada elemento de análisis, entonces estamos en el campo

de las estadísticas bidimensionales, cuya agrupación, da origen a las

distribuciones de frecuencias bidimensionales.

En el caso bidimensional puede darse el caso de que se tenga:

1. Las dos variables discretas

2. Una variable discreta y la otra continua

3. Las dos variables continuas.

5.2.DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES DE

VARIABLE DISCRETA

Una tabla bidimensional de frecuencias se construye colocando en el margen

izquierdo los distintos valores de X y en el margen superior los distintos valores de

Y, generándose una tabla de p filas y q columnas.

5.2.1. Frecuencias Marginales

Las frecuencias marginales de la variable X, se obtiene sumando las frecuencias

absolutas que figuran en cada fila ( línea horizontal)

ni. =

Las frecuencias marginales de la variable Y, se obtiene sumando las frecuencias

absolutas que figuran en cada columna ( línea vertical)

n.j =

Ejem. Los siguientes datos corresponde al número de computadoras (X) y al

número de Ing. Informáticos (Y) de 60 empresas tomada de la ciudad de chiclayo:

X 7 6 4 6 7 4 7 5 6 4 6 7 3 7 6 5 6 4 7 5 7 6 3 7 5 5 7 6 4 6 7 5

Y 4 4 2 3 3 1 4 3 5 3 3 3 1 2 2 2 4 2 6 3 3 3 2 6 4 3 4 4 3 2 5 3

X 6 4 6 6 5 5 7 6 7 5 6 7 6 7 7 7 7 6 5 7 7 3 7 7 6 4 7 6

Y 3 1 5 4 4 2 4 3 5 3 5 5 3 4 5 6 6 3 3 5 6 2 5 6 5 2 6 6

Page 68: Estadistica i

1. Elabore tablas de frecuencias absolutas bidimensionales para analizar los datos e

interprete las tablas.

2. Encuentre el promedio y la varianza para la variable X y Y

TABLA N º 8

Distribución de Frecuentas Absolutas Bidimensionales (nij) de 60 empresas por número de computadoras (X) según número de Ing. Informáticos (Y) por empresa

X : computadoras

Y : Ing. Informáticos

ni. = Frecuencias marginales de la variable X

n.j = Frecuencias marginales de la variable Y

INTERPRETACIÓN:

n23 = 2: 2 empresas tienen 4 computadoras y 3 Ing. Informáticos

n45 = 4 : 4 empresas tienen 6 computadoras y 5 Ing. Informáticos

Frecuencias Marginales:

- De la variable X

n2. = 7 : 7 empresas tienen 4 computadoras

Y

X 1 2 3 4 5 6ni.

3 1 2 - - - - 3

4 2 3 2 - - - 7

5 - 2 6 2 - - 10

6 2 7 4 4 1 18

7 1 3 5 6 7 22

n.j 3 10 18 11 10 8 60

Page 69: Estadistica i

n4. = 18 : 18 empresas tienen 6 computadoras

- De la variable Y

n.3 = 18: 18 empresas tienen 3 Ing. Informáticos

n.5 = 10: 10 empresas tienen 5 Ing. Informáticos

TABLA N º 9

Distribución de Frecuentas Relativas Bidimensionales (hij) de 60 empresas por número de computadoras (X) según número de Ingenieros Informáticos (Y) por

empresa

Y

X 1 2 3 4 5 6hi.

3 0.02 0.03 - - - - 0.05

4 0.03 0.05 0.03 - - - 0.11

5 - 0.03 0.10 0.03 - - 0.16

6 - 0.03 0.12 0.07 0.07 0.02 0.31

7 - 0.02 0.05 0.08 0.10 0.12 0.37

h.j 0.05 0.16 0.30 0.18 0.17 0.14 1.00

Interpretación:

h23 = 0.03 : El 0.08 por uno de empresas tienen 4 computadoras y 3 Ing. Informáticos

h45 = 0.07: El 0.07 por uno de empresas tienen 6 computadoras y 5 Ing. informáticos

Frecuencias Relativas Marginales:

- De la variable X:

h2. = 0.11: El 0.11 por uno de empresas tienen 4 computadoras

h4. = 0.31: El 0.31 por uno de empresas tienen 6 computadoras

- De la variable Y:

h.3 = 0.30 :El 0.30 por uno de empresas tienen 3 Ing. Informáticos

Page 70: Estadistica i

h.5 = 0.17: En el 0.17 por uno de empresas tienen 5 Ing. Informáticos

TABLA N º 10

Distribución de Frecuentas Absolutas Bidimensionales Acumuladas (Nij) de 60 empresas por número de computadoras (X) según número de ingenieros (Y) por

empresa

Interpretación:

N23 = 10: 10 empresas tienen de 3 a 4 computadoras y de 1 a 3 Ing. Informáticos

N35 = 20: 20 empresas tienen de 3 a 5 computadoras y de 1 a 5 Ing. Informáticos

Y

X 1 2 3 4 5 6

3 1 5 5 5 5 5

4 3 8 10 10 10 10

5 3 10 18 20 20 20

6 3 12 27 31 35 36

7 3 13 31 42 52 60

Page 71: Estadistica i

TABLA N º 11

Distribución de Frecuentas Relativas Bidimensionales Acumuladas (Hij) de 60 empresas por número de computadoras (X) según número de Ingenieros

Informáticos (Y) por empresa

Interpretación :

H25 = 0.16: El 0.16 por uno de empresas tienen de 3 a 4 computadoras y de 1 a 5

ingenieros informáticos

H34 = 0.32: El 0.32 por uno de empresas tienen de 3 a 5 computadoras y de 1 a 4 ing.

Informáticos

Y

X 1 2 3 4 5 6

3 0.02 0.08 0.08 0.08 0.08 0.08

4 0.05 0.13 0.16 0.16 0.16 0.16

5 0.05 0.16 0.29 0.32 0.32 0.32

6 0.05 0.19 0.44 0.54 0.61 0.63

7 0.05 0.21 0.51 0.69 0.86 1.00

Page 72: Estadistica i

TABLA Nº 12

Distribución de Frecuentas Relativas Bidimensionales Porcentuales (hijx100) de 60 empresas (X) según número de Ing. Informáticos (Y) por empresa

Y

X 1 2 3 4 5 6hi.

3 2 3 - - - - 5

4 3 5 3 - - - 11

5 - 3 10 3 - - 16

6 - 3 12 7 7 2 31

7 - 2 5 8 10 12 37

h.j 5 16 30 18 17 14 100

Interpretación:

h34 = 3: El 3% de empresas tienen 5 computadoras y cuatro ingenieros informáticos

h45= 7: El 7% de empresas 6 computadoras y 5 ingenieros informáticos

Page 73: Estadistica i

TABLA N º 13

Distribución de Frecuentas Relativas Bidimensionales Porcentuales Acumuladas (Hijx100) de 60 empresas según Numero de computadoras (X)y número de Ing.

Informáticos ( Y) empresa

Y

X 1 2 3 4 5 6

3 2 8 8 8 -

4 5 13 16 16 -

5 5 16 29 32 -

6 5 19 44 54 0.61 0.63

7 5 21 51 69 0.86 1.00

Interpretación:

H22x100 = 13: El 13% de empresas tienen de 3 a 4 computadoras y de uno a dos ing.

Informático.

H43x100 = 44: El44 % de empresas tienen de 3 a 6 computadoras y de uno a tres Ing.

Informáticos

2. Calculo del promedio

a. PARA X1 :

El número promedio de computadoras por empresa es de aproximadamente 6

PARA Y:

Page 74: Estadistica i

El número promedio de ing. Informáticos por empresa es de aproximadamente 4

CALCULO DE LA VARIANZA

a. PARA X :

Reemplazando valores:

b. PARA Y:

Reemplazando valores:

5.3. DISTRIBUCION DE FRECUENCIAS BIDIMENSIONALES DE VARIABLE

CONTINUA Y VARIABLE DISCRETA

Las variables bidimensionales (X,Y) conservan la misma nomenclatura y las tablas

tienen la misma forma.

Ejem. Los siguientes datos corresponde al ingreso mensual (X) y al Nº de hijos (Y)

De 60 trabajadores de una empresa:

Page 75: Estadistica i

X 1095 1060 1450 1520 1320 1580 1600 1080 1150 1200 1190 1475

Y 5 3 3 2 3 3 1 4 3 4 3 2

X 1515 1100 1420 1580 1280 1200 1550 1170 1800 1020 1525 1435

Y 3 4 3 2 4 3 2 4 1 4 6 2

X 932 1180 1365 932 1415 1553 1225 1650 1181 932 1429 1300 1030

Y 3 5 4 2 5 4 4 1 5 6 5 3 6

X 1620 1485 1305 1425 1390 1450 1380 1700 1515 1200 1320 1650 1650

Y 2 5 4 6 4 2 6 2 5 3 6 2 3

X 1380 1540 1120 1305 1750 1300 1250 1415 1670 1380

Y 3 3 4 5 2 4 3 4 2 3

1. Construir tablas de frecuencias bidimensionales, utilice intervalos cerrados, interprete los datos

2. Calcular el promedio y la varianza para la variable X y Y

Solución:

Variable Ingresos X:

Ls = 1800 -Li = 932R = 868m = 2.5m = 7

C = R/m C = 868/7 C = 124

Variable Nº de hijos: Li = 1, Ls = 6

Tabla Nº 14Distribución de frecuencias absolutas bidimensionales (nij) de ingresos económicos (X) y Número de hijos (Y) de 60 trabajadores de una empresa

Page 76: Estadistica i

Yi 1 2 3 4 5 6 ni.[Xi-1 – Xi] Xi 932 - 1056 994 1 1 1 - 2 51057 - 1180 1118.5 - - 2 4 2 - 81181 - 1304 1242. - - 5 4 1 101305 - 1428 1366.5 - - 4 4 2 3 131429 - 1552 1490.5 - 5 3 - 3 1 121553 - 1676 1614.5 2 4 2 1 - - 91677 - 1800 1738.5 1 2 3n.j 3 12 17 14 8 6 60

n52 = 5 : 5 trabajadores tienen un ingreso de 1429 a 1552 soles y tienen 2 hijos por trabajador.n4. = 13: 13 trabajadores tienen un ingreso de 1305 a 1428 solesn.5 = 8 : 8 trabajadores tienen 5 hijos cada unon3. = 10 Vrs. Y3 = 1242: 10 trabajadores tienen un ingreso promedio de 1242 soles.

El resto de tablas de frecuencias bidimensionales se construyen de manera similar a las tablas anteriores.2. Variable X: a. Promedio:

=

El ingreso promedio mensual de los 60 trabajadores de la empresa es 1362.24 solesb. Varianza:

σ = 203.84La variación promedio que existe entre los ingresos de los trabajadores con respecto al ingreso promedio es de 203.84 soles.5.4. EJERCICIOS:1. Los siguientes datos corresponde la edad y al número de hijos de 50 padres:Edad: 34 33 44 40 33 50 32 44 36 43 38 39 42 39 31 28 28 21 44 Hijos 3 2 5 4 3 6 3 4 3 5 3 2 4 5 3 2 2 1 5

Page 77: Estadistica i

Edad: 46 32 46 34 30 34 42 39 48 36 32 39 30 45 26 40 38 47 36 60 Hijos 6 2 6 3 2 3 4 3 5 3 2 3 2 3 2 3 2 5 4 6

Edad: 40 45 33 32 45 28 25 35 48 40 30 Hijos: 3 2 2 3 4 2 2 3 4 3 2

Construya tablas bidimensionales para analizar los datos.

2. Encuentre el promedio y la varianza para cada una de las variables del problema anterior.

3. Los siguientes datos corresponde a los ingresos económicos mensuales de 52 trabajadores de una empresa y a los años de servicio:

Ingresos: 750 693 789 890 1240 945 1320 1200 1350 780 865 946 1050 830Años de 4 3 4 4 6 5 8 6 7 4 5 6 6 5Servicio

Ingresos : 1560 1450 1000 1230 1500 1680 984 960 1380 1400 1600 1284Años de : 10 12 10 14 12 16 10 9 13 20 18 14

Ingresos : 1320 1245 965 845 760 896 1300 840 730 645 798 1620 1740 840Años de : 15 17 12 14 11 10 18 9 8 4 6 22 24 8Servicio

Ingresos : 1350 1000 1120 1040 1080 1600 1750 1800 960 830 977 1120Años de 16 10 14 12 11 22 20 28 20 12 14 15ServicioConstruir tablas de frecuencias bidimensionales para analizar los datos.

4. Para la tabla de frecuencias absolutas bidimensionales del problema anterior, calcular el promedio , la varianza y la desviación estándar.

Page 78: Estadistica i

CAPITULO VI :

PROBABILIDADES

6.1. Experimento aleatorio: Es aquel cuyos resultados dependen del azar.

Page 79: Estadistica i

6.2. Punto muestral: Viene a ser cada uno de los resultados de un

experimento.

Ejem. Cuando se lanza una moneda, existen dos puntos maestrales: cara, sello.

6.3. Espacio muestral (S): Viene a ser todos los resultados posibles de un

experimento.

Ejem. Si se arroja una moneda: S = { C, S }

Ejem. Si arrojamos dos monedas: S = { CC, CS, SC, SS }

Ejem. Si arrojamos un dado: S = { 1, 2, 3, 4, 5, 6 }

6.4. Suceso o evento: Viene a ser un subconjunto del espacio muestral y -

puede ser

Simple o compuesto.

6.4.1. Evento Simple: Es aquel que consta de un solo punto muestral.

6.4.2. Evento compuesto: Es aquel que consta de dos o más puntos maestrales.

Ejem. Si arrojamos un dado: S = { 1, 2, 3, 4, 5, 6 }

Sucesos o eventos simples: E1 = {1} E2 = {2} E3 = {5}

Sucesos o eventos compuestos: E1 = {1, 3}; E2 = {1, 4, 5}

A los sucesos o eventos se les puede simbolizar con cualquier letra.

6.5. Sucesos mutuamente excluyentes: Dos sucesos A y B son mutuamente excluyentes si: AWB = Ø . Ejem. A = {1, 3, 5}; B = {2, 4, 6}, entonces c se puede ver, la intersección es igual al conjunto nulo o vacío

6.6. Sucesos complementarios: Dos sucesos son complementarios, cuando

la ocurrencia de uno implica la no ocurrencia del otro.

Ejem. Si arrojamos un dado: S = {1, 2, 3, 4, 5, 6}.

y tenemos los eventos E = { 1 , 2, 3, 4 } y E´ = { 5, 6 }, entonces estos

eventos son complementarios.

6.7. Definición de probabilidad: Si un experimento puede ocurrir en “n”

posibles resultados mutuamente excluyentes y si “m “de estos resultados

constituyen el evento E, entonces, la probabilidad del evento E esta dado por: P

(E) = m/n.

La probabilidad del complemento del evento esta dado por:

P (E´) = 1 – P (E)

Ejem. Si arrojamos un dado: S = {1, 2, 3, 4, 5, 6} y sea los eventos:

E1 = {1, 2}, entonces P (E1) = 2/ 6 = 0.5

E2 = {3, 4, 5, 6}, entonces P (E2) = 4/6 = 0.67.

Page 80: Estadistica i

Ejem. Se tiene 6 Ing Informáticos , 8 ing. Civiles y 2 ing. Industriales

a. ¿Cuál es la probabilidad de elegir un ing. Informático?

b. ¿Cuál es la probabilidad de elegir un Ing. Civil?

c. ¿Cuál es la probabilidad de elegir un Ing. Informático

Solución:

a. P (H) = 6/16 = 0.38

b. P ( A ) = 8/ 16 = 050

c. P ( V ) = 2/16 = 0.13

6.8. Definición: Sea “S” un espacio muestral y sea “E” un evento cualquiera,

perteneciente al espacio muestral “S”, entonces se cumple que:

a. 0 ≤ P ( E ) ≤ 1

b. P ( S ) = 1

La parte a, significa que toda probabilidad de un evento siempre varía entre cero

y uno.

La parte b, significa que siempre la probabilidad de un espacio muestral es igual

a la unidad

6.9. Reglas de Probabilidad:

a. Regla de la Adición o de la Suma: Sean A y B dos eventos pertenecientes al

espacio muestral “S “, entonces se cumple que :

P(AUB) = P(A) + P(B) – P(AWB)

Ejem. Se tiene 5 ing. Informáticos, 7 ing. Civiles y 2 ing. que tienen ambos

títulos. Se elige un ing. Cuál es la probabilidad de que el ing. elegido sea

Informático o civil?

Solución: Con una letra simbolizaremos a los eventos:

Ing. Infórmaticos: I , Ing. Civiles: C , entonces aplicamos la regla:

P(I U C) = P(I) + P(C) – P(IWC) P(G U F) = 5/14 + 7/14 – 2/14 = 10/14 = 0.71

Ejem. En la Facultad de Ingeniería de una universidad se tiene 20 Ingenieros:

14 son Ing. Informáticos de los cuales 11 tienen grado de maestría y 3 tienen

doctorado . 6 son Ing. Industriales, de los cuales 4 tienen grado de maestría y

2 tienen doctorado. Se elige un Ing. al azar ¿Cual es la probabilidad de que el

ing. elegido sea Ing. Informático o que tenga grado de maestría?

Page 81: Estadistica i

Solución: Los datos vamos a colocar en una tabla de dos entradas puesto que

en el problema tenemos dos variables (especialidad y grado académico ).

Luego con una letra vamos a simbolizar a los eventos.

Especialidad

Grado Académico

TOTALMaestría

(C)

Doctorado

(D)

Ing. Infórmático

(A)11 3 14

Ing. Industrial

(B)4 2 6

TOTAL15 5 20

P(A U C) = P(A) + P(C) – P(AWC)

P( AUB ) = 14/20 + 15/20 – 11/20 = 18/20 = 0.90

b. Regla de la Adición para sucesos independientes: Sean A y B dos eventos

independientes pertenecientes al espacio muestral “S”, entonces se cumple que:

P(AUB) = P(A) + P(B).

Ejem. En el aula A de una universidad se tiene 18 alumnos varones y 8 alumnas

mujeres. Se elige un alumno ¿ cual es la probabilidad de que el alumno elegido sea

hombre o mujer?.

Solución:

Sea H alumnos hombres y M alumnas mujeres, entonces: P(HUM) = P(H) + P (M) ,

reemplazando valores:

P(HUM) = 18/26 + 8/26 = 1.

Page 82: Estadistica i

c. Regla de la Probabilidad Condicional

Sean A y B dos eventos pertenecientes al espacio muestral “S” , con P(B) > 0 , entonces se cumple que: P(A/B) = P(AWB)/ P(B).

Ejem. Tomaremos los datos de la tabla anterior. ¿Cuál es la probabilidad de que el

profesional elegido sea Ing. Industrial dado que tenga grado de doctor?

P(B/D) = P(BWD)/P(D) = = 2/5 = 0.40

d. Regla de la multiplicación:

Sean A y B dos eventos pertenecientes al espacio muestral “S” , entonces se cumple

que : P(AWB) = P(A) P(B/A).

Ejem. En un curso de programación, 22 alumnos aprobaron el curso y 10

desaprobaron. Se extraen dos alumnos, uno tras otro y sin reposición ¿Cuál es la

probabilidad de que el primer alumno elegido y el segundo hayan aprobado el curso:

Sea A , alumnos aprobados y sea D, alumnos desaprobados, entonces

P(A1WA2) = P(A1) P(A2/A1), remplazando valores se tiene:

P(VWH) = 22/32* 21/31 = 462/992 = 0.47

e. Regla de la multiplicación para sucesos independientes

Sean A y B dos sucesos independientes pertenecientes al espacio muestral “S”,

entonces se cumple que : P(AWB) = P(A) P(B)

Ejem Se tiene dos grupos de alumnos, A y B que llevan el curso de matemáticas. En el

grupo A se tiene 32 alumnos aprobados y 10 desaprobados. En el grupo B se tiene 36

alumnos aprobados y 8 desaprobados . Se extrae un alumno del grupo A y luego un

alumno del grupo B . Cual es la probabilidad de que el primer alumno elegido haya

sido un aprobado y el segundo un desaprobado.

Solución:

Sea a , alumnos aprobados y sea d, desaprobados, entonces P(aWd) = 32/40* 8/44 =

256/1760 = 0.15.

f. Regla de Bayes

Sean A1, A2, A3, ……., An , n eventos pertenecientes al espacio muestral “S”y sea B

un evento cualquiera, con P(B) > 0, entonces se cumple que :

Page 83: Estadistica i

Ejem. En una empresa A se tiene 10 obreros , 18 empleados y 5 ejecutivos. En la sala

B , se tiene 13 obreros ,25 empleados y 4 ejecutivos. En la empresa C, se tiene 8

obreros, 14 empleados y 3 ejecutivos Se elige una empresa y se extrae un trabajador, el

mismo que resulto que era empleado. Cual es la probabilidad de que el trabajador

elegido proceda de la empresa:

a. A

b. B

c. C

Solución

Simbolizaremos con O, a los obreros; con E, a los empleados y con Ej. a los

ejecutivos. Ahora aplicamos la fórmula:

a)

b)

c)

Page 84: Estadistica i
Page 85: Estadistica i

6.10. EJERCICIOS

1. Construir el espacio muestral para los siguientes experimentos:a. Cuatro electores elegidos al azar deben expresar su opinión favorable o contraria a un determinado proyecto.b. Un experimento consiste en seleccionar tres libros de un proceso de elaboración y observar si son defectuosos o no.c. Se lanzan dos dadosd. Se lanzan cuatro monedas.

2. Con respecto a los electores del problema Nº 1 (a),cual es la probabilidad de obtener:

a. Exactamente 3 electores con opiniones favorables sobre el proyecto.b. A lo mas dos electores con opiniones favorables sobre el proyecto.

2. Se realizo una evaluación de su estado nutricional de 56 alumnos de un centro educativo , obteniéndose los siguientes resultados: El estado nutricional de 20 alumnos fue normal, de los cuales 6 tuvieron una edad de 6 a 7 años y 8 de 8 a 9 años. 17 presentaron desnutrición leve, de los cuales 4 presentaron edades de 10 a 11 años y 7 de 8 a 9 años. 12 presentaron desnutrición moderada, de los cuales 5 presentaron edades de 6 a 7 años y 3 de 10 a 11 años. 7 presentaron desnutrición severa, de los cuales 3 presento edades de 6 a 7 años y 2 de 8 a 9 años. Se elige un alumno, cual es la probabilidad de que:

a. Presente desnutrición leve o que tenga una edad de 6 a 7 años.b. Presente desnutrición severa y que tenga una edad de 8 a 9 años.c. Presente desnutrición moderada dado que tenga una edad de 10 a 11

años.

3. Se lanzan dos dados, cual es la probabilidad de que:a. La suma que aparece sobre los dados sea un número par.b. El primer resultado sea un número menor que 3 y el segundo un número

impar.

4. El centro educativo 1021, cuenta con 10 profesores de física y 08 de química. El centro educativo 1130, cuenta con 14 profesores de física y 6 de química. Se traslada un docente del C.E. Nº 1021 al centro educativo Nº 1130 y luego se extraen 2 docentes de este centro educativo, uno tras otro y sin reposición. Cuál es la probabilidad de que:

a. El primer docente extraído sea de física y el segundo también.b. El primer docente extraído sea de la especialidad de física y el segundo

de ciencias químicas.

5. En un aula A hay 16 alumnos de la especialidad de primaria, 12 de secundaria y 7 de inicial. En el aula B, 14 son de la especialidad de primaria, 8 de secundaria y 5 de inicial. En el aula C, 20 son de la especialidad de primaria, 12 de secundaria y 8de inicial. Se elige un aula y se extrae un alumno, el mismo que fue de la especialidad de secundaria. Cuál es la probabilidad de que provenga:

a. Del aula A.b. Del aula B.c. Del aula C.

Page 86: Estadistica i

6. En el aula A estudian, 25 alumnos hombres y 16 mujeres. En el aula B estudian 35 Hombres y 26 mujeres. Se elige al azar una aula y se extrae un alumno. Cuál es la probabilidad de que el alumno elegido sea hombre.

7. La probabilidad de que a lo mas 20 alumnos aprueben el curso de estadística Aplicada es 0.35. Cual es la probabilidad de que aprueben el curso más de 20 alumnos.

8. Se lanza un dado normal. Se gana 30 dólares si el resultado es un número par o Divisible por 3. ¿Cuál es la probabilidad de ganar?...

9. Se lanza un dado normal. Dado que el resultado es un número impar. ¿Cuál es la probabilidad de que sea mayor que 3?.

10. Una urna A contiene 18 libros buenos y 2 con fallas. Una urna B, contiene 24

libros buenos y 4 con fallas. Se elige una urna y se extrae un libro. Si ellibro elegido es bueno se recibe un premio de 30 dólares. Cuál es la probabilidadde ganar el premio?.

11. Se tiene 4 aulas, en el aula Nº 1, se tiene 22 alumnos aprobados y 8 desaprobados enun curso de matemáticas. En el aula Nº 2, se tiene 18 alumnos aprobados y 6 desaprobados. En el aula Nº 3 , se tiene 15 alumnos aprobados y 10 desaprobados. En el aula Nº 4, se tiene 26 aprobados y 15 desaprobados. Se elige una aula y se extrae un alumno, el mismo que resultó ser un aprobado. Cuál es la probabilidad de que el alumno provenga:

a. Del aula Nº 1.b. Del aula Nº 2.c. Del aula Nº 3.

Page 87: Estadistica i

CAPITULO VII

DISTRIBUCIONES DE PROBABILIDAD

Page 88: Estadistica i

7.1. DISTRIBUCIÓN BINOMIAL

Es una distribución de variable discreta que trata de una serie de pruebas

repetidas e independientes y donde a cada resultado se le puede clasificar

(arbitrariamente) en dos categorías mutuamente excluyentes: éxitos y fracasos,

como por ejemplo macho o hembra, alivio o enfermedad.

A la probabilidad de éxito se representa como “p” y a la probabilidad de fracaso

como “q”, de tal manera que p + q = 1

La función de probabilidad es la siguiente:

Promedio: = np

Varianza : σ2 = npq

Ejemplo 1. Una familia tiene 8 hijos ¿Cuál es la probabilidad de que la familia

tenga:

a. Exactamente 5 hijos varones

b. Por lo menos 6 hijos varones

c. A lo mas 2 hijos varones

SOLUCIÓN

N = 8

S = (Espacio muestral de acuerdo al sexo)

Entonces:

P(H)=

P(M)=

a) X = 5

Reemplazando valores:

Page 89: Estadistica i

b) X = 6, 7, 8

c) X = 0, 1, 2

Ejemplo 2. El 20% de los alumnos que llevan un curso de matemáticas están

desaprobados. Se elige una muestra de 12 alumnos. Cual es la probabilidad de

que:

a) Exactamente 3 alumnos estén desaprobados

b) Por lo menos 10 alumnos estén desaprobados

c) A lo más 1 alumno haya sido desaprobado

SOLUCIÓN

p = 20% = 0.20 alumnos desaprobados

q = 80% = 0.80 alumnos aprobados

n = 12

a) x = 3

Page 90: Estadistica i

b) x = 10, 11, 12

7.2. DISTRIBUCIÓN DE POISSON

Es una distribución discreta, donde la ocurrencia de los eventos son

independientes. Esta distribución se emplea cuando recuentan los eventos o

cantidades, distribuidas al azar en espacio o tiempo.

Si X es el número de ocurrencias de algún evento aleatorio en un intervalo de

espacio o tiempo (o algún volumen de materia), la probabilidad de que X ocurra

esta dada por:

, x = 0, 1, 2, 3

Donde:

= es el N° promedio de ocurrencias del evento aleatorio dentro del intervalo de

espacio o tiempo (volumen)

e = 2.7183 es una constante

Media = λ Varianza = λ

Page 91: Estadistica i

EJEM. Parte de una vía pavimentada por una compañía A recientemente, tuvo

en promedio, dos fallas por Km. Después de haber sido utilizada durante 6

meses . Si esta compañía sigue pavimentando el resto de la vía,

a. Cual es la probabilidad de que se presenten 3 fallas en cualquier Km. de la

vía después de haber tenido un tráfico durante 6 meses?.

b. Cual es la probabilidad de que se presenten 3 o más fallas en cualquier km de

la via?

SOLUCIÓN

a) , x = 3

f (x) =

f(x) = 0.18

b)

En este caso vamos ha resolver por el complemento

f(x) = 1 - P(xi ) donde xi = 0,1,2

f(x) = 1 – [

f(x) = 0.05

Para resolver este problema también se puede hacer uso de la tabla de la distribución de

POISSON acumulada

EJEM 2.

Un líquido contiene ciertas bacterias cuyo promedio es de 4 por cm3. Hallar la probabilidad de

que no exista bacteria alguna:

a) En 0.5 cm3

b) En 1 cm3

Page 92: Estadistica i

SOLUCIÓN

por cm3 de liquido

a) En 0.5 cm3 por 0.5 cm3 de líquido

X = 0

f (X = 0) =

f (X = 0) = 0.1353

b) En 1 cm3 , x = 0

f (X = 0) =

f (X = 0) = 0.0183

7.3. DISTRIBUCIÓN NORMAL

Es una distribución de variable continua muy utilizada en trabajo de

investigación, fue descubierta por GAUSS. Se conoce también con el nombre de

Curva de GAUSS y presenta las siguientes características:

1. La mayor frecuencia se ubica en el centro

2. El promedio (u), la moda (Md) y la mediana (Me) coinciden

3. Es una curva simétrica, donde e área o probabilidad bajo la curva es igual a 1

o al 100%

4. Los extremos de la curva se acercan al eje horizontal pero no cortan a este

eje.

uMdMe

0.50.5

Page 93: Estadistica i

La función de probabilidad de a curva esta dada por:

donde

En la ecuación, los dos parámetros de la distribución son, la media (u) y la desviación

estándar ( ). y son constantes con valores de 3.1416 y 2.7183 respectivamente.

Los parámetros u y determinan completamente la distribución normal. Es decir para

cada valor diferente de u y se tiene una distribución normal diferente. Valores

diferentes de u trasladan el gráfico de la distribución al lo largo del eje X. Los valores

de determinan el grado de aplanamiento o levantamiento (apuntamiento de la

gráfica). Ejm.

u1 u2 u3

1

2

3

Page 94: Estadistica i

Usando la tabla correspondiente de la distribución normal se puede comprobar que:

El área comprendida entre es aproximadamente 68.26% del área total.

El área comprendida entre es aproximadamente 95.4% del área

total.

El área comprendida entre es aproximadamente 99.7% del área

total.

La esperanza y la varianza de una variable aleatoria con distribución normal es:

7.4. DISTRIBUCIÓN NORMAL ESTÁNDAR O TIPIFICADA

Esta distribución se obtiene creando una variable aleatoria y haciendo u=0 y

, entonces:

Para calcular el área entre dos puntos Zo y Z1 es necesario calcular la siguiente integral:

Pero como existen tablas que proporcionan los resultados de las integraciones, no es

necesario realizar la integración.

Page 95: Estadistica i

La tabla que utilizaremos nos da las áreas bajo la curva normal a partir del centro de la

curva hacia la derecha y como la curva es simétrica para valores negativos de Z se

leerán con valores positivos en la tabla correspondiente de la distribución normal. (La

tabla se encuentra en el apéndice )

Ejem.

1. a) Calcular:

Graficamos la curva y marcamos los puntos Z=0 y Z=2 y luego sombreamos

el área comprendida entre los dos puntos.

La tabla de la distribución normal de una probabilidad de 0.4772.

47720.

3Z 2Z 1Z 0Z 3Z2Z1Z

Page 96: Estadistica i

b) Calcular:

0.4951 – 0.3944 = 0.1007

c) Calcular

0.5 – 0.4265 = 0.0736

d) Calcular:

393420.

3Z 2Z 1Z 0Z 3Z2Z1Z

49510.

?

Page 97: Estadistica i

0.4842 – 0.3289 = 1.1553

d) Calcular:

0.5 – 0.4878 = 0.0122

Ejem. El coeficiente de inteligencia de un grupo de alumnos tiene aproximadamente

una distribución normal con un puntaje promedio de 100 y una desviación estándar

de 10.5. Encontrar:

a) La proporción de alumnos con coeficientes de inteligencia mayores que

120

48420.

Page 98: Estadistica i

b) La proporción de alumnos con coeficientes de inteligencia menores que

115

c) La proporción de alumnos con coeficientes de inteligencia entre 114 y

124

d) Si el Nº total de alumnos es 180, Cual es el número de alumnos que

tienen coeficiente de inteligencia entre 114 y 124?

SOLUCIÓN

Datos:

= 100

σ = 10.5

a) X = 120

Sabemos que

Remplazando valores se tiene:

0.5 – 0.4713 = 0.0287

b) X = 115

0.5

Page 99: Estadistica i

Z=

Z = 1.43

0.5 + 0.4236 = 0.9236

c) X1 = 114 y X2 = 124

z1 = z2 =

z1 = 1.33 z2 = 2.29

0.5

0.4082

0.4890

Page 100: Estadistica i

0.4890 - 0.4082 = 0.0808

d) Ya sabemos que la probabilidad ante 114 y 124 años es 0.0808, entonces el N° de

alumnos será: 180x 0.0808 = 14.54

7.5. DISTRIBUCION CHI- CUADRADO

Es una prueba no parametrica que se utiliza para determinar la asociación entre

variables. La fórmula es la siguiente:

2 =

Ejem. A un grupo de 132 alumnos se les enseñó la matemática por tres métodos I, II y

III. Por el método I se enseño a 35 alumnos de los cuales 25 aprobaron. Por el método II

se enseño a 47 alumnos, de los cuales 12 desaprobaron. Por el método III se enseño a 50

alumnos , de los cuales 42 desaprobaron . Pruebe la hipótesis para verificar si los

métodos de enseñanza están asociados al rendimiento de los alumnos. Utilice α = 5%.

Solución

Vamos ha elaborar la tabla de datos:

Métodos de enseñanza Aprobados

fo fe

Desaprobados

fo fe

Total

I 25 27.05 10 7.95 35

II 35 36.32 12 10.68 47

III 42 38.64 8 11.36 50

TOTAL 102 30 132

Hipótesis :

Ho: Los métodos de enseñanza no están asociados al rendimiento de los alumnos

H1: Los métodos de enseñanza si están asociados al rendimiento de los alumnos

Reemplazando en la formula:

2 =

2 = 2.18 Valor calculado

Page 101: Estadistica i

Ahora encontramos el valor en la tabla de la chi cuadrado para poder comparar con el

valor calculado. Si el valor calculado es mayor que el valor de la tabla, rechazamos la

hipótesis nula ( Ho), Caso contrario aceptamos Ho .

Valor de la tabla: 20.95,(c-1)(f-1) = 2

0.95,1x2 = 20.95,2 = 5.99

Conclusión: Aceptamos Ho

7.6. EJERCICIOS

1. Se lanza 5 veces una moneda . Cual es la probabilidad de obtener:

a. Exactamente 3 caras

b. Por lo menos 3 caras

c. A lo mas dos caras

2. Se lanza un dado 7 veces. Cual es la probabilidad de obtener exactamente 4 veces el

Nº 6.

3. Un estudio de las corrientes de carga en sistemas de alimentación de computadoras en

instalaciones reveló que el 10% de las instalaciones tenían razones de corriente neutral a

corriente de carga total altas. Se escoge una muestra aleatoria de 5 sistemas de

alimentación de computadoras de un gran número de instalaciones , Que probabilidad

hay de que:

a. Exactamente tres tengan una relación de corriente neutral a corriente de carga total

alta.

b. Por lo menos 3 tengan una relación alta

c. Menos de 3 tengan una relación alta.

4. Calcule la media, la varianza y la desviación estándar de una variable aleatoria

binomial con n=20 y p = 0.6. Construya el intervalo ± 2σ.

5. El Nº de grietas por plancha de concreto hechas con cierto tipo de mezcla de

cemento tiene una distribución de probabilidad de poisson aproximada. Además , se

sabe que el Nº medio de grietas por plancha de concreto es 2.5.

a. Calcula la media y la desviación estándar .

b. Cual es la probabilidad de que una plancha de concreto escogido al azar tenga

exactamente 5 grietas.

c. Calcule la probabilidad de que una plancha de concreto escogido al azar tenga dos o

más grietas.

Page 102: Estadistica i

6. Un ingeniero de transito desea diseñar un sistema de control de tráfico. Estima que el

número medio de automóviles por minuto que llegan a una intersección es de 2. Que

probabilidad hay de que:

a. En un minuto dado, el número de llegadas sea de tres o más.

b. El número de llegadas sea a lo más 4.

7. En una central Telefónica se recibe en promedio 3 llamadas por minuto. Calcular la

probabilidad de que ocurran

a. Exactamente 4 llamadas en un minuto

b. A lo más 5 llamadas en un minuto.

c. Por lo menos 4 llamadas en un minuto.

8. Supongamos que el coeficiente de fricción para cierto sistema de copiado tiene una

distribución normal , con media igual a 0.55 y desviación estándar igual a 0.013.

Durante el funcionamiento del sistema, se mide el coeficiente de fricción en un

momento escogido al azar.

a. Calcular la probabilidad de que el coeficiente de fricción esté entre 0.53 y 0.56

b. Es verosímil observar un coeficiente de fricción por debajo de 0.50?

9. Una compañía de comunicación por cable ha determinado que el número de

interruptores terminales de de botón solicitados diariamente tiene una distribución

normal con una media de 200 y una varianza de 2500.

a. En que porcentaje de los días la demanda será de menos de 90 interruptores.

b. En que porcentaje de los días la demanda estará entre 225 y 275 interruptores.

10. Encontrar:

a. P ( Z 2.15 )

b. P ( Z ≥ - 1.95 )

c. P ( -0.95 Z – ¼ 1.75 )

d. P ( 2Z 2.86)

e. P ( | Z | 1.26

f. P ( -0.75 Z/ 2 1.05 )

Page 103: Estadistica i

BIBLIOGRAFIA

1. Canavos, G. “Probabilidad y Estadística. Aplicaciones y Métodos”

McGraw Hill, 1992.

2. Bury, K. Distribuciones Estadísticas para Ingenieros, Cambridge

University Press, New York, 1999.

3. Devore, J. “Estadística y Probabilidad para Ingeniería y Ciencias”

International Thomson Editores, 1998.

4. Hoog, R. y Craig, J. “Introduction to Mathematical Statistics”, Prentice

Hall, 1995.

5. Meyer, P., Probabilidad y Aplicaciones Estadísticas, Addison Wesley

Iberoamericana, Wilgminton, Delaware, 2002.

6. Miller, J.E. Freund y Johnson, R. Probabilidad y Estadística para

Ingenieros, Prentice Hall Hispanoamericana, Mexico, 1992.

7. Montgomery, D. y Runger, G. “Probabilidad y Estadística Aplicada a la

Ingeniería”, McGraw Hill ,1997.

8. Raymond, H., y Myers, S. “Probabilidad y Estadística para Ingenieros".

Sexta edición. 1998

9. Ross, S. Introducción a la Probabilidad y estadística para Ingenieros,

John Wiley and Sons, New york, 2000.

10.Walpole, R. “Estadística Matemática con Aplicaciones”. Prentice Hall

Hispanoamericana S.A, 1998.