I Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse...

50
I.- ESTADISTICA INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación. Anteriormente, sólo era aplicada en los asuntos de estado (de donde viene su nombre). Se dice que su desarrollo empezó cuando los jugadores trataron de encontrar un método que les permitiera ganar en los dados y las cartas; para ello recurrieron a las matemáticas. En el siglo XVIII Bernoulli estudió la probabilidad; posteriormente Laplace y Gauss la aplicaron a la astronomía. En el siglo XIX Quetelet la aplica a la investigación social y económica; Galton desarrolla métodos estadísticos en el campo social; Peanon estudia la correlación y regresión. Fisher aporta conocimientos dentro del área biológica. La necesidad de la estadística se presenta cuando hay que manejar un gran número de datos. Es una herramienta utilizada por: sociólogos, psicólogos, economistas, ingenieros, antropólogos, médicos, educadores, analistas de mercado, químicos, comunicadores, físicos, administradores, políticos y en otros muchos campos de la actividad humana para tomar decisiones dentro de su área de trabajo. DIVISION DE LA ESTADISTICA: La aplicación de la estadística se realiza mediante una serie de pasos que se pueden resumir como sigue: Recopilación.- Obtención de los datos mediante encuestas (investigación de mercado) o recabándolos directamente de archivos (manejo de datos históricos). Organización.- Principalmente mediante la elaboración de cuadros estadísticos los datos son ordenados. Análisis.- Es el procesamiento de los datos ordenados mediante el cálculo de ciertos valores para obtener resultados. Interpretación.- La interpretación es de suma importancia, ya que de ella dependen las acciones que se efectuarán posteriormente, pues en esta etapa se presenta la toma de decisiones.

Transcript of I Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse...

Page 1: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

I.- ESTADISTICA

INTRODUCCION.

Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación. Anteriormente, sólo era aplicada en los asuntos de estado (de donde viene su nombre). Se dice que su desarrollo empezó cuando los jugadores trataron de encontrar un método que les permitiera ganar en los dados y las cartas; para ello recurrieron a las matemáticas. En el siglo XVIII Bernoulli estudió la probabilidad; posteriormente Laplace y Gauss la aplicaron a la astronomía. En el siglo XIX Quetelet la aplica a la investigación social y económica; Galton desarrolla métodos estadísticos en el campo social; Peanon estudia la correlación y regresión. Fisher aporta conocimientos dentro del área biológica.

La necesidad de la estadística se presenta cuando hay que manejar un gran número de datos. Es una herramienta utilizada por: sociólogos, psicólogos, economistas, ingenieros, antropólogos, médicos, educadores, analistas de mercado, químicos, comunicadores, físicos, administradores, políticos y en otros muchos campos de la actividad humana para tomar decisiones dentro de su área de trabajo.

DIVISION DE LA ESTADISTICA:

La aplicación de la estadística se realiza mediante una serie de pasos que se pueden resumir como sigue:

Recopilación.- Obtención de los datos mediante encuestas (investigación de mercado) o recabándolos directamente de archivos (manejo de datos históricos).

Organización.- Principalmente mediante la elaboración de cuadros estadísticos los datos son ordenados.

Análisis.- Es el procesamiento de los datos ordenados mediante el cálculo de ciertos valores para obtener resultados.

Interpretación.- La interpretación es de suma importancia, ya que de ella dependen las acciones que se efectuarán posteriormente, pues en esta etapa se presenta la toma de decisiones.

Los pasos mencionados, quedan todos incluidos en las siguientes ramas de la estadística:

A. Teoría del muestreo (recopilación).B. Estadística descriptiva (organización y análisis).C. Inferencia estadística (interpretación).

I.1 ORGANIZACIÓN Y REPORTE DE DATOS

I.1.1POBLACION Y MUESTRA.

Page 2: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

Teoría del muestreo.- En una colección de datos que atañen a las características de un grupo de individuos u objetos, tal como alturas y pesos del estudiantado de una escuela, número de piezas defectuosas y no defectuosos en una fábrica en un determinado día, etc. con frecuencia, no es posible o no es práctico observar el total de los individuos. Para una recopilación adecuada de datos, se debe conocer la población (universo) objeto de estudio por medio de una muestra (pequeña parte) representativa. Al definir la muestra tendrán que considerarse las características o variables de los elementos que la definen.

Población.- Es el total de sujetos observables en la recopilación de datos. Ejemplos: En el estudio de un parque zoológico, el total de animales. En el estudio de la estatura de 12 000 estudiantes, la estatura de todos ellos.

Muestra.- Es la parte representativa de la población. Ejemplos: En el caso del parque zoológico, podrían ser 5 ardillas con sus características. En el caso de la estatura de los 12 000 estudiantes, podrían ser 100 estudiantes.

Variable.- Es una característica de los sujetos de la población que puede tomar cualquiera de los valores de un conjunto definido. Una clasificación de variables es:

Page 3: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

También se trabaja con valores constantes.- Únicamente pueden tomar un solo valor: el número de madres de una persona, las razones sociales de una empresa, etc.

a) Estadística descriptiva.- Organiza y analiza la información muestreada mediante el cálculo de algunos valores como: medidas de tendencia central, medidas de dispersión, medidas de forma, etc. Será lo que se estudiará en el desarrollo del curso.

b) Inferencia estadística.- Es la interpretación y proyección hacia el futuro de los resultados obtenidos en la estadística descriptiva mediante la toma de decisiones.

I.1.2 TOMA DE DATOS

Es la obtención de una colección de datos que no han sido ordenados numéricamente. Ejemplos: Conjunto de alturas de 100 estudiantes de una escuela, sacados de una lista alfabética u obtenidos por medio de una encuesta. Para el mejor manejo de los datos obtenidos, estos deben ordenarse numéricamente en orden creciente o decreciente.

I.1.3 REPORTES

Los reportes son las formas especiales en que se registran los datos para que se vayan recopilando y organizando.

I.2 GRAFICAS, TABLAS Y DISTRIBUCIONES DE FRECUENCIA

Page 4: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

I.2.1 TABLAS.

Las tablas o cuadros estadísticos son de gran utilidad para proporcionar de manera concisa y ordenada los datos. Pueden tener diferentes tipos de estructura; algunos ejemplos son los siguientes:

Los datos que a continuación se proporcionan son el resultado del examen global de Matemáticas de los alumnos del sexto año sección “A”:

9 10 8 8 7 9 9 5 9 10 8 8 8 8 9 8 5 7 8 10 89 6 9 5 8 5 8 9 8 6 8 7 8 9 5 10 8 8 10 9 8

Los anteriores resultados presentados en forma de cuadro estadístico quedan como sigue:

CALIFICACIONES DEL EXAMEN GLOBAL DE MATEMATICAS DE SEXTO “A”

CALIFICACION NUMERO DE ALUMNOS10

9

8

7

6

5

5

10

17

3

2

5

FUENTE: Actas de examen del Departamento de Servicios Escolares del C.B.T.I.S No. 159

En la tabla anterior, se observan las siguientes partes:

A. TítuloB. EncabezadosC. ContenidoD. FuenteE. Cuerpo: formado por los encabezados y el contenido

Una tabla debe estar elaborada de forma lógica: los encabezados principales deben contener la información más importante y los encabezados secundarios la información menos importante. A continuación se presenta un caso con mayor cantidad de datos.

CALIFICACIONES DE EXAMENES GLOBALES POR MATERIA Y GRUPO DE LOS SEXTOS

Page 5: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

CALCULO FISICA QUIMICA TALLERT O T AL E SA B A B A B A B

HO

MB

RES

10 5 3 3 5 4 2 5 7 349 7 2 10 8 5 4 6 8 508 10 8 10 7 12 7 9 8 717 9 7 5 4 10 8 8 1 526 2 4 4 2 3 2 4 1 225 1 2 2 1 - 3 2 1 11

M

UJE

RES

10 2 1 3 3 2 1 2 2 169 1 4 2 5 3 2 3 3 238 5 5 5 4 4 4 3 3 347 3 1 2 1 2 3 3 4 196 1 2 1 - 2 2 1 1 105 1 1 - - - 2 1 1 6

TOTALES 47 40 47 40 47 40 47 40 348FUENTE: Actas de examen del Departamento de Servicios Escolares del C.B.T.I.S. No. 159

I.2.2 HISTOGRAMAS Y POLIGONOS DE FRECUENCIA

En ocasiones, es más conveniente la representación gráfica de los cuadros estadísticos debido a que se facilita el análisis de los problemas. Algunas de estas representaciones gráficas son: gráficas circulares, de burbuja, de anillos, histogramas, polígonos de frecuencia, de cono, etc.

Histograma.- Es de las representaciones gráficas más usadas para fines estadísticos y consiste en un diagrama de barras verticales donde la altura de cada barra indica el número de observaciones de cada valor de la variable, representado por el punto medio de la base de la barra. El histograma correspondiente al primer cuadro es:

Para dibujar un histograma como el anterior, se elige la variable que se quiere representar y se grafica en el eje horizontal o de las abscisas (en este caso, la calificación). En el eje vertical o de las ordenadas, se representa el número de veces que se repite el valor de la variable y se le denomina frecuencia (en el ejemplo, el número de alumnos). Las barras se dibujan de manera que el valor de la variable sea el punto medio de la base, y la altura sea la frecuencia correspondiente.

De la segunda tabla, los histogramas correspondientes a las calificaciones de las cuatro materias en el grupo de sexto “B”, son los siguientes:

5 6 7 8 9 1002468

1012141618

5

23

17

10

5

CALIF. GLOBAL DEL EXAMEN DE MATEMATICAS DE SEXTO "A"

CALIFICACION

FR

EC

UE

NC

IA

Page 6: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

Polígonos de frecuencia.- Es la representación gráfica de un conjunto de datos en la que se unen los puntos superiores que determinan las alturas o frecuencias (ordenadas). Los polígonos de frecuencia correspondientes a los histogramas vistos son los siguientes:

5 6 7 8 9 100

2

4

6

8

10

12

14

3

68

13

64

CALCULO

CALIFICACION

FRECUENCIA

5 6 7 8 9 1002468

101214

12

5

1113

8

FISICA

CALIFICACION

FRECUENCIA

5 6 7 8 9 100

2

4

6

8

10

12

54

11 11

6

3

QUIMICA

CALIFICACION

FR

EC

UE

NC

IA

5 6 7 8 9 100

2

4

6

8

10

12

2 2

5

11 11

9

TALLER

CALIFICACION

FR

EC

UE

NC

IA

5 6 7 8 9 100

2

4

6

8

10

12

14

3

6

8

13

6

4

CALCULO

CALIFICACION

FRECUENCIA

5 6 7 8 9 100

2

4

6

8

10

12

14

12

5

1113

8

FISICA

CALIFICACION

FRECUENCIA

Page 7: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

I.2.3 DSTRIBUCIONES DE FRECUENCIA

A una gran cantidad de datos, que son repartidos en grupos llamados clases o categorías con su correspondiente número (frecuencia) de individuos pertenecientes a cada clase y que son presentados en forma tabular, se le denomina distribución de frecuencias o tabla de frecuencias. Algunos conceptos que intervienen en la formación de una distribución de frecuencias son:

a) Valor mayor de los datos.- Máximo valor que toma la variable.b) Valor menor de los datos.- Mínimo valor que toma la variable.c) Ordenación.- Es la colocación de datos numéricos tomados en orden creciente o decreciente.d) Rango o recorrido.- Es la diferencia entre el valor mayor y el valor menor. e) Intervalos.- Cada una de las partes iguales (en algunos casos pueden no ser iguales) en que se

divide el rango. Cada una de las bases de las barras del histograma.f) Amplitud o tamaño del intervalo.- Diferencia entre fronteras superior e inferior a cada

intervalo.g) Clase o categoría.- Cada uno de los intervalos.h) Frontera inferior.- Valor de la variable con el cual se inicia un intervalo.i) Frontera superior.- Valor de la variable con el cual termina un intervalo.j) Marca de clase.- Valor medio entre las fronteras superior e inferior de un intervalo.k) Frecuencia absoluta.- Número de observaciones que corresponden a cada intervalo

representado por su marca de clase.l) Frecuencia relativa.- Porcentaje de observaciones que corresponde a cada intervalo.m) Histograma.- Representación gráfica de la distribución de frecuencias de una variable en

forma de diagrama de barras. Función cuyas abscisas son los valores de la variable y cuyas ordenadas las frecuencias correspondientes.

REGLAS GENERALES PARA FORMAR LAS DISTRIBUCIONES DE FRECUENCIA.

1) Determinar el rango (diferencia entre el mayor y el menor de los valores de la variable)2) Dividir el rango entre un número conveniente de intervalos del mismo tamaño. Se recomienda

utilizar alguna de las siguientes sugerencias:

5 6 7 8 9 100

2

4

6

8

10

12

54

11 11

6

3

QUIMICA

Calificación

Fre-cuencia

5 6 7 8 9 100

2

4

6

8

10

12

2 2

5

11 11

9

TALLER

CALIFICACION

FR

EC

UE

NC

IA

Page 8: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

a) El número de intervalos generalmente se toma entre 5 y 20 dependiendo de los datos.b) Fórmula de Sturges: número de intervalos N° I =1+3.3·log n , donde n es el número de datos

c) La raíz del número de datos: N° I = √n , donde n es el número de datos d) Se puede utilizar también la siguiente tabla:

CANTIDAD DE DATOS ( N ) CLASES (C)

20 a menos de 30 530 a 50 6 o 7Más de 50 a 100 7, 8 o 9

Más de 100 a 300 8, 9 o 10

Más de 300 a 1000 9, 10 u 11

3) Determinar el número de observaciones que caen dentro de cada intervalo (frecuencias).

PROBLEMA: Los resultados de un examen de matemáticas son las calificaciones que a continuación se presentan:

46 48 64 76 78 54 39

80 48 60 64 59 62 57

57 61 63 68 72 64 57

59 65 68 67 71 72 75

94 86 41 68 67 61 69

76 65 66 28 68 67 61Se desea elaborar el histograma que represente los datos anteriores.

Para iniciar la organización de los datos, primero se debe decidir cuantos intervalos son necesarios para representar los datos. Esto se logra determinando el rango al calcular la diferencia entre los valores mayor y menor de la variable.

R = X máx - X mín = 94 – 28 = 66 Dividiendo el rango entre el número de intervalos deseados, se obtendrá la amplitud del intervalo.

amplitud = R / Número de intervalos = 66 / 6 = 11

A continuación, se suma al valor menor (X mín ) la amplitud del intervalo y se encuentra un valor llamado frontera o límite.

28 + 11 = 39

Page 9: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

El valor 39 será la frontera superior del primer intervalo y la frontera inferior del segundo intervalo. Para calcular la frontera superior del segundo intervalo se suma a su frontera inferior (frontera superior del primer intervalo) la amplitud de intervalo.

39 + 11 = 50

El 50 es la frontera superior del segundo intervalo y frontera inferior del tercer intervalo. En la misma forma, se calculan las restantes fronteras hasta llegar al sexto intervalo. Se observa que la frontera inferior del primer intervalo corresponde al valor menor (X mín ) y la frontera superior del último intervalo al valor mayor (X máx ). Los pares de fronteras (inferior y superior) definen las clases, categorías o intervalos. Mediante una tabulación, lo anterior se representa como muestra la figura:

Con la semisuma de las fronteras de cada intervalo (valor medio entre las dos fronteras), se determinan las marcas de intervalo o marcas de clase ( mc ). Para el primer intervalo será:

mc = (frontera superior + frontera inferior) / 2 = (39 + 29) / 2 = 33.5

De la misma forma se calculan las restantes quedando como se muestra en la tabulación:

Para cada marca de clase se tendrá una frecuencia determinada. Esta frecuencia será el número de observaciones de la tabla original comprendidas dentro de cada intervalo. Para realizar esta parte del proceso, se elabora la siguiente tabla:

Page 10: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

NOTA: en la tabla se tomó como criterio que si la observación corresponde a una frontera, se debe clasificar en el intervalo anterior; ejemplo, 39 se ubicó en el primer intervalo y 61 en el tercero.

El histograma de esta distribución de frecuencias es:

Debe hacerse la aclaración de que esta distribución de frecuencias no es única, pues si en lugar de haber decidido que fueran 6 intervalos se hubieran considerado 11 por ejemplo; muchas veces el número de intervalos depende de que la amplitud del intervalo sea un número entero.

I.2.4 FRECUENCIA RELATIVA.

Las frecuencias calculadas se denominan frecuencias absolutas; en ocasiones, se necesitan valores de frecuencias que permitan una comparación lógica, para tal caso, se usan las frecuencias relativas, que son aquellas que se indican como un porcentaje del total de observaciones. Las frecuencias relativas en ejemplo anterior son:

2 42 100 = 4.76 % 4 42 100 = 9.52 % 10 42 100 = 23.81 %

19 42 100 = 45.24 % 5 42 100 = 11.91 % 2 42 100 = 4.76 %

33.5 44.5 55.5 66.5 77.5 88.502468

101214161820

2

4

10

19

5

2

CALIFICACIONES DE EXAMEN DE MATEMATICAS

Calificación

Frecuencia

Page 11: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

El histograma correspondiente sería:

I.2.5 FRECUENCIA ACUMULADA

Como ya se trató anteriormente, todos los histogramas, tanto de frecuencia absoluta como de frecuencia relativa, tienen un correspondiente polígono de frecuencias; si la frecuencia es absoluta, se llama polígono de frecuencias absolutas; si la frecuencia es relativa, se llamará polígono de frecuencias relativas. o polígono porcentual.

Ahora, consideremos la siguiente tabulación:

Además de las frecuencias mencionadas, como podemos observar en la tabla, también se usan las frecuencias acumuladas, la frecuencia acumulada absoluta para cada clase se calcula sumando o acumulando todas las frecuencias absolutas de los intervalos anteriores a la frecuencia del intervalo en cuestión.

La frecuencia acumulada absoluta para cada marca de clase se obtiene

33.5 44.5 55.5 66.5 77.5 88.505

101520253035404550

4.769.52

23.81

45.24

11.91

4.76

HISTOGRAMA DE FREC. RELATIVAS

Calificación

Frecuencia

33.5 44.5 55.5 66.5 77.5 88.50

5

10

15

20

25

30

35

40

45

2

6

16

35

4042

POLIGONO DE FREC. ACUM. ABSOLUTAS

Calificación

Frec. Acum. Absoluta

Page 12: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

sumando o acumulando todas las frecuencias absolutas de los intervalos anteriores a la frecuencia del intervalo presente, por ejemplo, la frecuencia acumulada para la marca de clase 55.5 es: 2 + 4 + 10 = 16; es decir, se suman las frecuencias absolutas de intervalos anteriores (2 y 4) a la frecuencia absoluta del intervalo de que se trate ( 10 ). La curva de frecuencias acumuladas absolutas o polígono de frecuencias acumuladas absolutas u ojiva es:

Como se observa, la curva tiene forma de S, por lo que también se le llama curva S.

Si en lugar de considerar las frecuencias absolutas se consideran las frecuencias relativas, tendremos entonces la curva de frecuencias acumuladas relativas o polígono de frecuencias acumuladas relativas o polígono de frecuencias porcentual acumuladas (también llamado ojiva porcentual) cuya gráfica es:

I.3 DESCRIPCION DE DATOS

I.3.1 CENTILES, DECILES Y CUARTILES

El trazado de un polígono de frecuencias acumuladas relativas u ojiva porcentual nos permite, mediante las gradaciones del eje vertical, localizar en el eje horizontal los centiles de la variable. Se llaman centiles a los valores de la variable x que corresponden a cada uno de los porcentajes, por tanto, habrá cien centiles en cada curva de frecuencias acumuladas relativas. Consideremos los siguientes casos:

C10 = 38

33.5 44.5 55.5 66.5 77.5 88.50

10

20

30

40

50

60

70

80

90

100

4.76

14.28

38.09

83.33

95.24100

POLIGONO DE FREC. ACUM. RELATIVAS

Calificación

Frec. Acum. Relativa(%)

Page 13: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

C25 = 49.5C80 = 65que se leen “el centil diez es igual a treinta y ocho” , “el centil veinticinco es igual a cuarenta y nueve y medio” y “el centil ochenta es igual a sesenta y cinco”.

Estos valores se obtienen trazando una recta del porcentaje del centil en el eje de las ordenadas a un punto de la curva S. A partir de ese punto se dibuja una recta vertical, hasta cortar el eje de las abscisas. Mediante esta operación se determina el valor del centil mencionado. Los valores así encontrados dependen grandemente de la precisión con que se trace la gráfica correspondiente y de una lectura adecuada.

Por lo anterior, se debe entender que un centil es el valor de la variable que corresponde a un porcentaje determinado; por ejemplo, 38 es el valor de la variable que corresponde a un 10 % de observaciones.

A partir de los centiles se pueden definir los deciles. Se llama decil al valor de la variable que corresponde a los centiles 10, 20, 30, 40, 50, 60, 70, 80, 90 y 100. Esta correspondencia se expresa así:

D1 = C10 (decil uno es igual a centil 10)D2 = C20

D3 = C30

D4 = C40

. . .

. . .D10 = C100 (decil diez es igual a centil 100)

Otro valor importante es el cuartil, los cuartiles son aquellos valores de la variable que dividen en cuatro partes de igual tamaño a las observaciones y se escriben así:

Q1 = C25 (cuartil uno es igual a centil veinticinco)Q2 = C50 Q3 = C75 Q4 = C100 (cuartil cuatro es igual a centil cien).

Podemos resumir que, a partir del polígono de frecuencias acumuladas relativas u ojiva, es posible calcular los siguientes valores de la variable:

Centil.- Valor de la variable que comprende un determinado tanto por ciento de las observaciones. Existen cien centiles.

Decil.- Valor de la variable que comprende el 10, 20, 30, . . . , 100 por ciento de las observaciones. Existen diez deciles.

Cuartil.- Valor de la variable que comprende el 25, 50, 75 o 100 por ciento de las observaciones. Existen cuatro cuartiles.

Los valores Q2 , D5 y C50 son iguales y se denominan mediana. Posteriormente se tratará este y otros valores importantes de la variable.

Page 14: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

I.3.2 TIPOS DE CURVAS DE FRECUENCIA

Un conjunto de datos puede considerarse normalmente como perteneciente a una muestra extraída de una población grande. Teóricamente, para datos continuos, se pueden elegir intervalos de clase más pequeños; que, en un polígono de frecuencias o de frecuencias relativas se representan con segmentos de recta más pequeños que aproximan al conjunto a una curva, por lo que, estas gráficas se llaman: curvas de frecuencia o curvas de frecuencias relativas. Estas curvas, por ser una aproximación a los polígonos reales, se llaman también polígonos de frecuencia suavizados. Las curvas de frecuencia presentan formas características que las distinguen y son:

Page 15: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

a) Las curvas simétricas o bien formadas tienen la característica de que las observaciones que equidistan del máximo central tienen la misma frecuencia.

b) En las curvas moderadamente asimétricas o sesgadas la cola de la curva a un lado del máximo central es mayor que al otro lado.

c) En las curvas en forma de J o de J invertida, el máximo se presenta en un extremo.d) Las curvas en forma de U tienen el máximo en ambos extremos.e) La curva de frecuencias bimodal tiene dos máximos.f) La curva de frecuencias multimodal tiene mas de dos máximos

EJERCICIOS I.

1. Con los grupos de la especialidad, realizar los pasos de la recopilación de datos (mediante encuesta) y organizarlos (cuadros estadísticos) considerando las variables: edad, peso, estatura y grupo. Elabora la distribución de frecuencias correspondiente a cada variable.

2. Con la distribución de frecuencias del salario de 65 empleados, determinar lo que en cada inciso se pide.

Salario Número de personas

90.00 100.00 15

100.00 110.00 21

110.00 120.00 10

120.00 130.00 8

130.00 140.00 6

140.00 150.00 5

a) Marca de clase de cada intervalo.

b) Rango de la variable.

c) Histograma con frecuencia relativa.

d) Polígono de frecuencia acumulada relativa.

e) Centil 82

3. Elaborar un esquema de cuadro estadístico donde se relacionen año de producción ( 1971, 1972, 1973 y 1974 ), cereales cultivados ( maíz, trigo y arroz ) y el tipo de suelo ( riego o temporal ). Lo de mayor importancia es el año de producción, después tipo de suelo y por último clase de cereal. El título será ”Producción de cereales de 1971 a 1974 en millones de toneladas”

Page 16: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

4. La siguiente es una muestra de gastos semanales en 24 familias:

85 75 81 73 97 109100 85 95 88 98 7898 76 100 68 108 8988 64 81 70 105 64

a) Hacer un histograma con 5 intervalos

b) Trazar el polígono de frecuencia acumulada relativac) Dar los valores de los deciles

d) Dar los valores de los cuartiles

5. Relaciona las columnas anotando el número correspondiente en el paréntesis

( ) Muestra

( ) Teoría del muestreo

( ) Población

( ) Inferencia estadística

( ) Estadística descriptiva

( ) Variable

1. Total de sujetos observables

2. Característica que se observa en una muestra

3. Organiza y analiza la información

4. Estudia la forma de recopilar datos en forma representativa

5. Parte representativa de una población

6. Interpretación y proyección de los resultados obtenidos

7. Toma de decisiones

6. Anota la letra C dentro del paréntesis si el enunciado se refiere a una variable continua y la letra D si se refiere a una variable discreta

( ) Número de coches que pasan cada día por un determinado lugar de una carretera.

( ) Las estaturas de los integrantes del equipo de basquetbol.

( ) El número de accidentes que ocurren cada día en México.

( ) la cantidad den leche que trae un envase de tamaño mediano.

( ) La Cantidad de personas que asisten diariamente a la biblioteca.

Page 17: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

I.4 MEDIDAS DE TENDENCIA CENTRAL

I.4.1 NOTACION CON INDICE O SUBINDICE

El símbolo xj ( se lee “x sub j “) denota cualquiera de los valores x1 , x2 , x3 , . . . . , xN que una variable x pueda tomar. La letra j (que puede ser i, k, p, q, s) en xj puede representar cualquiera de los números 1, 2, 3, 4, . . . . ,N y se llama índice o subíndice.

I.4.2 NOTACION SUMATORIA N

El símbolo xi se utiliza para indicar la suma o de todas las xi desde i = 1 hasta N, es decir: i=1 N

xi = x1 + x2 + x3 + . . . + xN

i=1

El símbolo es la letra griega mayúscula sigma, denotando suma o sumatoria. Casos generales de las sumatorias son:

N

1) xj yj = x1 y1 + x2 y2 + x3 y3 + . . . + xN yN

j =1

N

2) a xi = a x1 + a x2 + a x3 + . . . + a xN = a ( x1 + x2 + x3 + . . . + xN ) i=1

N

= a xi donde a es una constante. i=1

Si a, b, y c son constantes; entonces:3) ( a x + b y - c z ) = a x + b y - c z

I.4.3 PROMEDIOS Y MEDIDAS DE CENTRALIZACION

Un promedio es un valor considerado como representativo de un conjunto de datos. Dichos valores tienden a ubicarse al centro de un conjunto de datos ordenados, por lo que nos indican alrededor de que valor se agrupan el mayor número de casos en estudio; también se conocen como medidas de

Page 18: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

centralización. Las medidas de centralización más comunes son: la media aritmética o media, la mediana, la moda, la media geométrica, la media armónica. Estudiaremos las tres primeras.

I.4.4 MEDIA ARITMETICA. PROPIEDADES

La media, valor medio o promedio aritmético, es una medida de posición que se obtiene sumando todos los valores de la variable y dividiendo la suma entre el número de sumandos. En un conjunto de N números X1 + X2 + X3 + . . . + XN; la media aritmética es:

__ X = ( x1 + x2 + x3 + . . . + xN ) N =

N

= ( xi = x1 + x2 + x3 + . . . + xN ) N = x N i=1

Ejemplo: El número de alumnos de los sextos: A, D, E y H es respectivamente: 38, 16, 11 y 13; su media es:

__ __ X = ( 38 + 16 + 11 + 13 ) 4 = ( 78 ) 4 = 19.5; X = 19.5 Cuando los x1 + x2 + x3 + . . . + xN valores tienen frecuencias f1, f2, f3, ....., fN respectivamente; la

media aritmética será: __

X = ( f1x1 + f2x2 + f3x3 + .....+ fNxN ) (f1 + f2 + f3 + ........f N ) = N N

= fj xj fj = f x f j =1 j =1

Ejemplo: Si 5, 8, 6 y 2 se presentan con frecuencias 3, 2, 4 y 1 respectivamente; la media aritmética será:

__ X = 3 (5) + 2 (8) + 4(6) + 1(2) 3 + 2 + 4 + 1 = 57 10 __ X = 5.70

De lo anterior se define:

Media aritmética ponderada.- Cuando a los valores x1, x2 , x3 , ....., xK se asocian los factores o pesos w1, w2 , w3 , ....., wK su promedio es la media aritmética ponderada que se determina mediante la siguiente fórmula:

__ X = ( w1x1 + w2x2 + w3x3 + .....+ wKxK ) (w1 + w2 + w3 + ........w K ) =

K K

= wj xj wj = w x w j=1 j =1

Page 19: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

Ejemplo: Una serie de números está formada por 6 seises, 7 sietes, 8 ochos, 9 nueves y 10 dieces; ¿ Cuál será su media aritmética

__X = 6 (6) + 7 (7) + 8(8) + 9(9) + 10(10) 6 + 7 + 8 + 9 + 10 = 330 40 __ X = 8.25

Al calcular la media aritmética a partir de datos agrupados, se multiplica la marca de clase por su frecuencia respectiva, se suman los productos para después dividir el total entre la suma de frecuencias.

PROPIEDADES DE LA MEDIA ARITMETICA: __

I. La suma algebraica de las desviaciones de un conjunto de números de su X es cero.

II. La suma de los cuadrados de las desviaciones de un conjunto de números xJ de cualquier número a, es mínima sólo si __a = X.

III. Si f1 números tienen de media m1, f2 números tienen de media m2, fK números tienen de media mK, la media de todos los números será:__ X = ( f1m1 + f2m2 + f3m3 + .....+ fKmK ) (f1 + f2 + f3 + ........f K )

IV. Si A es cualquier supuesta media aritmética (cualquier número) y si dJ = xJ – A son las desviaciones xJ de A, entonces:__ N

X = A + [ dj N] = A + [ d N]; j =1

__ N N

X = A +[ fJdj fj ] = A + [f d f ]; f = N j =1 j =1

Ejemplo: Las tablas que se presentan a continuación, son las distribuciones de frecuencias de la edad de 77 alumnos (Sextos: A, D, E y F) en años; determinar la media aritmética:

SEXTO “A”, “D”, “E” Y “H” SEXTO “A” SEXTO “D”, “E” Y “H”

Edad (años)

Frecuencia Edad (años)

Frecuencia Edad (años)

Frecuencia

17 52 17 29 17 2318 16 18 5 18 1119 6 19 3 19 320 1 20 20 121 1 21 21 1

Page 20: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

22 - 22 2223 - 23 2324 1 24 1 24

77 38 39

Los datos se organizan en tablas de la siguiente manera: SEXTO “A”, “D”, “E” Y “H” SEXTO “A” SEXTO “D”, “E” Y “H”

Edad (x)

Frec.(f)

(fx) Edad (x)

Frec.(f)

(fx) Edad (x)

Frec.(f)

(fx)

17 52 884 17 29 493 17 23 39118 16 288 18 5 90 18 11 19819 6 114 19 3 57 19 3 5720 1 20 20 20 1 2021 1 21 21 21 1 2122 - 22 2223 - 23 2324 1 24 24 1 24 24

77 1351 38 664 39 687

La solución es:

Para Sexto “A”, “D”, “E” y “H”:__ __ X = f x f = 1351 77 = 17.54; X = 17.54

Para Sexto A:__ __X = f x f = 664 38 = 17.47; X = 17.47

Para Sexto “D”, “E” y “H”:__ __ X = f x f = 687 39 = 17.6; X = 17.6

Determinar la media aritmética para Sexto “A” usando la propiedad IV suponiendo A = 17

SEXTO “A

Edad (x)

Desviaciónd = x - A

Frec.(f)

(fd)

A 17 0 29 018 1 5 519 2 3 6

Page 21: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

20 3 021 4 022 5 023 6 024 7 1 7

38 18

__ X = A + [f d f ] = 17 + [18 38 ] = 17 + 0.4736 __ X = 17.47

I.4.5 MEDIANA Y MODA

Moda.- La moda o valor modal es otra medida de posición que se define como el valor de la variable que se presenta con mayor frecuencia; es el valor más común. La moda puede no ser única o incluso puede no existir. Ejemplos:

a) De 2, 2, 5, 7, 9, 9, 9, 10, 10, 12, y 18 la moda es 9 y se llama distribución unimodal.

b) En 3, 5, 8, 10, 12, 15 y 16 no existe moda.

c) En 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 y 10 las modas son 4 y 7 y se llama distribución bimodal.

En el caso de datos agrupados, la moda será el valor o los valores de x correspondientes al máximo o a los máximos de la curva de frecuencias.

De una distribución de frecuencias o de un histograma, la moda se calcula con:

Moda = x = L1 + [ 1 ( 1 + 2 ) ] (c)

L1 = Límite real inferior de la clase modal.

1 = Exceso de la frecuencia modal sobre la frecuencia de clase inferior.

2 = Exceso de la frecuencia modal sobre la frecuencia de clase superior.

c = Tamaño del intervalo de la clase modal

Ejemplo: Calcular la moda de la distribución de frecuencias siguiente:

Calificación Frecuencia28 – 39 239 – 50 450 – 61 10

Page 22: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

61 – 72 1972 – 83 583 - 94 2

42

L1 = 61; 1 = 19 – 10 = 9; 2 = 19 – 5 = 14; c = 11

x = L1 + [ 1 ( 1 + 2 ) ] (c) = 61 + [ 9 ( 9 + 14 ) ] (11) = = 61 + ( 0.3913 ) ( 11 ) = 61 + 4.30

x = 65.30

Mediana.- La mediana en una colección de datos ordenados es el valor medio o la media aritmética de los dos valores medios. Es el valor de la variable que muestra tanto a la izquierda como a la derecha, la mitad de las frecuencias. Este valor coincide ( como ya se mencionó ) con el decil cinco o cuartil dos o centil cincuenta; por lo que, para calcular su valor, se puede usar la curva de frecuencias acumuladas relativas. Ejemplos:

Encontrar la mediana de las siguientes calificaciones de un examen : 84, 91, 72, 68, 87 y 78;en orden quedarán: 68, 72, 78, 84, 87 y 91; los valores medios son 78 y 84,

La mediana = x = ( 78 + 84 ) / 2 = 81

Para datos agrupados, la mediana se calcula con: Mediana = x = L1 + [ ( N / 2 – {f}1 ) ( fmediana ) ] (c)

L1 = Límite real inferior de la clase mediana.

N = Número total de datos. {f}1 = Suma de frecuencias de las clases por debajo de la mediana.

fmediana = Frecuencia de la clase mediana.

c = Tamaño del intervalo de la clase mediana

Ejemplo: Calcular la mediana de la distribución de frecuencias siguiente:

Calificación M. C.( x )

Frecuencia( f )

f x

28 – 39 33.5 2 67.039 – 50 44.5 4 178.050 – 61 55.5 10 555.061 – 72 66.5 19 1263.5

Page 23: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

72 – 83 77.5 5 387.583 - 94 88.5 2 177.0

42 2628.0

N/2 = 42 / 2 = 21; las frecuencias de la primera, segunda y tercera categorías sumadas son 16, si se agrega la frecuencia de la siguiente clase, sumarán 35, por lo que la clase mediana es la cuarta.

L1 = 61; N = 42; {f}1 = 16; fmediana = 19 c = 11

Mediana = x = L1 + [ ( N / 2 – {f}1 ) ( fmediana ) ] (c) = 61 + [ (21 – 16) ( 19 ) ] (11) =

x = 61 + [ (5) ( 19 ) ] (11) = 61 + ( 0.2631 ) ( 11 ) = 61 + 2.8947 =

x = 63.89

Ejemplo: Calcular la mediana de la distribución de frecuencias siguiente:

Estatura M. C.(x)

Frecuencia( f )

f x

153-157 155 3 465157-161 159 5 795161-165 163 9 1467165-169 167 2 334169-173 171 7 1197173-177 175 6 1050177-181 179 4 716181-185 183 2 636

38 6660

N/2 = 38 / 2 = 19; las frecuencias de la primera, segunda y tercera categorías sumadas son 17, si se agrega la frecuencia de la siguiente clase, sumarán 19, por lo que la clase mediana es la cuarta.

L1 = 165; N = 38; {f}1 = 17; fmediana = 2 c = 4 Mediana = x = L1 + [ ( N / 2 – {f}1 ) ( fmediana ) ] (c) = 165 + [ (19 – 17) ( 2 ) ] (4) =

x = 165 + [ (2) ( 2 ) ] (4) = 165 + ( 1.0 ) ( 4 ) = 165 + 4.0 =

x = 169.0 Media = 175.2631 Moda = 162.4545

La fórmula Mediana = x = L1 + [ ( N / 2 – {f}1 ) ( fmediana ) ] (c)

Se puede aplicar al cálculo de cualquier centil haciéndole los siguientes ajustes:

Cx = Lx + [ ( (% N) – {f}x ) ( fx ) ] (c)

Page 24: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

Cx = Centil

Lx = Límite real inferior de la clase del % ( casos )

(%N) = Número de datos. {f}x = Suma de frecuencias de las clases por debajo de la clase del % de casos.

fx = Frecuencia de la clase de los (% de N) casos.

c = Tamaño del intervalo de la clase de los (% N) casos.

Ejemplo: Calcular el C75 de la distribución de frecuencias del caso anterior:

(%N) = 0.75 (38) = 28.5 Lx = 173 {f}x = 26 fx = 6 c = 4

C75 = 173 + [ ( 28.5) – {26} ) ( 6 ) ] (4) = 173 + [ ( 2.5) ( 6 ) ] (4) = 173 + 1.66

C75 = 174.66

Ejemplo: Calcular el C25 de la distribución de frecuencias del caso anterior:

(%N) = 0.25 (38) = 9.5 Lx = 161 {f}x = 8 fx = 9 c = 4

C25 = 161 + [ ( 9.5) – {8} ) ( 9 ) ] (4) = 161 + [ ( 1.5) ( 9 ) ] (4) = 161 + 0.66

C25 = 161.66

Ejemplo: Calcular los centiles determinados gráficamente con anterioridad.

Para el cálculo del centil 10:

(%N) = 0.10 (42) = 4.2 Lx = 39 {f}x = 2 fx = 4 c = 11

C10 = 39 + [ ( 4.2) – {2} ) ( 4 ) ] (11) = 39 + [ (2.2) (4) ] (11) = 39 + 6.05

C10 = 45.05

Para el cálculo del centil 80:

(%N) = 0.80 (42) = 33.6 Lx = 61 {f}x = 16 fx = 19 c = 11

C80 = 61 + [ ( 33.6) – {16} ) ( 19 ) ] (11) = 61 + [ (17.6) (19) ] (11) = 61 + 10.19

C80 = 71.2

Page 25: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

I.4.6 RELACION EMPIRICA ENTRE MEDIA, MEDIANA Y MODA

Para los polígonos de frecuencia unimodales y moderadamente asimétricos se cumple la relación siguiente entre las medidas de posición estudiadas ( para curvas simétricas, estos valores coinciden ):

MEDIA - MODA = 3 ( MEDIA - MEDIANA )

Las posiciones relativas de estos valores se muestran en la siguiente figura:

Ejemplo: De las tablas siguientes, determinar las tres medidas de posición:

TABLA I TABLA II TABLA III

Int. M. C.x

Frec.F

Fx Int. M. C.x

Frec.F

Fx Int. M. C.x

Frec.F

fx

10-13 11.5 4 46.0 50-60 55 8 440 5-10 7.5 5 37.513-16 14.5 6 87.0 60-70 65 10 650 10-15 12.5 10 125.016-19 17.5 10 175.0 70-80 75 16 1200 15-20 17.5 9 157.519-22 20.5 6 123.0 80-90 85 14 1190 20-25 22.5 3 67.522-25 23.5 4 94.0 90-100 95 10 950 25-30 27.5 1 27.5

30 525.0 100-110 105 5 525 28 415.0110-120 115 2 230

65 5185

Moda = L1 + [ 1 ( 1 + 2 ) ] (c)

T I: 17.5 T II: 77.5 T III: 14.16

Mediana = x = L1 + [ ( N / 2 – {f}1 ) ( fmediana ) ] (c)

T I: 17.5 T II: 79.0625 T III: 14.50 __

Media = X = f x f = 1351 77 = 17.54

T I: 17.5 T II: 79.7692 T III: 14.78

Page 26: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

EJERCICIOS II.

1. Elegir una de las cinco alternativas dadas para cada caso.

A. La mediana es equivalente a:

a) Cuartil 3 b) Decil 5 c) Centil 25 d) Media e) Moda B. ¿Cuál histograma es bimodal?

C. El

valor medio de 3.5, 7.2, 9.7, 8.3, 5.7, 9.1 y 4.8 es:

a) 48.3 b) 7.2 c) 9.7 d) 6.53 e) 6.9

D. El valor de la mediana de 3.5, 7.2, 9.7, 8.3, 5.7, 9.1 y 4.8 es:

a) 7.2 b) 6.9 c) 6.53 d) 9.1 e) 6.35

E. El valor de la moda de 3.5, 7.2, 9.7, 8.3, 7.2, 5.7, 9.1 y 4.8 es:

a) 48.3 b) 7.2 c) 9.7 d) 6.53 e) 6.9

2. Escribir los sumandos de cada una de las siguientes sumas indicadas:

6

A. xj j =1

4

B. (yj - 3)2 j =1

N

C. a j =1

5

D fk yk k =1

3

E (xk – a ) k =1

Page 27: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

3. Las variables x e y toman los valores x1 = 2, x2 = -5, x3 = 4 y x4 = -8; y1 = -3, y2 = -8, y3 = 10 y y4

= 6. Calcular: (a) x, (b) y, (c) xy, (d) x2, (e) y2, (f) xy, (g) xy2, (h) ( x + y ) ( x - y )

4. Con las distribuciones de frecuencias elaboradas con la edad, peso, estatura y grupo con los grupos de la especialidad, calcular las tres medidas de tendencia central vistas con cada variable.

5. Con la distribución de frecuencias del salario de 65 empleados, calcular la media aritmética, mediana y moda. Suponer como media la marca de clase del quinto intervalo y determinar la media aritmética.

Salario Número de personas

90.00 100.00 15

100.00 110.00 21

110.00 120.00 10

120.00 130.00 8

130.00 140.00 6

140.00 150.00 5

6. Las calificaciones de un estudiante en cuatro materias del curso fueron: 82, 86, 90 y 70:

a) Si la importancia que se asigna a cada materia es 3, 5, 3 y 1 respectivamente, ¿Cuál es el promedio de sus calificaciones?

b) ¿Cuál es su promedio si todas tienen igual importancia?

Page 28: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

I.5 MEDIDAS DE DISPERSION O VARIACION.

La dispersión o variación en un conjunto de datos numéricos es el grado en que estos se extienden alrededor de un valor medio. Las medidas de variación o dispersión más usuales son:

a) Rango.b) Desviación media.c) Rango semiintercuartílico.d) Rango entre centiles 10-90.e) Desviación típica.

I.5.1 RANGO.

Como ya se indicó, es la diferencia entre el mayor de los valores y el valor menor en un conjunto de números. En ocasiones se indica con la notación de los números menor y mayor. Ejemplo:

Determinar el rango de los números: 2, 3, 3, 4, 5, 5, 5, 8, 10, 12:

El rango es R = 12 – 2 = 10 o R = 2-12

I.5.2 DESVIACION MEDIA O PROMEDIO DE DESVIACION.

La desviación media es la sumatoria de todas las diferencias ( en valor absoluto ) de cada número xj y la media aritmética del conjunto de números de que se trate dividida entre el total de datos.

Para datos aislados: N __ __ ________m.d. = xj – X N = x - X N = x – X

j =1

donde: __

X es la media aritmética de los números __ __ xj – X es el valor absoluto de las desviaciones de las diferentes xj de X

Ejemplo: Hallar la desviación media de 2, 3, 6, 8, 11.__

X = ( 2 + 3 + 6 + 8 + 11 ) 5 = 30 5 = 6

m.d. = (2 – 6 + 3 – 6 + 6 – 6 + 8 – 6 + 11 – 6 ) 5 =

= (– 4 + – 3 + 0 + 2 + 5) 5 = 14 5 =

m.d. = 2.8

Calcula la desviación media de 12, 6, 7, 3, 15, 10, 18 y 5.

Page 29: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

__

X = ( 12 + 6 + 7 + 3 + 15 + 10 + 18 + 5 ) 8 = 76 8 = 9.5

m.d. = (12 – 9.5 + 6 – 9.5 + 7 – 9.5 + 3 – 9.5 + 15 – 9.5 10 – 9.5 +

18 – 9.5 + 5 – 9.5 ) 8 = 34 8; m.d. = 4.25

Para datos agrupados: N __ __ ________m.d. = fj xj – X N = fx - X N = x – X

j =1

donde: N

N = fj = f; xj representa las marcas de clase. j =1

Ee la distribución de frecuencias siguientes calcular la desviación media (m. d.)__

X = 2628.0 42 = 62.57

Calificación Frecuencia( f )

M: C: (x)

f x xj–X= x–62.57

fxj–X

28 – 39 2 33.5 67.0 29.07 58.1439 – 50 4 44.5 178.0 18.07 72.2850 – 61 10 55.5 555.0 7.07 70.7061 – 72 19 66.5 1263.5 3.93 74.6772 – 83 5 77.5 387.5 14.93 74.6583 - 94 2 88.5 177.0 25.93 51.86

42 2628.0 402.30 __ m.d. = fx - X N = 402.30 42 = 9.58; m.d. = 9.58

Ejemplo: De la distribución de frecuencias de las estaturas de los alumnos de sexto “A”, determinar la desviación media:

Estatura M. C.(x)

Frecuencia( f )

f x xj–X= x–168.15

fxj–X

153-157 155 3 465 13.15 39.45157-161 159 5 795 9.15 45.75161-165 163 9 1467 5.15 46.35165-169 167 2 334 1.15 2.30169-173 171 7 1197 2.85 19.95173-177 175 6 1050 6.85 41.10177-181 179 4 716 10.85 43.40181-185 183 2 366 14.85 29.70

38 6390 268__

Page 30: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

X = 6390 38 = 168.15

m.d. = fx - X N = 268 38 = 7.05; m.d. = 7.05

I.5.3 RANGO SEMIINTERCUARTILICO O DESVIACION CUARTILICA

Esta medida de dispersión en una serie de datos queda definida por:

Rango semiintercuartílico = Q = ( Q3 – Q1 ) 2

Donde Q3 es el tercer cuartil ( centil 75 )

Q1 es el primer cuartil ( centil 25 )

El rango intercuartílico Q3 – Q1 se emplea en algunas ocasiones, pero el más usual es el rango semiintercuartílico.

Ejemplo: De la distribución de frecuencias de las estaturas de los alumnos de sexto “A”, determinar el rango semiintercuertílico:

Estatura M. C.(x)

Frecuencia( f )

153-157 155 3157-161 159 5161-165 163 9165-169 167 2169-173 171 7173-177 175 6177-181 179 4181-185 183 2

38

Para Q1 = C25

(%N) = 0.25 (38) = 9.5; Lx = 161; {f}x = 8; fx = 9; c = 4

Q1 = C25 = 161 + [ ( 9.5) – {8} ) ( 9 ) ] (4) = 161 + [ (1.5) (9) ] (4) = 161 + 0.666

Q1 = 161.666

Para Q3 = C75

(%N) = 0.75 (38) = 28.5; Lx = 173; {f}x = 26; fx = 6; c = 4

Q3 = C75 = 173 + [ (28.5) – {26} ) ( 6 ) ] (4) = 173 + [ (2.5) (6) ] (4) = 173 + 1.666Q3 = 174.666

Page 31: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

Q = ( 174.666 – 161.666 ) 2 = 13 2 = 6.5; Q = 6.5

Ejemplo: De la distribución de frecuencias siguiente, determinar el rango semiintercuartílico:

Calificación Frecuencia( f )

M: C: (x)

28 – 39 2 33.539 – 50 4 44.550 – 61 10 55.561 – 72 19 66.572 – 83 5 77.583 - 94 2 88.5

42

Para Q1 = C25

(%N) = 0.25 (42) = 10.5; Lx = 50; {f}x = 6; fx = 10; c = 11

Q1 = C25 = 50 + [ (10.5) – {6} ) ( 10 ) ] (11) = 50 + [ (4.5) (10) ] (11) = 50 + 4.95

Q1 = 54.95

Para Q3 = C75

(%N) = 0.75 (42) = 31.5; Lx = 61; {f}x = 16; fx = 19; c = 11

Q3 = C75 = 61 + [ ( 31.5) – {16} ) ( 19 ) ] (11) = 61 + [ (15.5) (19) ] (11) = 61 + 8.97

Q3 = 69.97

Q = ( 69.97 – 54.95 ) 2 = 15.02 2 = 7.51; Q = 7.51

I.5.4 RANGO ENTRE CENTILES 10 – 90

Esta medida de dispersión se define por:Rango entre centil 10 – 90 = C90 – C10

Y aunque no es muy común, en ocasiones se usa el rango semicentil 10 – 90 = (C90 – C10 )

Ejemplo: De la distribución de frecuencias de las estaturas de los alumnos de sexto “A”, determinar el rango entre centiles 10 – 90

Estatura M. C.(x)

Frecuencia( f )

Page 32: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

153-157 155 3157-161 159 5161-165 163 9165-169 167 2169-173 171 7173-177 175 6177-181 179 4181-185 183 2

38Para C10

(%N) = 0.10 (38) = 3.8; Lx = 157; {f}x = 3; fx = 5; c = 4

C10 = 157 + [ ( 3.8) – {3} ) ( 5 ) ] (4) = 157 + [ (0.8) (5) ] (4) = 157 + 0.64

C10 = 157.64

Para C90

(%N) = 0.90 (38) = 34.2; Lx = 177; {f}x = 32; fx = 4; c = 4

C90 = 177 + [ (34.2) – {32} ) ( 4 ) ] (4) = 177 + [ (2.2) (4) ] (4) = 177 + 2.2

C90 = 179.2

Rango entre centil 10–90 = C90–C10 = 179.2 - 157.64; Rango entre centil 10–90 = 21.56

Si (C90 + C10 ) = ( 179.2 + 157.64 ) = 336.84 / 2 = 168.42 se considera como media aritmética y si (C90 - C10 ) = (179.2 - 157.64 ) = 10.78 entonces, el 80 % de los alumnos de sexto ”A” tienen alturas en 168.42 10.78 centímetros.

Ejemplo: De la distribución de frecuencias siguiente, determinar el rango entre centiles 10 – 90 y el rango semicentil 10 - 90:

Calificación Frecuencia( f )

M: C: (x)

28 – 39 2 33.539 – 50 4 44.550 – 61 10 55.561 – 72 19 66.572 – 83 5 77.583 - 94 2 88.5

42Para C10

(%N) = 0.10 ( 42 ) = 4.2; Lx =39; {f}x = 2; fx = 4; c = 11

Page 33: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

C10 = 39 + [ (4.2) – {2} ) ( 4 ) ] (11) = 39 + [ (2.2) (4) ] (11) = 39 + 6.05

C10 = 45.05

Para C90

(%N) = 0.90 (42 ) = 37.8; Lx = 72; {f}x = 35; fx = 5; c = 11

C90 = 72 + [ (37.8) – {35} ) ( 5 ) ] (11) = 72 + [ (2.8) (5) ] (11) = 72 + 6.16

C90 = 78.16

Rango entre centil 10 – 90 = C90 – C10 = 78.16 - 45.05

Rango entre centil 10 – 90 = 33.12

Si (C90 + C10 ) = ( 78.16 + 45.05) = 123.21 / 2 = 61.6 se considera como media aritmética y si (C90 - C10 ) = 16.56; entonces, el 80 % de los estudiantes tienen calificaciones en 61.6 16.56

I.5.5 DESVIACION TIPICA.

En una serie de N números x1, x2, ....., xN, la desviación típica se representa por s y se determina con:

s = [x – X ] 2 N = x 2 N para datos aislados; donde

x representa las desviaciones de las xJ en relación con la media aritmética.

s = f [x – X ] 2 N = f x 2 N para datos agrupados; donde N = f

Ejemplo: Calcular la desviación típica de: 12, 6, 7, 3, 15, 10, 18, 5

__

X = ( 12 + 6 + 7 + 3 + 15 + 10 + 18 + 5 ) 8 = 76 8 = 9.5

s = {[ (12 – 9.5)2 +(6 – 9.5)2 + (7 – 9.5)2 + (3 – 9.5)2 + (15 – 9.5)2 + (10 – 9.5)2 + (18 – 9.5)2

+ (5 – 9.5)2 ] 8} = 23.75 ; s = 4.87

Page 34: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

Ejemplo: Calcular la desviación típica de la distribución de frecuencias de las estaturas de los alumnos de sexto “A”.

Estatura M. C.(x)

Frecuencia( f )

x – Xx-168.1

( x – X)2 f ( x – X)2

153-157 155 3 -13.15 172.92 518.76157-161 159 5 -9.15 83.72 418.61161-165 163 9 -5.15 26.52 238.70165-169 167 2 -1.15 1.32 2.64169-173 171 7 2.85 8.12 56.85173-177 175 6 6.85 46.92 281.53177-181 179 4 10.85 117.72 470.89181-185 183 2 14.85 220.52 441.04

38 2429.05

s = (2429.05 38 ) = 63.92. s = 7.99

Ejemplo: De la distribución de frecuencias siguiente, calcular la desviación típica:

Calificación Frecuencia( f )

M: C: (x)

x – Xx-62.57

( x – X)2 f ( x – X)2

28 – 39 2 33.5 -29.07 845.06 1690.1339 – 50 4 44.5 -18.07 326.52 1306.150 – 61 10 55.5 -7.07 49.985 499.8461 – 72 19 66.5 3.93 15.445 293.4572 – 83 5 77.5 14.93 222.9 1114.5283 – 94 2 88.5 25.93 672.36 1344.73

42 6248.79

s = (6248.79 42 ) = 148.78 s = 12.19

EJERCICIOS III.

1. Hallar el rango en cada serie numérica:

a) 12, 6, 7, 3, 15, 10, 18, 5; b) 9, 3, 8, 8, 9, 8, 9, 18 2. Hallar la desviación media de las siguientes series numéricas:

a) 11, 6, 8, 3, 15, 10, 18, 5; b) 9, 3, 8, 8, 9, 8, 9, 18

Page 35: I  Web viewI.- ESTADISTICA . INTRODUCCION. Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es una ciencia joven en su aplicación

3. Hallar el rango en cada serie numérica:

a) 5, 3, 8, 4, 7, 6, 12, 4, 3; b) 8 772, 6 453, 10 624, 8 628, 9 437, 6 351 4. Hallar la desviación media de las siguientes series numéricas:

a) 7, 3, 5, 9; b) 2.4, 1.6, 3.8, 4.1y 3.4

5. Con los datos que se proporcionan en la tabla, determinar: Rango, Desviación media, Rango semiintercuartílico, Rango entre centiles 10-90 y Desviación típica.

Salario Número de personas

90.00 100.00 15

100.00 110.00 21

110.00 120.00 10

120.00 130.00 8

130.00 140.00 6

140.00 150.00 5

6. Con los datos que se proporcionan en la tabla, determinar: Rango, Desviación media, Rango semiintercuartílico, Rango entre centiles 10-90 y Desviación típica.

Variable Frecuencia

5 20 8

20 35 9

35 50 10

50 65 7

65 80 4