Curso Estadistica Aplicada a La Investigacion

147
UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE “ALMA MATER DEL MAGISTERIO NACIONAL” FACULTAD DE CIENCIAS Texto Autoinstructivo: ESTADISTICA APLICADA A LA INVESTIGACION CIENTIFICA Pedro RAMON CAJAVILCA Alberto HUAMANI ESCOBAR 1

description

uvuvgvyudhshsdhrwhhhhhrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrhrefsdfdsfdsdsgdgsdhsdhhreherhrhreheehhhhhhhhsdhsssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssss

Transcript of Curso Estadistica Aplicada a La Investigacion

Page 1: Curso Estadistica Aplicada a La Investigacion

UNIVERSIDAD NACIONAL DE EDUCACIÓN

ENRIQUE GUZMÁN Y VALLE“ALMA MATER DEL MAGISTERIO NACIONAL”

FACULTAD DE CIENCIAS

Texto Autoinstructivo:

ESTADISTICA APLICADA A LA INVESTIGACION

CIENTIFICA

Pedro RAMON CAJAVILCA

Alberto HUAMANI ESCOBAR

LIMA-PERÚ

2012

1

Page 2: Curso Estadistica Aplicada a La Investigacion

PRESENTACIÓN

El presente trabajo es un texto auto–instructivo que ha sido elaborado

para que mediante tu esfuerzo personal, y siguiendo las instrucciones

que se te recomienda, adquieras los conocimientos que en él se

desarrollan.

Los contenidos del texto Estadística General corresponde al sílabo de

esta asignatura con una duración de un semestres académico, para

todas las especialidades y contribuye a la formación científica –

humanística del docente que estudia a través de la modalidad de

educación a distancia.

Está estructurado en 10 capítulos:

El primer capítulo contiene generalidades de estadística..

El segundo capítulo contiene organización y presentación de datos.

El tercer capítulo trata de la presentación de gráficos estadísticos.

El cuarto y quinto capítulo presenta las tablas de frecuencias de datos

continuos y gráficos de variables cuantitativas.

El sexto y séptimo contiene las modalidades de tendencia central,

medidas de dispersión, sesgo y curtosis.

El octavo y noveno capítulo trata sobre la regresión lineal simple y los

números índices.

2

Page 3: Curso Estadistica Aplicada a La Investigacion

El décimo capítulo desarrolla los conocimientos básicos del cálculo de

probabilidades.

La estadística es una herramienta de trabajo que todo profesional

necesita para realizar sus trabajos de investigación, así como resolver

problemas de la vida real, contribuyendo el aprendizaje de este material

a la interpretación de la realidad concreta a la luz de las aplicaciones

estadísticas.

Esperamos que la presente obra cumpla con los objetivos para la que

fue escrita, y agradeceremos las sugerencias que se nos formulen para

mejorar sus contenidos y presentación.

Agradecemos de igual forma a todos los profesores y estudiantes que

de alguna manera contribuyeron a la realización del presente texto. Lo

mismo extendemos nuestro sincero agradecimiento al Instituto de

Investigación de la UNE, por el apoyo académico.

Los

Autores.

3

Page 4: Curso Estadistica Aplicada a La Investigacion

OBJETIVOS GENERALES

Determinar e identificar los instrumentos par el estudio de la estadística

general.

Identificar variables, clasificarlas, procesarlas, analizarlas e interpretarlas

estadísticamente y resolver problemas con variables educativas.

Manipular variables y obtener estadígrafos de posición y de dispersión.

Relacionar variables entre ellas y con el tiempo y efectuar predicciones.

Sentar bases para la investigación con el auxilio de la estadística.

OBJETIVO GENERAL

Proporcionar los conocimientos y destrezas que faciliten el manejo de las técnicas más apropiadas de la Estadística Descriptiva, requeridas en los diferentes niveles del trabajo educativo, así como en la investigación y evaluación.

ORIENTACIONES METODOLÓGICA

4

Page 5: Curso Estadistica Aplicada a La Investigacion

Estructura del texto autoinstructivo (T.A.E.)

El T.A.E. está dividido en capítulos. Cada capítulo concluye con un

conjunto de ejercicios propuestos, con la finalidad de verificar el

aprendizaje logrado en ese capítulo. Así mismo, al concluir el V, VII y X

capítulo se aplica una auto evaluación que indicará en qué medida se

han logrado los objetivos propuestos.

Metodología de estudio.

- Analiza con cuidado los ejemplos que se te presentan y resuelve

los ejercicios propuestos que aparecen a lo largo del T.A.E.

- Avanza el estudio de los diversos capítulos a tu propio ritmo, pero

dentro del tiempo establecido para las evaluaciones programadas.

EVALUACIÓN

Para conocer los avances en tu aprendizaje, debe resolver determinadas

pruebas de auto evaluación que se aplican al término de cada capítulo y

al concluir el T.A.E.

Los resultados de estas pruebas servirán de un buen elemento de juicio,

para saber si has logrado el aprendizaje de los contenidos desarrollados.

Al terminar cada auto evaluación, compara tus respuestas con la clave

que se adjunta de inmediato y analiza tu rendimiento de acuerdo a la

tabla de valoración que se te presenta.

CAPITULO I

5

Page 6: Curso Estadistica Aplicada a La Investigacion

GENERALIDADES

OBJETIVOS ESPECÍFICOS:

- Formular los objetivos de estudio de la estadística.- Identificar las etapas de la investigación estadística.- Identificar y clasificar las variables- Describir y conocer las reglas de Redondeo de los números

decimales.

1.1. RESEÑA HISTÓRICA.-

En la evolución de la humanidad, la Estadística siempre ha existido, en sus comienzos en forma sencilla con representaciones gráficas y simbologías diferentes en madera, en rocas, etc, las cuales servían para contar el número de personas, animales u otros objetos.

Los babilonios en el año 3000 a.c. usaban tablillas de arcilla para recopilar datos sobre la producción agrícola y los productos vendidos o cambiados mediante trueque.

En China en el año 2000 a.c. existían catastros con información de índole demográfico, económica, etc. En el año 0 la Biblia muestra empadronamientos vinculados con el nacimiento de Cristo.

Los Arabes realizaron un censo quizás el prototipo de los actuales, fue hecha aproximadamente en el año 727, y casi en esos mismos años 758 y 762 los reyes carolingios Pepino el Breve y Carlomagno ordenaron hacer estudios estadísticos minuciosos de las propiedades de la Iglesia.

Después de la conquista normanda de Inglaterra en 1066 se realizó un censo por el Rey Guillermo I .

En el imperio Incaico los datos estadísticos se recogían en cuerdas mediante el sistema de quipus que consistía en un cordón central de lana del cual pendían otros cordones diferenciándose entre si por su grosor, color, forma de nudos, etc. El Quipu Camayoc era la persona que conocía la técnica del registro del quipu.

En 1662 en Inglaterra apareció el primer estudio estadístico notable de población titulada “Observations on the london bills of mortality” (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en

6

Page 7: Curso Estadistica Aplicada a La Investigacion

Breslau, Alemania fue realizado en 1691 por el astrónomo ingles Edmund Halley como base para la primera tabla de mortalidad por lo que podemos deducir que los antecedentes históricos de la estadística esta en la demografía. En el siglo XIX con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos, para evitar la ambigüedad de las descripciones verbales.

La estadística como ciencia data de una fecha mas reciente a mediados del siglo XVII, en que por primera vez se crea la cátedra de estadística en Alemania.

En la actualidad la estadística en sus formas mas sofisticadas es una herramienta necesaria de utilizar en cualquier tipo de investigación científica, en predicciones y otros análisis científicos.

Además se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del estadístico no consiste ya sólo en reunir y tabular los datos, sino todo el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar con gran exactitud utilizando determinadas distribuciones probabilísticas, los resultados de estos se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.

Podemos mencionar a las tres escuelas estadísticas que aparecen en la evolución de esta :

1. ADMINISTRATIVA: Representado por Alemania y esencialmente preocupada por los asuntos del estado.

2. PROBABILISTICO : Representada por Francia y trata sobre los juegos al azar.

3. DEMOGRAFICO : Inglaterra fue la representante de esta escuela y trata sobre los problemas de la población.

La Escuela Probabilística llegó a convertirse en una nueva disciplina de las matemáticas (Cálculo de Probabilidades) gracias a trabajos de científicos rusos y franceses.Actualmente en nuestro país los datos estadísticos producidas por el estado son normados por el Instituto Nacional de Estadística e

7

Page 8: Curso Estadistica Aplicada a La Investigacion

Informática( INEI) creada en 1969 quien además de dar normas especificas, planifica la realización de encuestas e investigaciones de tipo Estadística, dirige, coordina, evalúa y supervisa estas actividades.

1.2. OBJETO DE LA ESTADÍSTICA .-

Al igual que toda ciencia los objetivos de la estadística podemos clasificarlas en los siguientes :

a) DESCRIPTIVA. Cuando reducimos a un número pequeño de características concentradas en la parte significativa de la información, graduándolas, clasificándolas y presentándolas en tablas o gráficos para reducirlas por medio de medidas de resumen o estadígrafos.

b) ANÁLISIS CIENTÍFICO. La estadística no solo reduce datos sino también resuelve problemas de análisis. Por ejemplo tenemos ciertos conjuntos de datos estadísticos que podemos considerar como muestras ciertas poblaciones y tratamos de emplear tales datos para averiguar algo sobre dichas poblaciones. Esta parte nos permite adoptar decisiones. Pero también se relaciona con la estimación estadística, calculo de probabilidades, técnicas de muestreo, pruebas estadísticas, etc., lo cual es llamado Inferencia estadística.

c) PREDICCIÓN DEL FUTURO. Aspiración total de toda ciencia, por ejemplo estudiando los datos estadísticos obtenidos año tras año de las notas de los cursos de matemáticas de los alumnos de la UNE podemos deducir cual será el comportamiento de las notas dentro de los próximos años.

1.3.- MÉTODOS DE INVESTIGACIÓN

MÉTODO ESTADÍSTICO.- Trata sobre la recopilación, elaboración, análisis e interpretación de datos estadísticos. La materia prima de la Estadística consiste en conjuntos de

números obtenidos al contar o medir cosas, al recopilar datos estadísticos se ha de tener especial cuidado para garantizar consistencias en los datos. Aplicando los métodos de descriptivos de reducción de datos elaboramos indicadores o estadígrafos que luego son analizados e interpretados apoyados en herramientas gráficos para finalmente presentar informes o presentaciones de resultados. La investigación estadística como ciencia auxiliar de la investigación es de tipo descriptivo y es utilizada como técnica para contribuir al conocimiento científico de cualquier rama de esta. Esta puede considerarse como un proceso con varias etapas

8

Page 9: Curso Estadistica Aplicada a La Investigacion

y tareas; dependiendo de la magnitud de la investigación se puede adicionar u obviar algunas de ellas, consideramos las siguientes etapas :Planeamiento de la Investigación, etapa donde se determina el problema y se diseña la posible solución, como tareas de esta etapa podemos considerar a :

- Conocimiento del problema.- Factibilidad de la investigación estadística.- Determinación de Objetivos generales y específicos.- Reconocimiento de fuentes de información .- Determinación de ámbito y cobertura de la investigación.- Preparación del Plan de Trabajo y Plan de Tabulaciones.- Elaboración de técnicas o métodos a utilizar en la

investigación.- Capacitación del grupo de trabajo a emplearse.- Formulación del Presupuesto y determinación de las fuentes

de financiamiento.- Prueba piloto de la investigación estadística.

Recolección de datos, cuando los investigadores por medio de diversos medios obtienen datos de las unidades estadísticas seleccionadas se denomina recolección o recopilación de datos. Estos pueden ser realizados de diversas maneras dependiendo del tipo y de la naturaleza de las fuentes de datos, de la disponibilidad de recursos y generalmente de la facilidad de obtener los datos.

Procesamiento de datos, luego de obtener los datos estos se organizan mediante una serie de cuadros especificados en el Plan de tabulaciones, previamente deben de pasar por un control de calidad riguroso que garantice su consistencia, corrigiendo o ajustando estos datos en la medida que sea posible y no alteren los objetivos de la investigación estadística. Los cuadros estadísticos permiten reducir los datos y facilitar la determinación de los estadígrafos o indicadores en su primera etapa en forma descriptiva.

Análisis de datos, los modelos matemáticos de la estadística son empleados en esta etapa, estableciendo relaciones entre las variables, estimando valores, calculando medidas de tendencia central y de dispersión, etc. Estos métodos son empleados y determinados por el Estadístico.

Presentación de resultados, en esta etapa se presentan los resultados de la investigación realizadas generalmente mediante informes o documentos de trabajo con los resultados fundamentales, especificando las recomendaciones y conclusiones.

9

Page 10: Curso Estadistica Aplicada a La Investigacion

OTROS MÉTODOS.- El método estadístico no es el único a emplearse en la investigación; ni tampoco debe considerase el mejor para abordar en esta clase de problemas, el investigador debe analizar cuidadosamente su problema y utilizar la técnica o técnicas que sean apropiadas para su resolución. Cuando requerimos obtener una información amplia de cada individuo o hecho que se va a estudiar muchos de nuestros datos pueden ser no cuantitativos por su misma naturaleza entonces emplearemos en la investigación el número de casos, cuya finalidad es estudiar en detalle las características particulares de cada caso individual y generalizar partiendo de varios estudios detallados, algunas de esas informaciones pueden ser estadísticas y cuando incluyen muchos casos pueden hacerse resúmenes estadísticos de la información cualitativa obtenida.

1.4.- DEFINICIÓN DE ESTADÍSTICA.-

Etimológicamente proviene según unos de la palabra latina status(estado o condición de las personas o cosas), y otros del alemán staat (que significa estado o nación).

La Estadística es la ciencia que proporciona un conjunto de métodos o técnicas que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con el fin de obtener conclusiones y poder predecir algo respecto a un determinado hecho o fenómeno en estudio.

Al término estadística, se le suele dar dos significaciones : Datos numéricos relativos a un conjunto de casos, y Ciencia que trata de la recogida, análisis e interpretación de

tales casos.

En la estadística debe distinguirse la parte metodológica o técnica, y la aplicación de esta técnica para interpretar el mundo real en términos de probabilidad.

1.5.- CLASIFICACIÓN DE LA ESTADÍSTICA.-

El campo de la estadística esta dividido en dos grandes áreas de acuerdo a las dos funciones que realiza : La Estadística Descriptiva y la Estadística Inferencial.

1.5.1. ESTADÍSTICA DESCRIPTIVA.- Es aquella parte de la estadística que describe y analiza una muestra, sin pretender sacar conclusiones de tipo general.

10

Page 11: Curso Estadistica Aplicada a La Investigacion

De la definición de estadística, notaremos dos aspectos bien remarcados, el primero : obtener información, procesarla y describirla, es lo que constituye la estadística descriptiva. A partir de la estadística descriptiva, mediante gráficos y diagramas se identifican los modelos probabilísticos que servirán para llevar a cabo la inferencia de las características de toda una población sobre la base de los datos recolectados.

1.5.2. ESTADÍSTICA INFERENCIAL.- Es aquella parte de la estadística, cuyo propósito es inferir o inducir leyes de comportamiento de una población, a partir del estudio de una muestra.El segundo aspecto de la función de estadística es: predecir algo con respecto a la fuente de información, es lo que constituye la estadística inferencial. O sea es el conjunto de técnicas y métodos que posibilitan la generalización o toma de decisiones en base a una información parcial obtenida mediante técnicas descriptivas.

1.6.- OTRAS DEFINICIONES

1.6.1. Población o Universo.-Es un conjunto de individuos, elementos o unidades que presentan características comunes observables.Ejemplo. Los alumnos matriculados en el 2001 en la UNE.

1.6.2. Muestra.- Es un subconjunto de la población.

Ejemplo. Los alumnos matriculados en el 2001 de la Facultad de Ciencias de la UNE.

1.6.3. Unidades de observación.-Estadísticamente son los datos que se recolectan para un estudio.Ejemplos. Las unidades de observación son : la edad, el sexo, los pesos, las notas, estado civil y condición civil etc.

1.6.4 Unidades Estadísticas.-Es la unidad elemental de estudio en una investigación estadística.

1.6.5 Variables.-Se definen las variables, como magnitudes que tienden a sufrir modificaciones o cambios dentro de un dominio determinado. Es decir las características que cambian de individuo a individuo o de objeto a objeto se llaman variables; mientras que las que pertenecen inalterables, se llaman constantes.

11

Page 12: Curso Estadistica Aplicada a La Investigacion

Generalmente las variables se designan con las últimas letras mayúsculas del abecedario : X, Y, Z; y los valores de las variables se designan con letras minúsculas como : x 1, x2, x3, . . . Xn Ejemplo : La Universidad Nacional de Educación (UNE) lleva a cabo un estudio para determinar la situación ocupacional de sus egresados en la carrera de Administración . En relación a este estudio, identificamos a las propiedades siguientes y determinamos si son constantes o variables :a) Sexob) Ingresos anualesc) Profesiónd) Número de años de experienciae) Nivel Jerárquico ocupacional

PROPIEDADES ES PORQUE a) Sexo Variable Los egresados pueden ser de sexo masculino o femenino.

b) Ingresos Anuales Variable Cada egresado tiene diferente nivel de ingresos.

c) Profesión Constante Todos los egresados son de la carrera de Administración.

d) Número de Años de Exp. Variable Cada egresado tiene diferente años de experiencia.

e) Nivel Jerárquico Ocupac. Variable Cada egresado tiene nivel jerárquico diferente.

Supongamos que hemos encuestado a tres (03) egresados del estudio y cada uno ellos nos proporciona la siguiente información: Sexo :

Egresado 1 = Femenino Egresado 2 = Masculino Egresado 3 = Femenino Ingresos Mensuales: Egresado 1 = S/. 1,200.00 Egresado 2 = S/. 1,120.00 Egresado 3 = S/. 1,800.00

Años de experiencia: Egresado 1 = 8 años Egresado 2 = 3 años Egresado 3 = 12 años

Nivel Jerárquico Ocupacional:

12

Page 13: Curso Estadistica Aplicada a La Investigacion

Egresado 1 = Jefe de Departamento Egresado 2 = Técnico Administrativo Egresado 3 = Director Administrativo Luego podemos decir: VARIABLE VALORES DE LA VARIABLE

(Dominio de Variación) LITERAL SIMBÓLICA a) Sexo W w1 = Femenino w2 = Masculino w3 = Femenino

b) Ingresos mensuales X x1 = S/.1,200.00 x2 = S/.1,120.00 x3 = S/.1,800.00 c) Años de Experiencia Y y1 = 8 años y2 = 3 años y3 = 12 años

d) Nivel Jerárquico Ocupac. Z z1 = Jefe de Departamento z2 = Técnico Administrativo z3 = Director General

1.6.5.1 CLASIFICACIÓN DE LAS VARIABLES

A) Por su generalidad o nivel de abstracción :

a). Teóricas: Son aquellas variables que necesitan definirse operacionalmente porque sus cualidades o características no son fácilmente observables ni medibles.

Ejm: Desarrollo económico estrato socioeconómico, rendimiento académico, hábitos de consumo, etc.

b) Intermedia.- Son variables que permiten especificar a las variables teóricas, con el fin de hacer las observables y medibles.

c) Empíricas.- Son aquellas variables que no necesitan definirse operacionalmente; porque sus valores se identifican en forma inmediata y son fácilmente medibles.

Ejem: Edad, sexo, peso, talla, etc.

Operacionalizar una variable significa transformar las variables teóricas (no observables ni medibles) en variables intermedias y luego en variables empíricas (observables y medibles).

13

Page 14: Curso Estadistica Aplicada a La Investigacion

Ejemplo:

VARIABLESTEORICA

VARIABLESINTERMEDIAS

VARIABLESEMPÍRICAS

RENDIMIENTO ALTA CALIFICACIONES MEDIA BAJA

20 – 1716 – 1110 - 00

ACADEMICO ASISTENCIA A ALTA CLASES MEDIA BAJA

100 – 81%80 – 61%

menos 61%ALUMNOSUNE

PRACTICAS PRE EFICIENTE PROFESIONALES REGULAR DEFICIENTE

20 – 1716 – 1110 - 00

B) Por su Relación Causal a) Independiente.- Generalmente se simbolizan

estas variables con la letra mayúscula X; y son aquellas que no dependen de ninguna variable dentro de un contexto determinado.

Indica: causa, antecedentes, determinanteb) Dependientes.- Generalmente se simbolizan esta

variables con la letra mayúscula Y; y son aquellas que dependen de otra u otras variables dentro de un contexto determinado.

c) Interviniente.- Simbólicamente se le representa con la letra mayúscula Z; son aquella que van especificar las condiciones o requisitos para que las variables x e y tomen sus correspondientes valores.

Ejemplo:

El caso fomento de la educación alimentaría en la población, x

genera mayor desnutrición infantil en las familias con bajo Y

Nivel de instrucción .z

En este ejemplo las variables son:

Educación alimenticia = X : Variable independienteDesnutrición infantil = Y : Variable dependienteNivel de Instrucción = Z : Variable intervinienteC) Por su Naturaleza

Clasificación de mucha utilidad para fines estadísticasa) Variables Cualitativas.- Son aquellas cuyo

dominio de variación son objeto de clasificación:

14

Page 15: Curso Estadistica Aplicada a La Investigacion

Ejem:

VARIABLE DOMINIO DE VARIACIÓNSEXO Masculino

Femenino

DISTRITO DE RESIDENCIA

Lima Chosica Comas Villa El Salvador Etc.

b) Variable Ordinales.- Son aquellas cuyo dominio de variación: son objeto de Clasificación y orden .Ejem:

NIVEL DE INSTRUCCIÓN - Analfabeto- Primaria- Secundaria- Superior

NIVEL SOCIO – ECONÓMICO - Alto- Medio- Bajo

c) Variables Cuantitativas.- Son aquellas cuyos valores del dominio de variación son contados o medidos. Se clasifican en:

c.1 ) Cuantitativa Discreta .-

Cuando los valores del dominio de variación son contados; y por lo tanto sólo pueden asumir valores enteros.Ejemplo:

NUMERO DENACIDOS VIVOS

- 100 niños- 150 niños- 200 niños

NUMERO DEALUMNOS

- 50 alumnas- 80 alumnas- 100 alumnas

C.2) Cuantitativa Continua .-

15

Page 16: Curso Estadistica Aplicada a La Investigacion

Cuando los valores del dominio de variación son susceptibles de ser medidos. Pueden asumir valores decimales.

Ejemplo:

PESO - 56.5 kgs.- 58.7 kgs.- 60.0 kgs.

TEMPERATURA - 28.5 °C- 32.0°C- 35.5°C

1.6.5.2 MEDICIÓN DE LAS VARIABLES.-Las variables no sólo se clasifica sino que también es necesario medirlas. La medición se hace necesaria con el fin de diferenciar por comparación, un elemento de otro, en las características, un elemento de otro, en las características de la variable. Esta se hace a través de niveles o escalas, entre las cuales tenemos:a) Escala Nominal.- Es el nivel más simple de medición

donde la variable establece categorías, sin orden. En este nivel de medición, las categorías solo se nombran o se enumeran, pero no se comparan.En este nivel las variables puede ser:

- Dicotómicas: Si tienen dos categorías o clases.Ejemplo:

- MasculinoSEXO - Femenino

- Tricotómicas: Si tienen tres categorías o clases:Ejemplo:

- BlancaRAZA - Negra

- Amarilla

- Politómicas o multitómicas: Si tienen más de tres categoríasEjemplo:

- SolteroESTADO - CasadoCIVIL - Viudo

- Divorciadob) Escala Ordinal.- Es el segundo nivel de medición donde

la variable establece categorías jerarquizadas. Este nivel

16

Page 17: Curso Estadistica Aplicada a La Investigacion

de medición no mide las magnitudes de las diferencias, pero si permite apreciar que los valores asignados a los individuos caen más altos o bajo que otros.Ejemplo:

- AltoNIVEL SOCIO-ECONÓMICO - Medio

- Bajo

c) Escala de Intervalo.- Es el tercer nivel de medición, entre cuyos diversos valores que toma la variable existen a la vez, clasificación, orden y grados de distancia iguales entre las diferentes categorías, es decir los intervalos son considerados como equivalentes y con un origen convencional (la unidad de medida no necesariamente tiene que partir del valor cero; sólo sirve para como punto de valor de comparación).

Ejemplo:- Temperatura: Un paciente puede llegar a tener 39°C

de fiebre, pero ello no significa que su grado de temperatura haya tenido que partir de 0°C.

- Rendimiento escolar: Un niño puede obtener calificación 15 de Matemáticas, pero ello no nos lleva a pensar que necesariamente para llegar a esa calificación haya tenido que obtener primero nota cero.

- Coeficiente de inteligencia- Puntuación obtenida en una escala.- Presión arterial.

d) Escala de razón o proporción.- Es el nivel más alto de medición, y donde la variable supone o comprende a la vez a todos los casos anteriores: Clasificación, orden, distancia y origen único natural o punto de origen natural (la unidad de media necesariamente tiene que partir del valor cero).Ejemplo:- Edad: Un paciente puede tener 30 años de edad, pero

para llegar a esa edad, necesariamente ha tenido que partir de cero años.

- Estatura- Peso- Tiempo de reacción mental.- Las variables que según su naturaleza pertenecen a

la escala nominal; y las ordinales a la escala ordinal. Las variables que según su naturaleza son cuantitativa, pertenecen a la escala de intervalo o

17

Page 18: Curso Estadistica Aplicada a La Investigacion

razón. La medición de las variables se aprecian mejor en el siguiente diagrama.

REDONDEO DE DATOS – REGLAS

1) Si al digito que se va a redondear, le sigue cifras mayores que 5, entonces se aumentan una unidad, de acuerdo a la magnitud del problema.

Ejemplo: 6,248 aproximar a centésimas 6,2515,187 aproximar a centésimas 15,193,66 aproximar a décimas 3,723,9 aproximar a entero 24.

2) Si al digito que se va a redondear, le sigue cifras menores que 5 entonces se mantiene en su mismo valor.

Ejemplo: 5,371 aproximar a centésimas 5,372,892 aproximar a centésimas 2,8918,63 aproximar a décimas 18,69,4 aproximar a entero 9.

3) Si al digito que se va redondear, le sigue un valor igual a 5, se debe tener en cuenta lo siguiente.a) Si el digito anterior a 5, es número par, se

mantiene en su mismo valor.

Ejemplo: 7,45 aproximar a décimas 7,42,65 aproximar a décimas 2,628,5 aproximar a entero 28.

b) Si el digito anterior a 5, es número impar, se aumenta en una unidad al número anterior.

Ejemplo: 6,35 aproximar a décimas 6,429,75 aproximar a décimas 29,819,5 aproximar a entero 20.

18

Nominal

Ordinal

Intervalo

Razón o proporción

CualitativasOrdinales

Cuantitativas:Discretas

Continuas

Variables

Page 19: Curso Estadistica Aplicada a La Investigacion

EJERCICIOS Nº 1

TAREA:

Haga un cuadro señalando las instancias administrativas de su U.S.E. en las que se aplica la estadística educacional.

CUESTIONARIO

1. ¿Qué diferencia hay entre la Estadística Descriptiva y la Estadística Inferencial?

2. ¿Cuál es el objeto de estudio de la Estadística?3. ¿Cuáles son las fases de la Evolución Histórica

de la Estadística?4. Defina brevemente cada una de las etapas de

la Investigación Estadística.5. Elaborar un cuadro sinóptico de la clasificación

de variables, dar 3 ejemplos de variables cuantitativas discretas y 3 ejemplos de variables cuantitativas continuas.

6. Clasificar, si los siguientes enunciados son variables cualitativas o cuantitativas (discreta o continua)

a) Notas de Evaluación Escolar

b) Facultades de una Universidad

c) Número de aulas por centro educativo

d) Pesos (kg) de un grupo de niños

e) Número de hijos por familia

f) Ingreso económico de un grupo de familias

g) Profesiones de los socios de un Club

h) Participantes del PROCAE, según- Edad- Estado civil- Lugar de nacimiento- Tiempo de servicios- Nivel magisterial- Institución de procedencia

19

Page 20: Curso Estadistica Aplicada a La Investigacion

i) Empleados de una Empresa, según:- Ingreso mensual- Sexo- Edad- Religión- Grado de Instrucción- N° de hijos- Hora de entrada a la Empresa

7. Redondear, cada uno de los siguientes números decimales, a la exactitud que se indica:

a) 47,6 aproximar a entero

b) 9,7 aproximar a entero

c) 5,484 aproximar a centésimos

d) 0,363 aproximar a centésimos

e) 6,75 aproximar a décimas

f) 9,85 aproximar a décimas

g) 0,1435 aproximar a milésimas

h) 2,8965 aproximar a milésimas

i) 29,3 aproximar a entero

j) 35,7 aproximar a entero

k) 148,475 aproximar a entero

l) 5,781 aproximar a décimas

m) 43,67501 aproximar a centésimas

20

Page 21: Curso Estadistica Aplicada a La Investigacion

CAPITULOII

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS

Objetivos Específicos:

- Procesar datos estadísticos, clasificando y ordenando las variables.

- Elaborar e interpretar una tabla de distribución de frecuencia de datos no agrupados.

1. ORGANIZACIÓN Y PRESENTACIÓN DE DATOS

En el trabajo estadístico, siempre se dispone de muchos datos, que definitivamente tienen que ser clasificados, ordenados y presentados adecuadamente, de tal manera que facilite la comprensión y análisis del fenómeno estudiado, y obtener conclusiones validas para la toma de decisiones.Hay 2 formas de presentar los datos estadísticos:

- En forma tabular: Tablas estadísticas.- Mediante gráficos o diagramas.

Fundamentalmente se usa la forma tabular, los gráficos se utilizan complementariamente para ilustrar el comportamiento de las variables.

Las Tablas Estadísticas, presentan ordenadamente los datos en filas y columnas, clasificados y agrupados de acuerdo a un criterio específico, con el propósito de facilitar su lectura y análisis.1. TABLAS DE FRECUENCIAS O DE DISTRIBUCIÓN.- Son

tablas de trabajo estadístico, que presentan la distribución de un conjunto de elementos de acuerdo a las categorías de las variables. En ellas se observa la frecuencia o repetición de cada uno de los valores de la variable que se obtiene después de realizar la tabulación.

2. CONSTRUCCIÓN DE UNA TABLA DE FRECUENCIA.- Para construir una Tabla de Frecuencia, se siguen los siguientes pasos:

1º LA CLASIFICACIÓN.- Consiste en determinar las categorías o clases (datos) que toman las variables, para ello se determina el Rango.

- Rango o Amplitud de la Muestra (R).- Es la diferencia numérica que hay entre el dato mayor y el dato menor de la muestra.

21

Page 22: Curso Estadistica Aplicada a La Investigacion

Ejemplo:La muestra, corresponde a las calificaciones del curso de Lenguaje, de 20 alumnos.

14 16 14 17 15 17 13 16 15 1615 16 18 16 12 16 15 15 13 13

Rango = Dato mayor – Dato menor (para datos continuos) Rango = Dato mayor – Dato menor +1 (para datos discretos)R = 18-12+1= 7Es decir la tabla consta de 7 clases

Variable:Calificaciones

Categoríaso

Clases

12131415161718

2º TABULACIÓN.- Consiste en distribuir los datos de la muestra en su respectiva clase o intervalo de clase. Aquí se contabiliza cuántos datos hay en cada categoría o clase. Se puede tabular usando rayitas.

Calificaciones Tabulaciones12131415161718

IIIIIIIIIIIIII IIII

3º FRECUENCIA SIMPLE O ABSOLUTA (f).- Es el número de veces que se repite un dato como valor de una variable. Se obtiene sumando las marcas de conteo o tabulación.

Calificaciones Tabulaciones fi

22

Page 23: Curso Estadistica Aplicada a La Investigacion

12131415161718

IIIIIIIIIIIIII IIII

1325621

20

4º FRECUENCIA PORCENTUAL O RELATIVA.- Es la frecuencia simple, dividida entre la suma de frecuencia, expresada como porcentaje.

n = Total de datos o suma de frecuencia.

hi (%) =

Ejemplo:

Calificaciones Tabulaciones fi hi (%)12131415161718

IIIIIIIIIIIIII IIII

1325621

5%15%10%25%30%10%

5% 20 100%

5º FRECUENCIA ACUMULADAS.- Resulta de acumular o sumar sucesivamente las frecuencias simples en el orden de cada categoría o clase.Pueden ser. Frecuencias acumuladas ascendentes (FA)

- Frecuencias acumuladas descendentes (FD).

23

Page 24: Curso Estadistica Aplicada a La Investigacion

Para determinar las frecuencias acumuladas ascendentes (FA), se empieza con la primera frecuencia simple y en forma sucesiva se le va sumando o acumulando las frecuencias simples siguientes:

Ejemplos:

Ejemplo.Para determinar las frecuencias acumuladas descendentes (FD), se empieza con el total de frecuencias y en forma sucesiva, se le va restando las frecuencias simples, hasta obtener la última frecuencia.

6º FRECUENCIA PORCENTUAL ACUMULADA.- Resulta de sumar o restar sucesivamente las frecuencias en el orden de cada clase. Se determina de la misma manera que las frecuencias acumuladas.

Puede ser:

- Frecuencia Porcentual Acumulada Ascendente (FA %) = H i (%)- Frecuencia Porcentual Acumulada Descendente (FD %)

24

Page 25: Curso Estadistica Aplicada a La Investigacion

Calificaciones fi hi (%) FA FD FA(%) FD(%)

12131415161718

1325621

5%15%10%25%30%10%

5%

146

11171920

20191614

931

5%20%30%55%85%95%

100%

100%95%80%70%45%15%

5%

20 100%

3. CLASES DE TABLAS DE FRECUENCIASLas Tablas de Frecuencias pueden ser de variables cualitativas y cuantitativas.

3.1.TABLAS DE FRECUENCIAS DE VARIABLES CUALITATIVAS .- Cuando los datos de la variable se expresan mediante una característica o atributos. Ejemplo:- Población estudiantil de la UNE 2012

(variable) Nº deEscuela Profesional Alumnos hi (%)Educac. InicialEducac. PrimariaEducac. SecundariaEducac. Física

103211353122

432

18,019,854,6

7,65721 100,0%

Distribución de los participantes a la Reunión del Grupo Andino por nacionalidad.

Nacionalidad f hi %BolivianosColombianosEcuatorianosPeruanosVenezolanos

34283

1520104015

20 100,%

3.2.TABLAS DE FRECUENCIAS DE VARIABLES CUANTITATIVAS.- Pueden ser: Discretas y continuas.- Tabla de Frecuencia de Datos Discretas.- Un dato discreto es

aquel, cuyo valor se expresa mediante números enteros positivos.

25

Page 26: Curso Estadistica Aplicada a La Investigacion

Si el Rango de una muestra, resulta un número pequeño, se ordenará dichos datos en una Tabla sin intervalos de clases:

Ejemplo (1) En un centro educativo, se aplica una encuesta a 30 profesores, para averiguar el Nivel Magisterial al que pertenecen, obteniéndose el siguiente resultado:

3 4 5 2 4 34 2 3 5 1 15 4 1 2 4 23 1 4 1 1 33 5 1 3 2 1

Elabore una Tabla e interprete sus respectivas frecuencias.

Solución:

1º Se determina el Rango, por la fórmula establecida.

R = Dato mayor – Dato menor + 1 (datos discretos)R = 5 – 1 + 1 = 5 (amplitud de la muestra, la tabla constará de 5 clases)

2º Se ordenan los datos en la Tabla, de preferencias en forma ascendente (del 1 al 5), luego se procede a tabular.

Se recomienda, que para evitar confusiones en la tabulación, se proceda a tarjar uno por uno en forma ordenada los datos de la muestra e ir colocando cada dato por medio de una rayita vertical (׀) que se va agrupando cada cinco casos (.en su respectiva categoría o clase (׀׀׀׀

NivelMagisterial Tabulación

12345

IIII IIIIIIIIIII IIIIII IIIII

3º Se hallan las frecuencias simples, porcentuales y acumuladas por las fórmulas establecidas anteriormente:

26

Page 27: Curso Estadistica Aplicada a La Investigacion

NivelMagisterial Tabulación

Nº deProfes.

Hi(%)FA FD FA(%) FD(%)

12345

IIII IIIIIII

IIII IIIIII IIIII

85764

26,716,723,320

13,3

813202630

302217104

26,743,466,786,7100,

100%73,356,633,313,3

30 100

Interpretación de la Tabla:

1ra. frecuencia simple: : Hay 8 profesores que están o pertenecen al 1er. nivel magisterial.

2da. frecuencia simple: : Hay 5 profesores que están en el 2do. nivel magisterial.

3ra. frecuencia simple: : Hay 7 profesores que están en el 3er. nivel magisterial.

4ta. frecuencia Porcentual h4 (%): El 20% de profesores pertenecen al 4to. nivel magisterial.

5ta. frecuencia Porcentual: h5 (%): El 13,3 % de profesores pertenecen al 5to. nivel magisterial.

Ejemplo (2):

Los siguientes datos discretos, corresponden a las calificaciones en el curso de matemática, de 50 alumnas de la sección del 1er. año.

14 10 11 11 14 12 09 13 10 1311 10 09 13 14 12 13 11 14 1314 08 13 12 15 10 09 13 14 1213 11 14 14 11 14 13 15 12 1515 14 15 15 12 14 15 14 15 12

Elabore una Tabla, presentando estos datos con sus respectivas frecuencias. Interprete.

Solución: Se determina el Rango: R = 15 –08 + 1 = 8

27

Page 28: Curso Estadistica Aplicada a La Investigacion

(VariableCalificac. Tabul.

Nº deAlumn.f hi (%) FA FD

Hi (%)FA% FD(%)

1) 082) 093) 104) 115) 126) 137) 148) 15

IIIIIIII

IIII IIIII II

IIII IIIIIIII IIII II

IIII III

134679

128

2%6%8%

12%14%18%24%16%

148

1421304250

504946423629208

2%8%

16%28%42%60%84%

100%

100%98%92%84%72%58%40%16%

50 100%

Interpretación de la Tabla

1ra. frecuencia simple: : Hay 1 alumnos cuya nota es igual a 08.

2da. frecuencia porcentual: : El 6% de alumnos tienen notas iguales a 09.

3ra. frecuencia acumulada ascendente: F3 = FA (4) Hay 8 alumnos cuyas notas son menores o iguales (≤) a 10.

- Hay 8 alumnos que están desaprobados.

4ta. frecuencia acumulada descendente: F4 (%) = Hay 42 alumnos cuyas notas son mayores o iguales (≥) a 11.

- Hay 42 alumnos que están aprobados.

5ta. frecuencia porcentual acumuladas ascendente. H5(%) = El 42% de alumnos tienen calificaciones menores o iguales a 12.

6ta. frecuencia porcentual acumulada descendente: H6 (%) El 58% de alumnos tienen calificaciones mayores o iguales a 13.

7ma. frecuencia simple : Hay 12 alumnos cuyas notas son iguales a 14.

8va. frecuencia porcentual: h8 (%): El 16% de alumnos tienen calificaciones iguales a 15.

OTRAS INTERPRETACIONES DE LA TABLA- ¿Cuántos alumnos tienen la nota 12?

Rpta.: 7 alumnos. - ¿Qué porcentaje de alumnos, tiene la nota 13?

28

Page 29: Curso Estadistica Aplicada a La Investigacion

Rpta.: El 18% de alumnos.

- ¿Cuántos alumnos tienen calificaciones menores o iguales que 11?Rpta.: 14 alumnos.

- ¿Qué porcentaje de alumnos tienen calificaciones menores o iguales a 14?Rpta.: El 84% de alumnos.

- ¿Cuántos alumnos tiene calificaciones mayores o iguales a 13?Rpta.: 29 de alumnos.

- ¿Qué porcentaje de alumnos tienen calificaciones mayores o iguales a 10?Rpta.: El 92% de alumnos.

- ¿Qué porcentaje de alumnos están aprobados?- ¿Qué porcentaje de alumnos tienen notas ≥ que 11?

Rpta.: El 84% de alumnos.

- ¿Qué porcentaje de alumnos están Desaprobados?- ¿Qué porcentaje de alumnos tienen notas ≤ que 10?

Rpta.: El 16% de alumnos.

Ejemplo (3):La siguiente tabla, presenta la distribución de 40 profesores de un C.E. según el número de Registro de Evaluación del Educando, que tiene cada uno:

Nº de Registrode Evaluación

Nº deProfesores

3456789

1011121314

232543754221

R = 14 – 3 + 1 =12(amplitud de la muestra)

40

29

Page 30: Curso Estadistica Aplicada a La Investigacion

Cuando el Rango o amplitud de una muestra, resulta ser un número grande, se clasificará dichos datos en una Tabla con intervalos de clase.

Por ejemplo:Nº de Registro Nº de Profesores

3 I1 4 5

23 72

6 I2 7 8

54 123

9 I3 10 11

75 164

12 I4 13 14

22 51

Tabla con Intervalos de Clase.- Para los datos discretos , se usará el intervalo cerrado .

Nº de RegistrosIntervalo de clase

Nº deProfesores

I1 (3 – 5) I2 6 – 8 I3 9 – 11 I4 12 – 14

712165

40

Esta tabla consta de 4 intervalos de clase, y el tamaño de cada intervalo es de 3.

Intervalo.- Es el conjunto de números comprendidos entre 2 límites o extremos.

30

>>

>>

Page 31: Curso Estadistica Aplicada a La Investigacion

a)

(X E Z/ 3 ≤ X ≤ 5) su notación es [3,5]Es un intervalo cerrado (se usa para datos discretos)

b)

(X / 3 < X < 5), su notación es <3,5>Es un intervalo abierto

c)

(X / 3 < X ≤ 5), su notación es <3,5]Es un intervalo abierto – cerrado

d)

(X E R/ 3 ≤ X < 5), su notación es [3,5>Es un intervalo cerrado – abierto (se usa para datos continuos)

31

Page 32: Curso Estadistica Aplicada a La Investigacion

EJERCICIOS N° 2

TAREA:

Obtenga las calificaciones de un Bimestre de sus alumnos, en la asignatura a su cargo y ordene dichos datos en una Tabla (sin intervalos) con todas las clases de Frecuencia.

Ejercicios propuestos:

1. Se realiza una encuesta, a un grupo de familias de una ciudad, para averiguar el número de habitantes que tienen sus respectivas viviendas, y se obtiene el siguiente resultado:

5 8 6 6 8 4 6 8 64 7 5 5 7 6 4 7 66 3 3 2 1 6 1 4 58 5 5 4 3 4 2 3 27 6 5 7 4 3 7 4 76 7 6 5 7 6 5 7 3

a) Determinar: La población o universo estadístico, la muestra, la variable y clase de variable.

b) Ordenar los datos en una tabla y hallar todas las clases de frecuencias.

c) Interpretar (%)

2. La siguiente muestra, corresponde a 40 C.E.P. para determinar el N° de profesores que tiene cada uno:

12 15 14 13 14 13 12 11 12 1513 12 17 14 18 13 14 11 14 1418 11 18 12 17 12 16 17 16 1714 17 11 18 18 13 18 12 13 12

a) Determinar: La población, la muestra, la variable y clase de variable.

b) Elabore una Tabla con sus respectivas frecuencias.

c) Interprete: h1(%), f3, FA(3), FD(4), FA(%)5, FD(%)6

d) ¿Cuántos centros educativos tiene menos de 16 profesores?

32

Page 33: Curso Estadistica Aplicada a La Investigacion

e) ¿Cuántos centros educativos tienen más de 13 profesores?

f) ¿Qué porcentaje de C.E., cuentan con 15 ó más profesores?

g) ¿Qué porcentaje de C. Educativos tiene 18 profesores?

3. Teniendo en cuenta, la Tabla de distribución presentada en el ejemplo (2): N° de Registros de Evaluación y N° de Profesores; completar dicha tabla con toda las clases de frecuencias e interpretar: a) ¿Cuántas profesores tienen 12 Registros de Evaluación?

b) ¿Qué porcentaje de profesores tiene 8 Registros?

c) ¿Cuántos profesores tienen menor o igual a 10 Registros?

d) ¿Cuántos profesores tienen mayor o igual a 6 Registros?

e) ¿Qué porcentaje de profesores tienen más de 4 Registros?

f) ¿Qué porcentaje de profesores tienen menos de 13 Registros?

33

Page 34: Curso Estadistica Aplicada a La Investigacion

CAPITULO IIIPRESENTACIÓN DE LA INFORMACIÓN POR

MEDIO DE GRÁFICOS ESTADÍSTICOS

Objetivos Específicos:

- Conocer algunas recomendaciones para la construcción de gráficos estadísticos.

- Identificar los principales tipos de gráficos.

- Graficar los datos de una Tabla de variables cualitativas.

PRESENTACIÓN DE LA INFORMACIÓN POR MEDIO DE GRÁFICOS ESTADÍSTICOS

La presentación gráfica es un medio eficaz, para visualizar una información estadística. Una gráfica sencilla y bien trazada que presente un número limitado de datos, es mucho más fácil de comprender que una Tabla Estadística.

Es conveniente establecer, algunas diferencias en la utilización tanto de gráficos como de Tablas Estadísticas.

a) En los gráficos puede presentarse un número limitado de datos, mientras que en una Tabla puede haber muchos de ellos sin mayor dificultad.

b) En los gráficos se presentan valores aproximados, mientras que en las Tablas se pueden trabajar con valores exactos y con mayor precisión.

c) Los gráficos transmiten de manera casi instantánea, hechos cantidades y comportamiento de variables, mientras que las tablas muestran otros aspectos de análisis cuantitativo.

1. Principales parte de un gráfico

a) TITULO, es una descripción del contenido del gráfico, debe indicar claramente la naturaleza del fenómeno representado.

b) LOS DIAGRAMAS, está dado por el propio dibujo del gráfico, donde están representados los datos indicados en el título.

34

Page 35: Curso Estadistica Aplicada a La Investigacion

c) ESCALAS Y/O LEYENDAS, son indicaciones donde se precisa la correspondencia entre los elementos del gráfico y la naturaleza de las medidas representadas.

d) FUENTE, información de los datos estadísticos representados.

e) ELABORACIÓN, es una indicación que se coloca debajo de la fuente y sirve para mencionar el responsable que elaboró el gráfico.

2. Sistema de coordenadas cartesianas

Para representar gráficamente la información, es conveniente recordar lo concerniente a la ubicación de puntos en un sistema de coordenadas cartesianas.

Un sistema de coordenadas cartesianas es un conjunto de dos rectas perpendiculares entre sí, que se cortan en un punto al cual se conoce con el nombre de “origen de las coordenadas”.

La recta horizontal se llama eje de las abscisas o eje “x”; mientras que la recta vertical es el eje de las ordenadas o simplemente eje “y”. Estas rectas al cortarse dividen al plano en cuatro partes llamadas cuadrantes (I, II, III y IV).

En el eje de las x, se determinan dos sentidos, unos positivo OX+ que se mueven hacia el lado derecho del punto de origen y otro negativo OX- que se mueven hacia el lado izquierdo del punto de coordenadas.En el eje de la y, también se determinan dos sentidos, uno positivo OY+, cuando se mueve de abajo hacia arriba del punto de origen y otro negativo OY- cuando se mueve en sentido opuesto.Determina de un Punto en el plazo.

35

Page 36: Curso Estadistica Aplicada a La Investigacion

Sea P un punto cualquiera del plano determinado por los ejes de coordenadas.Tracemos por P las paralelas a OX y OY. Si OR es igual a “x” y ON es igual a “y”, vemos que x e y son las coordenadas de P, siendo x la abscisa e y la ordenada.

Las coordenadas x e y de P se simbolizan por P (x, y) se lee “el punto P cuyas coordenadas son x e y.Cualquier punto P del plano determina dos números que son las coordenadas de P. Recíprocamente, dados dos números (- x) e (- y), queda determinado por ellos un punto P’ del plano.Si (- x) es igual a OR’, e(- y) es igual a ON’ y trazamos paralelas a los ejes x e y por los puntos R’ y N’ éstas rectas se cortarán en el punto P’ (-x, -y).

Ejemplos:En el presente gráfico, el punto P, permite ubicar los valores (3, 2) donde 3 es el valor de x y 2 es el valor de y. Se simboliza P (3, 2).

36

-

-

-

-

Page 37: Curso Estadistica Aplicada a La Investigacion

Ubicar en un sistema de coordenadas cartesianas los siguientes puntos:A (5, 4), en el I cuadrante.B (- 4, 3), en el II cuadrante.C (- 2, - 4) en el III cuadrante.D (4, - 6) en el IV cuadrante.

3. Recomendaciones para la construcción de gráficos.-

Aún cuando no existe una regla específica para la construcción de gráficos, es posible anotar algunas recomendaciones:

- El título, que es una descripción del contenido del gráfico, debe ser colocado en la parte superior.

- En la representación gráfica estadística, se empleará solo el primer cuadrante del sistema de coordenadas.

- El gráfico progresa generalmente de abajo hacia arriba y de izquierda a derecha.

- En el eje horizontal “x” se ubicarán las modalidades, clases o intervalos de clase; en el eje vertical “y” se representarán las frecuencias respectivas.

- La escala vertical debe empezar por cero. Sí en la escala horizontal no es posible empezar por cero se dejará un espacio o se hará una interrupción.

- Se debe considerar en la representación, que la altura máxima del eje “y” debe ser aproximadamente los ¾ de la longitud del eje “x”.

37

5

3

4

- 4

- 4

- 6

- 2

A (5 , 4 )

B (-4 , 3 )

D (4 , -6 )

y

x- x

- y

C(-2, -4)

Page 38: Curso Estadistica Aplicada a La Investigacion

Así por ejemplo. Si la longitud de la base es 8 cm., la altura máxima de “y” será 6 cm.

4. Principales tipos de gráficos

En Estadística, se emplean una diversidad de gráficos, cuya forma dependerá de la naturaleza de los datos y del objetivo de la presentación.

Hay una gama muy extensa de tipos y maneras de graficación, ya que no existen limitaciones en sus diferentes presentaciones, basta que cumplan las exigencias de precisión, claridad y estética que con llevan al interés por el informe que suministran.

Los gráficos que mencionamos a continuación son de uso en el Sector Educativo.

4.1. Gráfico Lineal4.2. Gráfico de Barras Simples4.3. Gráfico de Barras Compuestas4.4. Gráfico de Barras Superpuestas4.5. Diagrama Circular4.6. Pictogramas4.7. Histogramas

4.1. Gráfico Lineal.- Es un gráfico constituido por una línea poligonal, dibujado un sistema de coordenadas. Se utiliza para mostrar la evaluación de una variable en función del tiempo, representar series cronológicas. Para su construcción se marcan los puntos “X” correspondientes al tiempo y los puntos “Y”

38

y

x

Page 39: Curso Estadistica Aplicada a La Investigacion

correspondiente a las frecuencias respectivas, se unen dichos puntos por medio de segmentos de recta.

ALUMNOS MATRICULADOS Y CLASIFICADOSSEGÚN NIVEL EDUCATIVO EN UN CEP (1986 – 1990)

AñoNº de alumnos

Primaria Secundaria

20052006200720082009

160240200520480

240360400380640

En la máxima altura del eje “y” se ubicará la mayor frecuencia de la tabla, cada uno de los puntos correspondientes debe estar en escala. En el ej. dado cada ½ cm. representará 40 alumnos de la Tabla.

longitud eje x = 10 cms.altura eje y = ¾ (10 = 8 cm.

39

AÑOS

Page 40: Curso Estadistica Aplicada a La Investigacion

4.2. Gráfico de Barras Simples.- Consiste en un conjunto de rectángulos de un mismo ancho colocados en una línea base común. Aún cuando no hay reglas fijas para construir un gráfico de Barras, son útiles las siguientes consideraciones:

a)El ancho de cada barra debe estar en relación al número de modalidades o clases que presenta la tabla (Las barras no deben ser ni excesivamente cortas ni anchas, ni demasiado largas y angostas).

b)Entre barra y barra deberá dejarse un espacio aproximadamente igual a la mitad del ancho de una barra.

c) Es muy importante colocar la escala en el eje vertical, que corresponde a las frecuencias.

d)Los gráficos de barras también son usados para representar datos cronológicos.

ALUMNOS MATRICULADOS EN UN C.E.P. DE EDUCACIÓNSECUNDARIA (VARONES)

SeccionesNº de AlumnosMatriculados

1º año2º año3º año4º año5º año

180150165135120

4.3. Gráfico de Barras Compuestas.- En una información estadística, se observa que 3 o más frecuencias, pertenecen a una misma modalidad o clase, ésta representación puede lograrse mediante el uso de barras compuestas.

40

Page 41: Curso Estadistica Aplicada a La Investigacion

ALUMNOS MATRICULADOS EN LOS 3 NIVELESU.S.E. Nº (2008 – 2010)

Años Ed. InicialEd.

PrimariaEd.

Secundaria200820092010

3,0004,5006,500

8,0007,0009,000

6,5008,5007,500

4.4. Gráfico de Barras Superpuestas.- Cuando cada una de las barras representadas es la suma de varios componentes. Es necesario anotar la leyenda para comprender la información.

RESUMEN ANUAL DE EVALUACIÓNCURSO: MATEMÁTICA

Secciones Aprobados Desaprobados Retirados Total

1º Año A1º Año B1º Año C1º Año D1º Año E

4540454040

10125

1010

5855-

6060555550

4.5. Diagrama circular.- En los diagramas circulares, la frecuencia de cada elemento se expresa en porcentaje y éste se representa como un sector del círculo.

41

Page 42: Curso Estadistica Aplicada a La Investigacion

La longitud del arco correspondiente al área del sector, dan una representación visual de la frecuencia de tal elemento.

Área del sector en grados = h i (%) x 360 100

Ejemplo 1:Número de Alumnos que lograron uno de los objetivos e una sección de Educación Inicial (I Bimestre)

Area Nº de hi ( %) Grados

Intelectual 8 27 97

Bio-Psicomotor 10 33 119

Socio-emocional 12 40 144

30 100 360

DIAGRAMA CIRCULAR

Ejemplo 2:

Número de Alumnos que obtuvieron el Título Profesional de Julio-Diciembre (1989 – FAC. EDUC. U.N.E.)

42

40%

Page 43: Curso Estadistica Aplicada a La Investigacion

Escuela Profesional

Nº deAlumnos

hi (%) Grados

Educ. InicialEduc. PrimariaEduc. Secundaria

169

35

2715 58

97º54º

209º

TOTAL 60 100 360º

DIAGRAMA CIRCULAR (Del número alumnos que obtuvieron el título Profesional de Julio – Diciembre (1989-FAC.EDUC.UNE))

43

Page 44: Curso Estadistica Aplicada a La Investigacion

EJERCICIOS N° 3

TAREA:

Elabore un gráfico estadístico correspondiente al Resumen anual de Evaluación de las secciones a su cargo del año próximo pasado.

Ejercicios propuestos:

1. Mediante un gráfico lineal, indique el número de inasistencias diarias en tres Centros Educativos (II Semestre) si se tiene:

MesesCentros Educativos

A B C

AgostoSetiembreOctubreNoviembreDiciembre

3035192015

2430241820

2038202532

2. En una encuesta, sobre el tipo de información que más se leía en dicha sección de un periódico, se obtuvieron los datos siguientes: Cultural 25, Deportiva 63, Económica 82, Política 36, Religiosa 20 y Recreativa 24. Presentar estos resultados en un gráfico circular.

3. Elabore un diagrama de Barras Compuestas, de la presente Tabla correspondiente a la “Periocidad de Consultas a la Biblioteca en un cierto Distrito:

Varones Mujeres

a) Diariamenteb) 2 ó 3 veces a la Semanac) Semanalmented) Quincenalmentee) Mensualmente

3540322818

2836252010

44

Page 45: Curso Estadistica Aplicada a La Investigacion

4. Construir el gráfico adecuado, para la siguiente información Estadística:

a) Alumnos matriculados en la U.S.E: N° (2006 – 2010)

Años N° de Alumnos

20062007200820092010

16 00018 50020 00024 00022 500

b) Alumnos matriculados por edades en C.E.I. mixto

EdadesN° de Alumnos

Varones Mujeres3 años4 años5 años

655070

706055

c) Resumen Anual de Evaluación de 6 secciones de un C.E. de Educación Primaria.

Secciones Aprobados Desaprobados Retirados

1° grado2° grado3° grado4° grado5° grado6° grado

550450500425450450

1007575502525

5025252525--

45

Page 46: Curso Estadistica Aplicada a La Investigacion

d) Número de alumnos que obtuvieron el Título Profesional en Julio de 2012 (Fac. Educ.)

Escuela Profesional: Educación Secundaria

Especialidad N° de Alumnos

Lengua – LiteraturaHistoria – GeografíaFilosofía – PsicologíaMatemática – FísicaBiología – Química

8126

104

46

Page 47: Curso Estadistica Aplicada a La Investigacion

CAPITULOIV

TABLAS DE FRECUENCIAS DE DATOS CONTINUOS

Objetivos Específicos:

- Aplicar la regla de Sturges, para determinar al número de intervalos de clase en una Tabla de frecuencias.

- Elaborar e interpretar una tabla de frecuencia con intervalos de clase.

1. TABLA DE FRECUENCIAS DE DATOS CONTINUOS .- Un dato continuo, es aquel cuyo valor puede ser un número real. Considerando que los datos continuos toman valores racionales, se usa el Intervalo cerrado – abierto, para presentar los datos en una Tabla con Intervalos de clase.

Ejemplo:

Los siguientes datos corresponden a las edades desde 5 hasta 17 ( se puede agrupar en 4 intervalos de clases):

I1: [5 – 8 > son las edades comprendidas desde 5 hasta menores de 8

I2: [8 – 11> son las edades comprendidas desde 8 hasta menores que 11 años.

47

Page 48: Curso Estadistica Aplicada a La Investigacion

I3: [11 – 14 > son las edades comprendidas desde 11 hasta menores que 14.I4: [14 – 17] , edades comprendidas desde 14 hasta 17 años inclusive.

Si las edades se consideran en años y meses, originan datos continuos, por ejemplo: 8 años y 6 meses: el dato será 8,5 años y estará comprendido en el intervalo [8 –11 >

Intervalo de clase.- Un símbolo que define una clase como [a – b> se llama intervalo de clase.Límite de clase.- Son los números extremos de un intervalo [a – b>

a es el límite inferior b es el límite superior

Tamaño o amplitud de un Intervalo de Clase ( c ) .- Es la diferencia numérica entre el limite superior y el límite inferior de un intervalo.

Ejemplo: [5 – 8 > C = 8 – 5 =3Cuando no se conoce los límites de un intervalo, la amplitud es igual al cociente del Rango entre el número de intervalos de clase.

Rango

Nº de intervalo de clase

Marca de clase (Mcl).- Es igual a la semisuma del y el de un intervalo.

(Este punto medio es importante, porque un intervalo de clase es reemplazado por un solo valor).

Número de Intervalos de Clase (K) .- Es el número de intervalos que presenta una tabla de frecuencias.Cuando no se conoce “k” se aplica la Regla de H. Sturges:

n = Total de datos

48

Page 49: Curso Estadistica Aplicada a La Investigacion

Ejemplos:Intervalosde clase

MclLa tabla consta de 6 intervalos de clase n = 6Rango: Dato mayor – Dato menor R = 34 – 10 = 24Tamaño o amplitud del intervalo [10 – 14 > C = 14 – 10 = 4Marca de clase de cada intervalo:

10 – 14 14 – 1818 – 2222 – 2626 – 3030 – 34

121620242832

2. ELABORACIÓN DE UNA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS CON DATOS CONTINUOS.- La clasificación consistirá en determinar el número de intervalos de clase (n) y la amplitud de cada intervalo (c ).

El número y amplitud de los intervalos de una Tabla tiene que estar en relación con la naturaleza y el contexto del estudio.

Para uniformizar criterios, se determina el número de intervalos, mediante la fórmula propuesta por H.A. Sturges:

K = 1 + 3,3 log n

3. PROCEDIMIENTOS PARA ELABORAR UNA TABLA CON INTERVALOS DE CLASE:

1ro) Se calcula el número de intervalos de clase.

2do) Se halla el Rango:R = Dato mayor – Dato menor (Datos continuos)

3ro) Se calcula el tamaño o amplitud de cada intervalo, mediante la fórmula:

49

Rango

Nº de intervalo de clase

Page 50: Curso Estadistica Aplicada a La Investigacion

4to) Se halla el error:= k. C. – R

a) Si = 0, entonces “k” y “c” son los números adecuados o satisfactorios para elaborar la tabla.

b) Si > 0, entonces la diferencia se reparte equitativamente entre el 1er. y último dato.

c) Si < 0, entonces se cambia el tamaño del intervalo “c” o el número de intervalos “k”.

Ejemplo (1):

La siguiente muestra corresponde a los pesos (kg) de un grupo de estudiantes.

Elabore una Tabla de distribución de frecuencia (Aplicando la Regla de Sturges).44 45 50 46 47 41 47 46 51 4653 68 53 55 54 46 47 61 51 4762 49 65 46 45 47 58 47 50 5351 45 40 57 50 53 42 49 53 4946 51 49 50 47 52 54 58 45 5963 56 61

Solución:

1ro) Se determina el número de intervalos que tendrá la tabla:

k = 1 + 3,3 log (53) n = Total de datos de la muestrak = 1 + 3,3 (1.72) ... (ver tabla de Logaritmos)k = 1 + 5.68k = 6.6.8 (se aproxima al entero)k = 7 (Tabla con 7 intervalos de clase).

2do) Se halla el Rango: Nº mayor de la muestra = 68Nº menor de la muestra = 40R = 68 – 40 = 28

3ro) Se determina el tamaño de amplitud de cada intervalo:

50

Page 51: Curso Estadistica Aplicada a La Investigacion

4to) Se calcula la diferencia:

= k.c. – R = 0= 7 x 4 – 28

= 28 – 28 = 0 (“k” y “c” son los números satisfactorios para elaborar la Tabla).

Intervalode clase

Nº dealumnos

< ≥ < ≥

Peso Kg Tabulación hi (%) FA FD FA% FD%[40 – 44 >

44 – 4848 – 5252 – 5656 – 6060 – 64

64 – 68]

IIIIIII IIII IIII III

IIII IIII IIIIII IIII

IIIIIIIIII

318129542

5,734

22,617,9,47,53,8

3213342475153

535032201162

5,739,762,379,388,796,2100,

10094,360,337,720,711,33,8

53 100%

Observaciones:En la tabulación de datos, se debe tener en cuenta que los intervalos son cerrados en el límite inferior y abierto en el límite superior, por lo tanto en el 1er. intervalo estarán comprendido los datos, 40, 41, 42 y 43; en el 2do. intervalo estarán comprendidos los datos 44, 45, 46 y 47 así sucesivamente.

4. INTERPRETACIÓN DE LA TABLA

1ra. frecuencia simple: : Hay 3 alumnos cuyos pesos están

comprendidos en el intervalo [40 – 44> kg.- Hay 3 alumnos que pesan desde 40 kg. y menor que 44

kg.

2da. frecuencia porcentual: h2 (%): El 34% de alumnos sus pesos

están comprendidos en el intervalo [44 – 48> kg.- El 32% de alumnos pesan desde 44 kg. y menor que 48

kg.

3ra. frecuencia acumulada ascendente: FA3: Hay 33 alumnos cuyos pesos son menores que 52 kg.

4ta. frecuencia acumulada descendente: FD4: Hay 20 alumnos cuyos pesos son mayores o iguales a 52 Kg.

51

Page 52: Curso Estadistica Aplicada a La Investigacion

5ta. frecuencia porcentual acumulada ascendente: FD (%)6: el 89% de alumnos tiene pesos menores que 60 Kg.

6ta. frecuencia porcentual acumulada descendente: FD(%)7: El 11% de alumnos tienen pesos mayores o iguales a 60 Kg.

Ejemplo (2)

La siguiente muestra corresponde a los puntajes obtenidos por 36 postulantes e una prueba de Aptitud Académica:

50 43 70 60 55 80,5 52 43 4753 50 54 70 46 49 52 54 53,375 93 70 95 45 44 90 58 8050 75 49 95 60 90,5 85 53 58,3

Elabore una Tabla de frecuencia. Interprete:

a) La mayor frecuencia simple (f1)b) La menor frecuencia simple h3(%)c) La 2da. frecuencia acumulada ascendente FA2d) La 4ta. frecuencia acumulada descendente FD4e) La 5ta. frecuencia porcentual acumulada ascendente FA%5f) La 6ta. frecuencia porcentual acumulada descendente FD%6

Solución

1º) k = 1 + 3,3 log hk = 1 + 3,3 log 36k = 1 + 3,3 (1,56)k = 1 + 5,15 = 6,15 (se aproxima a entero) intervalos de clase

2º) R = 95 – 43 = 52

3º) (se aproxima a entero)

tamaño de cada intervalo

4º) = K.c. – R = 6.9 – 52

= 54 – 52 = 2; > 0, entonces el error se reparte equitativamente entre el 1er. y último dato.

52

Page 53: Curso Estadistica Aplicada a La Investigacion

1(se le resta al dato menor)43 – 1 = 42

= 21 ( se le suma al dato mayor)

95 + 1 = 96

Observación:

a) Si el error es un número par, se reparte equitativamente entre el 1er. y último dato.

2 (se le resta al 1er. menor)

= 42 ( se le suma el último dato)

b) Si el error es = 1, se le suma al último dato.

c) Si el error es 3, se reparte: 1 al 1er. dato y 2 al último dato.

Si el error es 5, se reparte: 2 al 1er. dato y 3 al último dato.

Intervalo de Clase

Puntajes

Nº de Post. hi(%) FA FD FA(%) FD(%)

42 - 5151 - 6060 - 6969 - 7878 - 8787 - 96

11102535

30,5285,5

14,08,0

14,0

112123283136

3625151385

30,558,564,78,86,

100,

10069,541,536,22,14,

36 100%

Interpretación:

a) f1: Hay 11 postulantes cuyos puntajes están comprendidos en el intervalo [42 – 51> ó hay 11 postulantes que tienen puntajes desde 42 y menor que 51.

b) (%) el 5,5 % de postulantes tiene puntajes desde 60 y menor que 69

c) FA2: Hay 21 postulantes cuyos puntajes son menores que 60.

d) FD4: Hay 13 postulantes cuyos puntajes son mayores o iguales a 69 kg.

53

Page 54: Curso Estadistica Aplicada a La Investigacion

k = 7

C = 6

e) FA(%)5: El 86% de postulantes tiene puntajes menores que 87.f) FD(%)6: El 14% de postulantes tienen puntajes mayores o iguales

que 87.

Ejemplo (3)

La puntuación final en un concurso de tiro, de un grupo de personas, fueron:

58 84 75 82 90 76 56,555 79 88 73 93 83 60,561 65 75 87 62 71 7466 78 82 75 77 55 9996 78 89 61 95 74 6579 62 67 100 85 77 7398 61 57 73 60.

Elabore una Tabla de frecuencias.

Solución:

1) k = 1 + 3,3 log 47k = 1 + 3,3 (1,67)k = 6,52

intervalo de clase

2) R = 100 – 55 = 45

3)

4) Se halla el error = k.c – R = 7 x 6 - 45 = - 3 ( < 0, entonces se cambia “k”)

k = 8 = 8 x 6 - 45 = 3 ( se reparte entre el 1er. y último dato)

1(se le resta al dato menor: 55 – 1 = 54

= 32 ( se le suma al dato mayor 100 + 2 = 102

Se elabora la Tabla, teniendo en cuenta éstos datos:k = 8

54

Page 55: Curso Estadistica Aplicada a La Investigacion

c = 6R = 102 - 54 = 48

Puntuación Nº de Personas FA FD FA(%) FD(%)

54 - 6060 - 6666 - 7272 - 7878 - 8484 - 9090 - 9696 - 102

593

117534

10,6%19,16,4

23,414,910,66,48,5

514172835404347

47423330191274

10,629,736,159,574,485

91,499,9

99,989,370,263,840,425,514,98,5

47 99,9

Interpretación de la Tabla

a) ¿Qué porcentaje de personas han obtenido menor de 72 puntos en el Concurso de Tiro?Rpta.: El 36,1 % de personas.

b) ¿Cuántas personas han obtenido menos de 78 puntos?Rpta.: 28 personas.

c) ¿Cuántas personas han obtenido 84 puntos o más en dicho Concurso?Rpta.: 12 personas.

d) ¿Cuántas personas han obtenido desde 84 puntos y menos de 90 puntos?Rpta.: 5 personas.

e) ¿Qué porcentaje de personas han obtenido desde 60 hasta menos de 66 puntos?Rpta.: El 19,1 % de personas.

f) ¿Qué porcentaje de personas han obtenido 60 puntos o más?Rpta.: El 89 % de personas.

55

Page 56: Curso Estadistica Aplicada a La Investigacion

EJERCICIOS N° 4

TAREA:

Obtenga las Tallas (cm.) de sus alumnos de una sección y ordene dichos datos en una Tabla (con intervalos). Hallar las frecuencias simples, porcentaje y acumuladas.

Ejercicio propuestos:

1. Se ha tomado nota del número de tardanzas a un Centro Educativo, que en el transcurso del mes; han tenido un grupo de alumnos, obteniéndose el siguiente resultado:

1 0 2 0 3 4 1 1 0 50 1 3 2 1 0 2 2 1 02 1 1 3 1 0 4 3 2 11 5 1 5 3 2 6 0 1 22 1 6 4 2 3 3 1 0 50 4 1 1 0 3 5 1 4 2

a) Determinar la población, muestra, variable, clase de variable, dato estadístico.

b) Elabore una Tabla presentada éstos datos con sus respectivas frecuencias.

c) Interprete las frecuencias f3, h6(%), f7, h1, (%), FA(2), FA(5), FD(3), FA(%)2, FD(%)4.

2. El Departamento de O.B.E. de un C.E., calificó la disciplina escolar de 40 alumnos, en 4 categorías:

Muy Buena (MB), Buena (B), Regular (R), Deficiente (D), cuyos resultados fueron:

B R D D MB B B B MB BMB R R MB B B R B R RB MR R B B R R B B RMB B MB R R B B MB R D

a) Determinar la población, la muestra, variable, tipo de variable, dato estadístico.

56

Page 57: Curso Estadistica Aplicada a La Investigacion

b) Elabore una Tabla con las frecuencias absolutas, relativas y por porcentual acumulada.

c) ¿Qué porcentaje de alumnos tienen conducta: Muy Buena y Buena?

d) ¿Qué porcentaje de alumnos tienen conducta deficiente?

3. Los siguientes datos continuos corresponden a los calificativos de una sección del 5to. año de Secundaria en el curso de Filosofía.

14 10 12 11 05 07 08 14 10 1411 15 10 12 12 03 09 08 19 0610 08 10 18 08 07 12 13 10 1011 12 11 05 15 14 13 05 14 1408 17 10 18 09 09 12 14 12 1413 11 10 15 12 15 16 16

a) Elabore una Tabla de distribución de frecuencia de 8 intervalos de clase (k).

b) Interprete el 6to. intervalo de clase y su frecuencia porcentual.

c) Hallar las marcas de clase de cada intervalo,

d) ¿Cuál es el porcentaje de alumnos aprobados y de desaprobados.

4. Los datos corresponden a los peso (libras) de 40 estudiantes.157 138 164 150 132 144 125 149144 146 158 140 147 136 148 152165 168 126 138 177 163 117 154135 146 173 142 147 135 153 140128 161 145 135 142 150 156 145

a) Elabore una Tabla de distribución de frecuencia, empleando la Regla de Sturges.

b) ¿Cuántos estudiantes pesan menor de 157 libras?

c) ¿Qué porcentaje de estudiantes pesan entre [137 – 177> libras?

d) ¿Cuántos estudiantes tienen un peso mayor o igual a 147 libras?

e) ¿Cuántos estudiantes pesan entre (127 libras y menor de 137 libras)?

57

Page 58: Curso Estadistica Aplicada a La Investigacion

5. Los siguientes datos continuos corresponden a las edades de un grupo de alumnos

12 10 8 12 6 18 8 16 5 79 5 12 10 6 6 14 8 9 1317 11 10 8 6 13 16 19 12 616 12 10 16 8 9 7 11 13 148 15 10 8 9 11 13 8 14 10

a) Elabore una tabla de distribución de frecuencia empleando la Regla de Sturges.

b) ¿Qué porcentaje de alumnos, tienen edades menores de 15 años?

c) ¿Qué porcentaje de alumnos tienen edades entre (9 y 19) años?

d) ¿Cuántos alumnos tienen edades mayores o iguales a 7 años?e) ¿Cuántos alumnos tienen edades mayores 17 años?

6. La muestra corresponde a los Pesos (Kg.) de un grupo de alumnos de Educación Primaria.

28 36 30 26 31 30 20 21 4631 28 38 30 29 36 24 22 4827 40 41 27 42 39 27 43 3023 39 25 26 31 35 30 45 3525 47 40 21 42 30 22 20 46

a) Interprete una Tabla de frecuencias.

b) Interprete la menor frecuencia simple.

c) Interprete la mayor frecuencia porcentual.

d) Interprete la 2da. frecuencia acumulada ascendente.

e) Interprete la cuarta frecuencia porcentual acumulada ascendente.

CAPITULO

58

Page 59: Curso Estadistica Aplicada a La Investigacion

VIMEDIDAS DE TENDENCIAS CENTRAL

Objetivos Específicos:

- Definir las Medidas de Tendencia Central.

- Calcular los valores de la Media Aritmética, la mediana y la moda en una distribución de frecuencias de datos agrupados y no agrupados.

- Interpretar la Media Aritmética, la mediana y la moda.

MEDIDAS DE TENDENCIA CENTRAL

Las unidades anteriores, están referidas a la clasificación de variables, recolección de datos, construcción de Tablas de Frecuencias y a la representación gráfica, como fase preliminar en la descripción y análisis estadístico.

El objetivo principal de esta primera etapa, ha sido determinar la naturaleza y formas de distribución de frecuencias, como base para la reducción de datos, a través de ciertas características descriptivas y medidas de resumen.

Se puede comparar dos o más Tablas de frecuencias, así como hacer una comparación gráfica, sin embargo, existen dificultades para hacer comparaciones cuantitativas.

Estadísticamente para facilitar este análisis comparativo, es necesario disponer de algunos indicadores o medidas, para obtener un “valor numérico” que represente a toda la población o muestra que se muestra y estas medidas se llama “Medidas de Tendencia Central” o “Medidas de Posición”.

Estos Estadígrafos, son valores que de manera condensada representan en un solo valor a una serie de datos y además describen resumidamente el conjunto de observaciones.

Las medidas de Tendencia Central, más conocidas e importantes son:- La Media Aritmética- La Mediana- La Moda

59

Page 60: Curso Estadistica Aplicada a La Investigacion

- La Media Geométrica- La Media Armonica

1. La Media Aritmética ( ).- Es el “promedio” de los valores observados de la variable. Es el centro de gravedad de la distribución.

2. Cálculos de la Media Aritmética:

2.1. Datos sin Tabular.- La media aritmética se calcula dividiendo la suma de los valores de la variable, entre el número de observaciones.Para variable “x”, la media aritmética se puede simbolizar como:

el símbolo significa “sumatoria”

n = número total de observaciones.

Ejemplo 1

Los puntajes obtenidos en 5 exámenes parciales de Estadística son:14, 10, 13, 11, 10

La nota “promedio” o media aritmética es:

Ejemplo 2

Hallar la media aritmética de la siguiente serie de valores: 2, 3, 5, 0, 4, 3, 6, 7

60

Page 61: Curso Estadistica Aplicada a La Investigacion

Ejemplo 3

Las estaturas de los componentes de un equipo de Basket son: 1,69; 1,72; 1,81; 1,75; 1,83 mt. Encontrar la Talla “promedio” de los citados jugadores:

Rpta.- La Talla “promedio” de los 5 jugadores es 1.76 mt.

Ejemplo 4

Hallar la ( ) de la serie: 5, 5, 5, 7, 7, 8, 8, 8, 8.

La media aritmética así calculada se llama “Media aritmética ponderada”. El ejemplo clásico de ponderación se refiere al llamado “coeficiente” o “peso” en ciertos exámenes, por ejemplo:

En un examen las pruebas presentan los siguientes coeficientes:

- Prueba oral 3- Prueba escrita 2- Práctica 1

Si las calificaciones obtenidas por un alumno son:

- Prueba oral 09- Prueba escrita 12- Práctica 14

Aplicando las ponderaciones correspondientes, la nota “promedio” será:

61

Page 62: Curso Estadistica Aplicada a La Investigacion

FORMULA DE LA MEDIA ARITMÉTICA PONDERADA

n = Número total de datos o suma de las frecuencias.

Ejemplo 1:

Las notas finales de un estudiante en Matemática, Química, Inglés y Educ. Física son respectivamente: 11, 13, 12 y 15. Si la importancia que se asigna a estas asignaturas son de: 4, 3, 2 y 1 respectivamente. Determinar el promedio ponderado.

Solución:

Ordenando los datos en una Tabla, tenemos:

Notasx

Ponder.f

x. f

MatemáticaQuímicaInglésE. Física

11131215

4321

44392415

10 122

Aplicando la fórmula, tenemos:

Ejemplo 2

¿Cuál será la nota mínima que deberá obtener un alumno en un examen (Entrevista personal), si en las anteriores pruebas sus calificaciones han sido:

- Prueba escrita 10 coeficiente 3- Prueba oral 11 coeficiente 2- Entrevista personal x coeficiente 4

Siendo la nota mínima aprobatoria de 12.Solución:

62

Page 63: Curso Estadistica Aplicada a La Investigacion

Notasx

Ponder.F

x. f

P. E.P. O.Ent. Pers.

1011x

324

30224x

9Hallar la nota de Entrevista Personal, si el promedio aprobatorio es 12.

Fórmula:

108 = 52 + 4x

56 = 4x

14 = x

Rpta. La nota de Entrevista personal es 14.

2.2. Datos Tabulados.- Los datos se pueden presentar o agrupar en Tablas sin Intervalos y en Tablas con Intervalos.

2.2.1. Tabla sin Intervalos.- Se usa la fórmula de la Media Aritmética Ponderada.

Ejemplo 1

Determinar el Promedio de Cursos Desaprobados por una sección de 54 alumnos.

N° de CursosDesaprobados

x

Nro. deAlumnos

fx. f

123456

141017931

14205136156

54 142

63

Page 64: Curso Estadistica Aplicada a La Investigacion

Fórmula: (se redondea, son datos

discretos)

Rpta.- El promedio de cursos desaprobados es de 3.

Ejemplo 2

Calcular el promedio de Asistentes a un Teatro, durante 45 días.

N° Asistentes

x

N° Días

fx. f

200220250255260265

37

121544

60015403000382510401060

45 11065

Rpta.- El promedio de asistentes es de 246 personas.

Ejemplo 3

Calcular el promedio de Nivel Magisterial, en que se encuentran 120 profesores de la U.S.E. N°2.

xNivel

Magis.

fN° de Prof.

x. f

12345

2721283014

274284

12070

120 343

Rpta.- El 3er. nivel magisterial, es el promedio en que se encuentran los profesores de dicha U.S.E.

2.2.2. Tablas con Intervalos.- En el cálculo de la Media aritmética, a partir de Tablas con intervalos, se usa la Marca de clase, para representar el valor de cada elemento incluido en su respectivo intervalo.

64

Page 65: Curso Estadistica Aplicada a La Investigacion

Fórmulas:a) Método Ponderado

= marca de clase de cada intervalo

b) Método Abreviado

A = Marca de clase del intervalo de mayor frecuencia o del centro de distribución.

d = Desviaciones con respecto a “A” (número enteros diferenciados en una unidad).

n = Suma de frecuencias.

C = Tamaño o amplitud del intervalo de clase.

Ejemplo 1

Determinar el peso promedio de un grupo de personas en la siguiente distribución.

Peso (Kg) f60 – 6262 – 6464 – 6666 – 6868 – 70

51842278

100

65

Page 66: Curso Estadistica Aplicada a La Investigacion

Solución: Método Ponderado:

Peso (Kg) fi

60 – 6262 – 6464 – 6666 – 6868 – 70

51842278

6163656769

305113427301809552

100 6530

Solución: Método abreviado:

Peso (Kg) f d f x d

- 28

+ 43

60 – 62 62 – 64

518

-2-1

-10-18

A 64 – 66 42 0 0 66 – 68 68 – 70

278

12

2716

100 ∑ (f x d) = 15

A = 65 (marca de clase del intervalo de mayor frecuencia).d = desviaciones con respecto al intervalo de mayor

frecuencia.n = 100C = 2

Fórmula:

(Con ambas fórmulas, el resultado es el mismo).

Rpta. El peso promedio de este grupo de persona es de 65,3 Kg.

Ejemplo 2Se desea obtener el gasto “promedio diario” en pasajes urbanos, de 90 personas, que presenta la siguiente tabla:

66

Page 67: Curso Estadistica Aplicada a La Investigacion

Gasto diario

(Soles S/.)

N° dePersonas

0,50 – 1,001,00 – 1,501,50 – 2,002,00 – 2,502,50 – 3,003,00 – 3,50

5203510146

90Hallar la media aritmética, usando los 2 métodos.

Método Ponderado:

Gasto(Soles S/.)

f

0,50 – 1,001,00 – 1,501,50 – 2,002,00 – 2,502,50 – 3,003,00 – 3,50

5203510146

0,751,251,752,252,753,25

3,7525,0061,2522,5038,5019,50

90 170,50

Solución: Método abreviado

Gasto diario(Soles S/.)

-30

+ 56

A = 1,75

n = 90

C = 0,50

0,50 – 1,00

1,00 – 1,50

1,50 A 2,00

2,00 – 2,502,50 – 3,003,00 – 3,50

5

20

35

10146

- 2

- 1

0

123

- 10

- 20

0

102818

90 Σ (f x d) = 26

67

Page 68: Curso Estadistica Aplicada a La Investigacion

Rpta.- El gasto promedio diario de pasajes es de S/. 1,90

Ejemplo 3

Encontrar descuentos promedio de 70 empleados, en la siguiente distribución.

Descuentos(Soles S/.)

Nº deEmpleados

380 – 430430 – 480480 – 530530 – 580580 – 630630 – 680

349

11281570

Solución: Método Ponderado:

Descuentos(Soles S/.)380 – 430430 – 480480 – 530530 – 580580 – 630630 – 680

349

112815

405455404555605655

1215182045456105

169409825

70 40450

Solución: Método Abreviado

Descuentos(Soles S/.)

f d f x d

68

Page 69: Curso Estadistica Aplicada a La Investigacion

A = 605

Σ (f x d) = -38n = 70C = 50

380 – 430430 – 480480 – 530530 – 580580 – 630630 – 680

349

112815

- 4- 3- 2- 1

01

- 12- 12- 18- 11

015

70 Σ (f x d) = -38

LA MEDIANA (Me)

1. Definición.- Es el valor que divide al total de las observaciones o distribución en 2 partes iguales. Esto significa que cada parte equivale al 50% del total de datos.

2. Ventajas de la Mediana.- Como estadígrafo de posición la mediana es más recomendable que la Media Aritmética, cuando:

a) Existen valores extremos excepcionalmente grandes o muy pequeños, puesto que la Mediana no está afectada por los valores extremos como sucede con la Media.

b) Se tiene datos cualitativos, susceptible de ordenarse de acuerdo a rango, calificaciones o categorías.

3. Cálculo de la Mediana.

3.1 Datos sin tabular.- Para calcular la Mediana en datos no agrupados, primero se ordena la serie en forma ascendente o descendente. Se presentan 2 casos:

a) Cuando el Número de Datos es IMPAR: La Mediana es el dato que ocupa el centro de la serie:Ej.: Dada la serie: 10, 30, 2, 10, 5, 6, 8.Ordenando la serie en forma ascendente:

2, 5, 6, 8, 10, 10, 30.

69

Page 70: Curso Estadistica Aplicada a La Investigacion

Me La Mediana será igual a 8, porque ocupa el término central de serie.Ej.: Hallar la Mediana de los siguientes valores:

24, 39, 40, 24, 78

Ordenando la serie: 24, 24, 39, 40, 78

Me = 39

b) Cuando el número de datos es PAR: La Mediana es igual al promedio de los dos valores centrales.Ej.: Dada la serie: 5, 3, 8, 4, 20, 3, 18, 16.

Se ordena la serie: 3, 3, 4, 5, 8, 16, 18, 20.

Ej.: Los sueldos anuales de 6 trabajadores son:

60, 70, 50, 52, 90, 56 En miles de nuevos soles.

Ordenando: 50, 52, 56, 60, 70, 90

Interpretando este valor significa que de los 6 trabajadores, hay 3 de ello o sea el 50% tienen sueldos anuales menor o inferior a S/.58, en tanto que los 3 trabajadores restantes o sea el otro 50% tienen sueldos anuales superiores a S/.58, miles de nuevos soles.

DATOS TABULADOS:

Procedimiento:

1ro. Se determinan las frecuencias acumulada ascendentes (FA)

2do. Se halla (suma de frecuencia dividida entre 2)

3ro. Ubicar en la columna de las (FA)

70

5,6285

M

e

582

6056

Me

Page 71: Curso Estadistica Aplicada a La Investigacion

4to. Si no coincide con algún (FA), ubicar un como la

inmediata superior a , para determinar el dato X i o el

intervalo Mediano (I) correspondiente.

F i = es una Frecuencia acumulada inmediata superior a n/2

F i-1 = es una Frecuencia acumulada inmediata anterior a .

= es el valor de que corresponde a F i

= es el valor de que corresponde a F i-1

Tablas sin Intervalos: (Datos discretos)

Fórmulas:

- Si no coincide con algún FA →

- Si coincide con algún -1 →

Ejemplo 1Calcular la Mediana que corresponde a la distribución de 38 viviendas según el Nº de habitaciones que tiene cada una:

Nº deHabitac.

X

Nº deVivienda FA 1.º. Se halla

no coincide con algún FA

2.º. Se ubica un F i(24) inmediato superior a 19, para determinar el

235

458

49

176 7 24 78

104

3438

38

Fórmula :

Interpretación: Significa que el 50% de vivienda tienen menos de 6 habitaciones, y el otro 50% tienen más de 6 habitaciones.

Ejemplo 2La siguiente distribución, presenta las notas obtenidas en el Examen de Estadística, por 36 alumnos.

71

Page 72: Curso Estadistica Aplicada a La Investigacion

NOTASX

Nº ALUMf

FA 1.º. Se halla

coincide con algún F i-1

2.º. Se ubica un F i(25) inmediato superior a 18, para determinar el

Fórmula:

1011

X i-1 12X i 13

141516

26

107632

28

18 F i-1

25 F i

313436

36

Reemplazado los datos de la tabla, en la fórmula, cuando

coincide con F i-1 :

Interpretación: Significa que el 50% de alumnos, es decir, 18 de ellos tienen notas menores a 12,5 y el otro 50% (los 18 restantes) tienen notas mayores de 12,5.

Ejemplo 3

Se presenta un conjunto de estudiantes, clasificados por su rendimiento académico en 5 categorías: ¿Cuál es el rendimiento que tienen la mitad de los estudiantes?

CategoríasNº de

alumnosFA

Como no coincide con FA

la fórmula de la Me seráMe = X i

Me = Bueno

PésimoMalo

RegularBueno

Excelente

23

14138

25

193240

40

Rpta.- La Mediana corresponde a la categoría “BUENO” es decir que la mitad o el 50% de estudiantes tienen un rendimiento inferior a Bueno, el otro 50% su rendimiento es superior a Bueno.

3.2. Tablas con Intervalos.-

72

Page 73: Curso Estadistica Aplicada a La Investigacion

Fórmulas:

- Si no coincide con algún (FA)

- Si coincide con F i-1 Me = L i

L i = Límite inferior del intervalo Mediano correspondiente a F i.T = Frecuencia acumulada anterior a F i

fMe = Frecuencia simple del Intervalo mediano correspondienteC = Tamaño o amplitud del Intervalo de clase.

Ejemplo 1

Calcular el sueldo Mediano correspondiente a 80 trabajadores de una empresa, en la siguiente distribución:

Miles de Nuevos

Soles S/.

Nº detrabaj.

FA 1.º.

no coincide con algún FA

2.º. Se ubica un F i(44) inmediato superior a 40, para determinar el el intervalo Mediano correspondiente.

20 - 5050 – 80

1113

1124

80 – 110 20 44110 – 140140 – 170170 – 200

17154

617680

80

Fórmula:

73

Page 74: Curso Estadistica Aplicada a La Investigacion

Interpretación: Significa que el 50% del total de trabajadores (40 de ellas) tienen sueldos inferiores a S/. 104 soles, y el otro 50% tiene sueldos superiores a S/. 104 soles.

Ejemplo 2:

Calificaciones del curso de Matemática, en una sección “X”. Hallar e interpretar la Mediana.

Calificaciones fi FA05 – 0707 – 0909 – 1111 – 13

1359

149

18 13 – 15 15 33

15 – 1717 – 19

114

4448

48

Interpretación.- el 50% de alumnos, en dicha distribución tienen calificaciones menores a 14 y el otro 50% sus calificaciones son mayores de 14.

Ejemplo 3:

Se aplicó un TEST a 86 estudiantes, obteniéndose el siguiente resultado. Hallar e interpretar la Mediana.

74

Page 75: Curso Estadistica Aplicada a La Investigacion

Puntajes f FA coincide con F i-1

Se emplea la 2da.Fórmula:

Me=L i

L i =Límite inferior del Intervalo mediano correspondiente a F i

[32 – 39]40 – 4748 – 5556 – 63

68

1415

61428

43 F j-1

I → 64 – 71 20 63 72 – 7980 – 87

1211

7586

86

Interpretación: el 50% de estudiantes han obtenido puntajes menores a 64 puntos y el otro 50% sus puntajes son mayores o iguales a 64.

En la última tabla se observa que los intervalos son cerrados, por lo tanto el tamaño de cada intervalo es C = 8.

La Moda (Mo)

La Moda es la medida de tendencia central, que se define como el valor que se presenta con mayor frecuencia en una serie o distribución de datos.

a. Cálculo de la Moda:

Ejemplos:

1) Encontrar la Moda en la serie:6 , 8, 6 , 9, 10, 3, 6, 3

La moda es 6, porque se repite con mayor frecuencia, es una serie unimodal.

2) Encontrar la Moda en la Serie:12, 15, 16, 18, 23, 26

En esta serie NO HAY MODA

3) Hallar la moda en la serie5, 6, 7, 7, 7, 8, 9, 9, 9, 10

La moda es 7 y 9, es una serie BIMODAL

75

Page 76: Curso Estadistica Aplicada a La Investigacion

DATOS TABULADOS:

Tablas sin Intervalos.- En una tabla de frecuencias sin intervalos de clase, la Moda es el dato que tiene la mayor frecuencia de la tabla.

Tablas con Intervalos.- Para hallar la Moda, en una tabla con intervalos de clase, aplica la siguiente fórmula:

L i = Límite inferior de la clase Modal (Intervalo de clase que tiene la mayor frecuencia).

d1 = Diferencia de la frecuencia simple de la clase Modal y la frecuencia de la clase inmediata inferior (en valor absoluto)

d2 = Diferencia de la frecuencia simple de la clase Modal y la frecuencia de la clase inmediata superior (en valor absoluto)

C = Tamaño o amplitud del intervalo.

Ejemplo 1:

Se desea encontrar el consumo más frecuente de electricidad en 100 viviendas. Hallar e Interpretar la Moda:

Consumo deelectricidad (kw)

1.º. Se ubica la clase [40 – 60>Modal ( el intervalo de mayor frecuencia)

L i = 40

2.º. Se hallad1 = 30 – 15 = 15d2 = 30 – 20 = 10

c = 20Se reemplaza los valores obtenidos en la fórmula.

0 – 2020 – 40

1015

Clase Mo 40 – 60 30 mayorfrecuencia

60 – 8080 – 100

100 – 120120 – 140

201285

100

76

Page 77: Curso Estadistica Aplicada a La Investigacion

Fórmula:

Interpretación: El consumo más frecuente de electricidad es de 52 Kw.

Ejemplo 2:

La siguiente distribución corresponde a las edades de un grupo de personas. Hallar la Moda.

edades (año)f

Clase Modal = [31 – 36] d1 = 80 - 70 = 10 d2 = 80 – 67 = 13

c = 6 (son intervalos cerrados, se incluye el límite superior del intervalo).

[19 – 24]25 – 30

5570

Clase Mo 31 – 36 8037 – 4243 – 4849 – 54

674036

Reemplazando los valores obtenidos, tenemos:

77

Page 78: Curso Estadistica Aplicada a La Investigacion

se aproxima a 34 (datos discretos)

Mo = 34

Interpretación: En dicha distribución la MAYORÍA de las personas tienen una edad aproximada de 34 años.

Ejemplo 3

Calificativos del curso de Tecnología de 56 alumnos. Hallar la Moda.

Calificación f Es una distribución que presenta dos clases modals

CL MO1: [09 – 11]CL MO2: [15 – 17]

Ambas tienen la mayor frecuencia 14.

03 – 05 06 – 08

39

Cl Mo1 09 – 11 14

12 – 14 10

Cl Mo2 15 – 17 14

18 – 20 6

56

a) Cl Mo1 = L Mo = 9

d1 = 14 – 9 = 5

d2 = 14 – 10 = 4

C = 3 (intervalos cerrados)

b) Cl Mo2 = L Mo = 15 d1 = 14 – 10 = 4 d2 n = 14 – 6 = 8

78

Page 79: Curso Estadistica Aplicada a La Investigacion

C = 3

Interpretación: La mayoría de alumnos poseen calificativos de 11 y 16 puntos.

79

Page 80: Curso Estadistica Aplicada a La Investigacion

CAPITULO VII

MEDIDAS DE DISPERSIÓN, SESGO Y CURTOSIS

Objetivo Especifico: Reconocer y utilizar las medidas de

dispersión Reconocer y diferenciar la asimetría y la

curtosis.

Los estadígrafos de dispersión son medidas que nos dan la mayor o menor concentración de observaciones con respecto a un valor central.

Las medidas de tendencia central no siempre son fiables, a veces nos pueden confundir, por eso recurrimos a las medidas de dispersión.

Existen distribuciones de datos que tienen valores iguales en frecuencias de tendencia central pero son totalmente diferentes en cuanto a la concentración de sus datos, por ejemplo:

i) 29, 31, 30, 32, 28

ii) 5, 55, 15, 45, 30

Lo que en labores de análisis podría confundir en su comparación, por lo cual se recorre a las medidas de dispersión, los más comunes son:

1. RECORRIDO.- El recorrido de un conjunto de datos esta definido por:

R = Límite superior – Límite inferior

a) Datos no agrupados:

Ejm: 15, 18, 23, 16, 35, 28, 20

R = Xs – X i

Donde: Xs = 35;

X i = 15;

80

Page 81: Curso Estadistica Aplicada a La Investigacion

R = 35 – 15 = 20

b) Datos agrupados:

Se toma el menor valor y el mayor valor de los intervalos definidos.

Ejm:

Intervalos de pesos (Kg.)

15 – 2526 – 3536 – 4546 – 5556 – 6566 - 75

Esta medida posee varias dificultades que lo hacen no práctica, por ejemplo, sólo utiliza los valores extremos de las observaciones, y puede ser muy afectada por alguna de ellas, y no dice nada de cómo se dispersan los valores intermedios.

En este capítulo veremos medidas de dispersión mejores que el recorrido, éstas se determinan en función a la distancia entre las observaciones y algún estadístico de tendencia central.

2. DESVIACIÓN MEDIA (Dm)

Se define a la desviación media como la media de las diferencias en valor absoluto de los valores de la variable a la media

a) Datos no agrupados

donde: Dm = Desviación media

n = Número de observaciones

x i = valor que puede tomar los datos

= Media aritmética

= Valor absoluto de las desviaciones de los diferentes

x i de

81

R = Ls - Li

R = 75 – 15 = 60

Page 82: Curso Estadistica Aplicada a La Investigacion

Ejm: Hallar la Dm de los siguientes datos: 1, 3, 6, 9, 16

1

3

6

9

16

6

4

1

2

9

Por lo que el promedio de las distancias con respecto a es 4.4

b) Datos Agrupados :

Donde: x´ i = marca de clase f i = es la frecuencia absoluta de los datos

Ejm: Pesos de 70 personas.

Peso (Kg) fi

30 – 4041 – 5051 – 6061 – 7071 – 8081 - 90

410179

128

354555657585

140450935585900680

26.516.56.53.5

13.523.5

106165

110.531.5162188

La desviación media utiliza el valor absoluto, porque sino la

sumatoria sería 0 ( ), desde el punto de vista

geométrico la distancia que induce la desviación media en el espacio de observaciones no es lo natural (no permite definir

82

Page 83: Curso Estadistica Aplicada a La Investigacion

ángulos entre dos conjuntos de observaciones) lo que hace que sea engorroso trabajar con ella a la hora de inferir a la población.

3. VARIANZA ( )

Si las desviaciones con respecto a la media las consideramos al cuadrado , de nuevo obtenemos que todos los sumandos tiene el mismo signo positivo, por lo que esta es la forma de medir la dispersión de los datos de forma que sus propiedades matemáticas son más fáciles de utilizar.

La varianza es la medida de dispersión más importante y viene a ser el grado de dispersión de las observaciones respecto a la media aritmética.

Se representa por: s2 ó V(x)

a) Datos no agrupados

donde: = varianza

x i = valores que pueden tomar los datos

n = número de observaciones de la población

= media aritmética del conjunto de datos

= diferencia de las observaciones con respecto a la media aritmética elevado al cuadrado.

Pero también se puede

Ejm: Calcular la varianza de las siguientes cantidades medidas en metros: 3, 3, 4, 4, 5.

83

Page 84: Curso Estadistica Aplicada a La Investigacion

b) Para datos agrupados:

donde f i = frecuencia absoluta de los datos

= marca de clase

Pero también se puede expresar de las siguiente manera (se procede al igual que para los datos no agrupados):

Ejm: Distribución de pesos en Kg. de 70 personas.

Peso (Kg)

30 – 40

40 – 50

50 – 60

60 – 70

70 – 80

2

8

20

30

10

35

45

55

65

75

70

360

1 100

1 950

750

2 450

16 200

60 500

126 750

56 250

Donde:

84

3

3

4

4

5

9

9

16

16

25

Page 85: Curso Estadistica Aplicada a La Investigacion

4. DESVIACIÓN ESTÁNDAR O TÍPICA ( )

La varianza no tiene la misma magnitud que las observaciones, por ejemplo si las observaciones se miden en Kg, la varianza lo hace en Kg2, si queremos que la medida de dispersión sea de la misma dimensionalidad que las observaciones bastará con tomar su raíz cuadrada, por ello se define a la desviación estándar o típica como:

a) Datos no agrupados

Ejm: Calcular la desviación típica de los siguientes datos: 2, 4, 6

2

4

6

4

16

36

85

Page 86: Curso Estadistica Aplicada a La Investigacion

b) Datos agrupados

ó también

Ejm: Distribución de pesos en Kg. de 70 personas.

Peso (Kg)

30 – 4040 – 5050 – 6060 – 7070 – 80

28

203010

3545556575

70 36011001950 750

2 450 16 200 60 500126 750 56 250

Donde:

COEFICIENTE DE VARIACIÓN

El coeficiente de variación no tiene unidades de ahí que se emplea para comparar dos distribuciones en base a su dispersión; cuando menor es el coeficiente de variación el grupo es más homogéneo. Luego para su cálculo hacemos uso de la siguiente

formula : C.V. = * 100%

Donde s es la desviación estándar o típica y media aritmética.

Ejemplo :En la zona A el promedio de hijos por familia es de 5 con S = 3.

En la zona B el promedio de hijos por familia es de 2 con S = 1. ¿Cuál de los grupos es más homogéneo?

86

Page 87: Curso Estadistica Aplicada a La Investigacion

Datos Zona A Zona B = 5 = 2 S = 3 S = 1Luego calculamos los respectivos coeficientes de variación :

C.V.(A) = * 100%

= 0.6 * 100% = 60%

C.V.(B) = * 100%

= 0.5 * 100% = 50%

finalmente concluimos de que el grupo B es el más homogéneo.

DEFORMACIONES

La distribución de datos puede representarse gráficamente por medio de la curva de sus frecuencias que analizándola puede ser de simetría o de asimetría (deformada), la cual es deducida desde una “curva normal” que representa una distribución simétrica es decir = Me = Mo, el más importante es:

EL SESGO

El sesgo es el grado de asimetría o falta de simetría de una distribución. Si la curva de frecuencias de una distribución tiene una cola más larga a la derecha del máximo central que a la izquierda se dice que la distribución está sesgada a la derecha o que tiene sesgo positivo. Si es al contrario, se dice que está sesgada a la izquierda o que tiene sesgo negativo.

En las distribuciones sesgadas, la media tiende a situarse con respecto a la moda al mismo lado que la cola más larga.

La formula de cálculo fue propuesto por Karl Pearson :

Sesgo =

AS =

finalmente para evitar el empleo de la moda, se puede utilizar:

Sesgo =

87

Page 88: Curso Estadistica Aplicada a La Investigacion

AS =

a las cuales también se les llama primer y segundo coeficiente de asimetría de PEARSON.

Además hay otro tipo de cálculo propuesto por Arthur BOELEY:

AS = =

llamado coeficiente de sesgo cuartílico.

Por lo tanto si:

1. AS = 0 no existen asimetrías.

2. AS > 0 existe asimetría positiva (+) donde extiende la cola a la derecha del máximo central.

3. S < 0 tiene asimetría negativa (-) donde extiende la cola a la izquierda del máximo central.

es simétrica

S > 0 tiene asimetría positiva

88

Page 89: Curso Estadistica Aplicada a La Investigacion

S < 0 tiene asimetría negativa.

APUNTAMIENTOSLa distribución gráfica de las frecuencias de datos también pueden ser analizadas por la forma de apuntamiento o picos desde un estándar que puede ser la distribución normal o simétrica, la mas común es:CURTOSIS Es el grado de apuntamiento de una distribución, normalmente se toma en relación a la distribución normal. Una distribución que presenta un apuntamiento relativamente alto toma el nombre de leptocúrtica ; si es achatada se llama platicúrtica.La distribución normal que ni es apuntada ni achatada se llama mesocúrtica.La graficas son las siguientes:

_________________ __________________ __________________Leptocúrtica Platicúrtica Mesocúrtica

finalmente la fórmula de cálculo es la siguiente:

Coeficiente Percentil de Curtosis K =

donde es el rango semi intercuartílico.

y son los percentiles 90 y 10 Para la distribución normal K=0.263.

CuandoK = 0,263 es mesocúrticaK < 0,263 es platicúrticaK > 0,263 es leptocúrtica

89

Page 90: Curso Estadistica Aplicada a La Investigacion

Ejemplo: Medidas de Tendencia Central y Medidas Dispersión

De una Población de estudiantes del C.E. Parroquial “San José” se selecciona una Muestra Aleatoria de 10 estudiantes se anota sus estaturas en el distrito de Chaclacayo, el 18 de Febrero del 2012 y se ha obtenido los siguientes resultados, en centímetros:

100 120 130 130 145

155 123 125 145 148

Se pide:

a) Construir una tabla de distribución de frecuencia.

b) Interprete Ud. los siguientes resultados f1; h2(%); F2 y H3(%)

c) Construir el histograma y el polígono de frecuencia.

d) Hallar la media, la mediana y la moda e interprete Ud. dichos resultados.

e) Calcular Q1; D7 y P75

f) Hallar el coeficiente de variación.

g) Hallar la asimetría e interprete Ud. dicho resultado.

h) Hallar la curtosis e interprete Ud. dicho resultado.

90

Page 91: Curso Estadistica Aplicada a La Investigacion

Solución:

I. Construir una tabla de distribución de frecuencia.

1. V.C.C.

2. R = V.max – V.min.

R = 155 – 100

R = 55

3. K = 1 + 3,32 log10

K = 4,32

K = 4

4. C = R/K

C = 55/4 = 13,75

C = 14

5. E = K C - R

E = 4 (14) – 55

E = 1

Entonces K y C es correcto

6. E = 1

91

Page 92: Curso Estadistica Aplicada a La Investigacion

I. Construcción del Cuadro Estadístico

CUADRO Nº 01Distribución de Frecuencia del Tallado de 10 alumnos del C.E.P. “San

José” en el distrito de Chaclacayo.(cms.)

II. Interpretación de los Datos

a) f3 = 2 (Dos alumnos tienen sus estaturas entre 128 cm. y menor que 142.cms.)

b) h2(%)=30 (El 30% de los alumnos tienen su estaturas entre 114 cms. y menor que 128 cms.)

c)F3 = 6 (Existen seis alumnos que tienen como estatura entre 100 cms. y menor que 142 cms.)

d) H2(%)=40 (El 40% de los alumnos tienen sus estaturas entre 100 cms. y menor que 128 cms.)

92

Page 93: Curso Estadistica Aplicada a La Investigacion

Gráfico Nº 01

III. Histograma y Polígono de Frecuencia.

IV. Calcular la Media, la Mediana y la Moda:

93

Alumno del C.E.P. “San José” distribuidos por estaturas en el Distrito de Chaclacayo

Page 94: Curso Estadistica Aplicada a La Investigacion

LA MEDIANA

Li = Límite inferior del intervalo mediano.

n = Número total de observaciones

T = Frecuencia acumulada hasta el intervalo anterior del intervalo mediano.

fme = Frecuencia del intervalo mediano.

C = Amplitud del intervalo mediano.

Procedimiento para encontrar la mediana en los datos agrupados:

Reemplazando valores de la fórmula obtendremos:

El 50% de los alumnos tienen como estatura superiores a 135 cms.

94

Page 95: Curso Estadistica Aplicada a La Investigacion

LA MODA

(Simplemente es el valor más frecuente de una variable)

Procedimiento para calcular la Moda de datos agrupados:

Es la mayor frecuencia absoluta o repetición (Es donde se va a encontrar el intervalo modal, que es el intervalo que corresponde a la mayor frecuencia)

= Es la diferencia entre la frecuencia del intervalo modal y la frecuencia anterior (Tomado en valor absoluto)

= Es la diferencia entre la frecuencia del intervalo modal y la frecuencia siguiente (Tomado en valor absoluto)

C = Amplitud del intervalo modal.

La moda indica que la estatura más frecuente de los alumnos es 146,67 cms.

95

Page 96: Curso Estadistica Aplicada a La Investigacion

Interpretación entre la media, la mediana y la moda

Lo que indica que existe asimetría. (Entonces hay deformación de la curva)

V. Calcular Q1, D7 y P75

Fórmula para el cálculo de los Cuartiles

n = número total de observaciones

i = 1, 2, 3

T = Suma de todas las frecuencias anteriores a la clase cuartílica.

FQi= Es la frecuencia de la clase cuartílica.

C = Amplitud del intervalo cuartílico.

96

Page 97: Curso Estadistica Aplicada a La Investigacion

Procedimiento para hallar Q1

a)

b) = 114

c) T = 1

d) = 3

e) C = 14

Q1 = 121, 00

Sólo el 75% de los estudiantes tienen estaturas superiores a 121 cms.

Fórmula para hallar las Decilas

Li = Límite superior del intervalo de la clase decilica.

n = Número total de observaciones.

T = Suma de todas las frecuencias anteriores al intervalo de la clase decilica.

f Di = Frecuencia del intervalo de la clase decilica.

C = Amplitud del intervalo de la clase decilica.

i = 1, 2, 3, ...,9.

Procedimiento:

97

Page 98: Curso Estadistica Aplicada a La Investigacion

Sólo el 30% de los estudiantes tienen estaturas superiores a 145,5 cm.

Fórmula para hallar los Percentiles

= Límite inferior del intervalo de clase de la clase percentilica.

n = Número total de observaciones.

T = Suma de todas las frecuencias anteriores al intervalo de la clase percentílica.

f Pi = Frecuencia del intervalo de la clase percentilica.

C = Amplitud del intervalo de la clase percentílica.

i = 1, 2, ...98, 99.

98

Page 99: Curso Estadistica Aplicada a La Investigacion

Sólo el 25% de las estudiantes tienen estaturas superiores a 147,25 cms.

VI. COEFICIENTE DE VARIACIÓN

Fórmula de la Variancia para una muestra

99

Page 100: Curso Estadistica Aplicada a La Investigacion

Para el ejemplo:

La Desviación típica

Por ejemplo:

El coeficiente de variación

100

Varianza de la muestra

La desviación típica de la muestra

Page 101: Curso Estadistica Aplicada a La Investigacion

VII. HALLA LA ASIMETRÍA

Reemplazando valores en Ec(1)

Entonces existe una asimetría negativa

NOTA :

1. Si la distribución en simétrica, entonces As = 0. en este caso, coinciden los tres promedios.

101

Page 102: Curso Estadistica Aplicada a La Investigacion

2. Si la distribución es asimétrica positiva o alargada (sesguda) a ha desecha, As>0, en este caso, el orden de los promedios es:

3. Si la distribución es asimétrica negativa o alargada (sesgada) a la izquierda, As < 0 en este caso, el orden de los promedios es:

VIII. CALCULAR LA CURTOSIS

102

Page 103: Curso Estadistica Aplicada a La Investigacion

103

Page 104: Curso Estadistica Aplicada a La Investigacion

Reemplazando en la Ec. (1) obtendremos:

104

Este valor me indico donde se encuentra la clase percentílica

Page 105: Curso Estadistica Aplicada a La Investigacion

Interpretación:

Nos indica que existe deformación en la curva porque K>0,263. Luego es Leptocúrtica.

105