Curso Estadística 2015 Ait

download Curso Estadística 2015 Ait

of 73

description

estadistica

Transcript of Curso Estadística 2015 Ait

ESTADSTICA GENERAL I

ESTADSTICA I FACAP UNCP - 2015 ING. CLAUDIO LIMAYMANTA SULCA

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERFACULTAD DE CIENCIAS APLICADAS

FACILITADOR:

Ing. Claudio LIMAYMANTA SULCA

TARMA - 2014ESTADSTICA I INTRODUCCIN

Hoy en da vemos alguna variedad de la Estadstica, as como la probabilidad de ganar una lotera, proporcin de electores que apoyan a un candidato, ndice de precios al consumidor, ndice de nacimiento y mortandad, rendimiento universitario, etc. Estas estadsticas nos ayudan a resolver una gran variedad de situaciones, en la toma de decisiones.

Dependemos de la Estadstica por que es una de las formas ms convenientes de expresar hechos en trminos de nmeros.

Esta separata aborda los temas en forma tal como casi nos han expuesto en libros de estadstica, sobre todo a su presentacin clara y sencilla, usando las tcnicas de mapas conceptuales, pretendindose con ello que sean captados fcilmente por el estudiante.

Espero que esta separata sea de mucha utilidad para el estudiante, justificando de esta manera el logro en su formacin profesional.

Recomendaciones:1. Frente a una realidad de aprendizaje significativo, el rol que toca cumplir a los alumnos y docentes deben ser de cambio constante, crtico, reflexivo y creativo.2. Este documento permite al alumno aprender en forma analtica, realizando acciones que logren en l su propio enriquecimiento acadmico.3. Al final de cada tema tratado esta incluido los problemas resueltos y problemas propuestos, los cuales debes de desarrollarlo, el cual permitir el grado de avance y rendimiento en tu curso.4. Es recomendable el uso permanente de otras bibliografas los cuales enriquecern tu saber cientfico.

I CAPTULOLa estadstica es el rea de las matemticas que permite recoger, organizar, resumir, presentar y analizar datos sobre fenmenos y procesos. Pero, el trabajo del especialista en estadstica no consiste slo en reunir y tabular los datos, sino sobre todo en el proceso de la interpretacin de esa informacin para obtener conclusiones y tomar decisiones basadas en esos anlisis. Su aplicacin es muy amplia, por ejemplo, en la interpretacin de fenmenos fsicos, meteorolgicos, biolgicos, de las ciencias sociales, ciencias administrativas y de las organizaciones. El avance de la computacin numrica y el desarrollo de la teora de la probabilidad han aumentado el alcance de las aplicaciones de la estadstica.Competencia

Utiliza los conceptos de la estadstica descriptiva, as como elabora, describe, grafica e interpreta las distribuciones de frecuencias tanto para datos agrupados y para datos no agrupados en intervalos de clase, de esta manera el alumno reconoce el valor de la estadstica como herramienta de investigacin para las diversas disciplinas de la ciencia y la tecnologa.

CONTENIDOS CONCEPTUALES

Estadstica.

Poblacin y muestra. Trminos usuales en la estadstica.

Escalas de medicin.

Distribuciones de frecuencias.

Grficas estadsticas.

ESTADSTICA.- Es una ciencia que proporciona un conjunto de mtodos que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con respecto a una caracterstica, materia del estudio o investigacin. En primera instancia se encarga de obtener informacin, describirla y luego usa esta informacin a fin de predecir algo respecto a la fuente de informacin (Muestra o Poblacin).

I. DIVISIN DE LA ESTADSTICAEl campo de la estadstica generalmente est dividido en dos grandes reas: Estadstica Descriptiva y Estadstica Inferencial.

a) ESTADSTICA DESCRIPTIVA.- Es el conjunto de mtodos que implican la recoleccin, presentacin y caracterizacin de un conjunto de datos a fin de describir en forma apropiada las diversas caractersticas de stas. Es decir, un estudio estadstico se considera descriptivo cuando solo se analiza y describe los datos.

Ejemplo 1.

Un Jefe de Personal, desea conocer las aptitudes de 5 secretarias que trabajan en una determinada rea de la planta de procesamiento de una Industria Azucarera. Se aplica una prueba de aptitudes a los 5 secretarias y las calificaciones son: 85, 90, 93, 82, y 95 puntos. Suponiendo que la medida estadstica que aplica el Jefe de personal es la Aptitud Promedio o Media aritmtica, entonces la calificacin promedio es:

= 85 + 90 + 93 + 82 + 95 = 445/5 = 89 puntos

5

El resultado se limita a los datos obtenidos en este caso particular y no implica ninguna generalizacin acerca de las aptitudes de las secretarias de otras reas de la misma planta industrial.b) ESTADSTICA INFERENCIAL.- La Inferencia Estadstica es el conjunto de mtodos o tcnicas que posibilitan la generalizacin o toma de las decisiones en base a una informacin parcial obtenida mediante tcnicas descriptivas. Es decir, un estudio estadstico, se considera inferencial cuando se pretende inferir o predecir conclusiones que ataen a toda la fuente de informacin de donde provienen los datos. Ahora bien, esta prediccin se hace con un cierto grado de confianza; este grado de confianza se mide por la probabilidad. Por tanto el clculo de probabilidades, piedra angular de la inferencia estadstica est como puente entre las dos partes de la Estadstica.

Aunque la Estadstica descriptiva es importante para caracterizar y presentar informacin de los datos, sin embargo, el desarrollo de la inferencia estadstica es la que ha conducido a la gran expansin en la aplicacin de los mtodos estadsticos.

Del ejemplo 1.

El Jefe de Personal decide usar la aptitud promedio de las 5 secretarias para estimar la aptitud promedio de todas las secretarias de la industria azucarera. El proceso de estimar esta aptitud promedio global ser un problema de inferencia estadstica.

Ejemplo 2.

Cuatro fluorescentes de marca A, dejaron de funcionar despus de 1100, 980, 900, y 1020 horas de uso continuo. Cinco fluorescentes de marca B dejaron de funcionar despus de 960, 1050, 1065, 845 y 980 horas de uso contino. Se llega a las siguientes conclusiones:

a) La duracin promedio de los 4 fluorescentes marca A es de 1000 hs. Mientras que la duracin promedio de las fluorescentes marcas B es de 980 hs.

b) La duracin promedio de todas las fluorescentes marcas A es mayor que la de todas los fluorescentes marca B.

c) La diferencia entre los dos promedios es de 20 horas.

d) La diferencia entre los dos promedios es demasiado pequeo para llegar a la conclusin de que los fluorescentes marca A son mejores que los fluorescentes marca B.

e) Si se selecciona y prueba otro fluorescente marca A, probablemente durar ms que el promedio de los fluorescentes marca B.

f) Ud. Decide comprar fluorescentes marca A en vez de fluorescentes marca B.

Cual de las conclusiones provienen de la estadstica descriptiva y cual de la inferencia estadstica?Respuestas:

a) Estadstica descriptiva.

b) Estadstica inferencial.

c) Estadstica descriptiva.

d) Estadstica inferencial.

e) Estadstica inferencial.

f) Estadstica inferencial.

ESTADSTICA INFERENCIAL

ESTADSTICA DESCRIPTIVAII. POBLACIN Y MUESTRA

POBLACIN.- Es un conjunto de elementos bien definidos (personas, objetos, datos) que contienen una o ms caractersticas observables de naturaleza cuantitativa o cualitativa que se pueden medir entre ellos, por otra parte, la poblacin consiste de un conjunto de datos estadsticos que se agrupan de acuerdo con la formulacin de una investigacin estadstica.

Ejemplo:

Las edades de los alumnos del sistema universitario peruano.

Los alumnos de educacin secundaria del Per.

Poblacin Objeto.- Es el conjunto de elementos materia de estudio.

Poblacin Objetivo.- Las diferentes medidas de la caracterstica que nos interesa de la poblacin objeto.

Ejemplo:

Al estudiar el rendimiento acadmico de los alumnos en el sistema universitario; La poblacin objeto, esta constituida por los alumnos del sistema universitario; y la poblacin objetivo, por las notas que miden el rendimiento acadmico.

POBLACIN FINITA (n).- Es aquella que tiene un nmero limitado de componentes o elementos. Ejm. Las edades de los alumnos del III semestre de Administracin de Empresas de la UNCP.POBLACIN INFINITA (N).- Es aquella que no tiene lmites o cotas, es decir un nmero ilimitado de elementos. Ejm. La calidad de todas las unidades producidas mediante un proceso manufacturero.

POBLACIN ACCESIBLE DESCONOCIDA: Conjunto de personas, elementos cosas o valores que cumplen con las caractersticas o criterios preestablecidos y que pueden ser accesibles al investigador para el estudio, pero su nmero no es conocido.Ejemplo: Todos los docentes de las Universidades de la regin Junn susceptibles a ser evaluados para su ascenso durante el periodo de estudio.

POBLACIN ACCESIBLE CONOCIDA: Conjunto de personas, elementos cosas o valores que cumplen con las caractersticas o criterios preestablecidos y que pueden ser accesibles al investigador para el estudio, cuando el nmero es conocido.Ejemplo: Los 5784 docentes de las universidades A, B, C.., X de la Regin Lima que fueron evaluados en los ltimos concursos que ingresaron al sistema universitario.

A continuacin se dan algunos ejemplos:Universo o PoblacinElementoAlgunas Caractersticas

Estudiantes matriculados en las Instituciones Superiores A y B durante el ao acadmico 2009Estudiantes MatriculadosEdad, sexo, grado de estudio, modalidad y turno

Egresados de maestra de la Universidad A durante el periodo 2000 2005EgresadosEdad, sexo, mencin, promocin, tiempo de permanencia, graduacin.

Docentes nombrados en las Universidades durante el periodo X.Docentes nombradosEdad, sexo, tiempo de servicio, aos de aportacin, nivel

Pacientes con fiebre tifoidea del Hospital X susceptibles de ser estudiados en el periodo Y.Pacientes con fiebre tifoideaEdad, sexo, ocupacin, raza, estado de nutricin, estado socioeconmico.

PARMETRO.- Es una medida resumen que describe las caractersticas medibles de una poblacin y naturalmente para determinar su valor, es necesario utilizar la informacin de toda la poblacin. (Media poblacional, Varianza poblacional, Desviacin estndar poblacional)Ejemplo. La edad promedio de los universitarios del primer semestre de las universidades del Per.

Los parmetros ms usados son:

La media poblacional. ( = ( Xi / n

Proporcin poblacional ( = dato parcial/ dato total

Desviacin estndar poblacional = (2

Tamao de la poblacin finita = NMUESTRA.- Es una parte o un subconjunto representativo de la poblacin, y al proceso de obtener la muestra se le denomina Muestreo.

La seleccin y el estudio de una muestra, tiene por objeto la extraccin de conclusiones que sean vlidas para la poblacin del cual se obtuvo dicha muestra. En otras palabras nuestro objeto es conocer la poblacin, para lo cual se extrae una muestra de sta.

Los Estadgrafos ms usados son:

La media de la muestra = ( Xi / n Varianza de la muestra = s2 Desviacin estndar muestra = s

Tamao de la muestra = n Proporcin de la muestra = pEjemplo.

Para determinar la proporcin de partes defectuosas producidas en un cierto proceso de fabricacin, los tcnicos de control de calidad examinan un lote de unidades producidas para determinar el nmero de unidades defectuosas contenidas en l. (Generalmente un lote de este tipo, el cual constituye una muestra, se toma en intervalos regulares de tiempo). As en un lote de 300 unidades producidas en el proceso, el ingeniero encuentra 45 defectuosas, entonces la proporcin de defectuosas en la muestra ser:

45/300 = 0,15 (15 %)

La proporcin de la Poblacin la cual es un parmetro que se desconoce, es la proporcin de todas las unidades defectuosas producidas en el proceso.

La Proporcin de la muestra, la cual es la proporcin de las unidades defectuosas contenida en la muestra.

ESTADGRAFO.- Es una medida resumen que describe una caracterstica de la muestra.

Ejemplo.

Suponga que los ingresantes al primer ao de su universidad constan de 3000 estudiantes, todos los cuales han dado un examen nico de seleccin que se aplic a todos los estudiantes que han ingresado al primer ao de universidad en el pas. Explique las circunstancias bajo las cuales las calificaciones recibidas por los estudiantes ingresantes al primer ao de su universidad puede considerarse como. A) Una muestra B) una poblacin.

Solucin.

A) Puede haber ms de una circunstancia. As, si se quiere conocer la calificacin promedio de todos los ingresantes a las universidades del pas, la poblacin estara formada por las calificaciones de todos los ingresantes a primer ao de universidad en el pas, entonces las calificaciones de los ingresantes a su universidad sera una muestra.

B) Tambin puede haber varias circunstancias. As, si se quiere conocer la calificacin promedio de todos los ingresantes a su universidad. La poblacin estara compuesta por las calificaciones de todos los ingresantes a su universidad.

III. TRMINOS USUALES EN LA ESTADSTICA

TIPOS DE DATOS

DATO ESTADSTICO.- Es el resultado de medir una caracterstica observable de una unidad elemental.

Ejemplo. Edad de 5 docentes.

DATOS: Son los valores recopilados como resultado de las observaciones de una caracterstica o variable, llamados tambin series estadsticas.

Como hay dos tipos de variables (Cualitativas y Cuantitativas), diremos tambin que hay dos tipos de datos: Datos Cualitativos y Datos Cuantitativos. Los datos cuantitativos se pueden considerar tambin como Datos Discretos y Datos Continuos.

VARIABLES ESTADSTICASEs una caracterstica general de una muestra o de la poblacin que se va a investigar y que puede tomar diferentes valores, se clasifica de la siguiente manera:

VARIABLE CUALITATIVA.- Es cuando expresa una caracterstica cualitativa cuyos valores son cualidades que presenta la poblacin, se expresan en escalas nominal u ordinal, con estos valores no se pueden realizar operaciones aritmticas.

Ejemplo.

Variable

Religin: Mormon, catlico, protestante, budista, etc.

Profesin: Profesor, Ingeniero, psiclogo, abogado, fsico, economista, etc.

A. Variable Cualitativa nominal.- Aquella que establece la distincin de los elementos en las categoras sin implicar orden entre ellas.

Ejemplo: Clasificar a un grupo de individuos; por tamao, alto, bajo. Por sexo; Masculino, femenino; Por estado civil, soltero, casado, viudo, divorciado.B. Variable cualitativa Ordinal.- Aquella que agrupa a los objetos, individuos, en categoras ordenadas, para establecer relaciones comparativas, que son susceptibles de ordenacin pero no de medicin cuantitativas.

Ejemplo:

Clasificar a un grupo de alumnos por su hbito de estudiar

Alumno estudioso

Alumno poco estudioso

Alumno moderado

Clasificar a un grupo de personas por su hbito de jugar ftbol.

Jugador bueno

Jugador malo

Jugador regular

Jugador excelente

Clasificar a un grupo de individuos por su grado de instruccin.

Primaria, secundaria, superior VARIABLE CUANTITATIVA.- Es aquella caracterstica cuantitativa que se expresa numricamente, estas surgen cuando se puede establecer cuanto o en que cantidad se posee una determinada caracterstica.

Ejemplo: Ingreso por familia, nmero de accidentes de trnsito, longitud, tiempo, etc. Se dividen en:a) Variable Cuantitativa Discreta.- Es aquella variable cuantitativa que toma solo valores enteros positivos, surgen solo por el procedimiento de conteo.

Ejemplo: Nmero de alumnos de un centro educativo, Nmero de docentes de la UNCP, Nmero de habitantes por distrito, Nmero de hijos de una familia.b) Variable Cuantitativa Continua.- Es aquella variable que puede tomar cualquier valor comprendido entre dos valores extremos (cualquier valor dentro de un intervalo). Ejemplo: Talla, peso, longitud, volumen, salario, presin arterial.Unidad Estadstica.- Es el elemento u objeto indivisible de la poblacin que ser analizado.

Ejemplo: Si se quiere estudiar el tipo de arroz que consume Tarma, la unidad estadstica sern las familias.

EJERCICIOS PARA RESOLVER POR EL ESTUDIANTE

1. Clasifique las siguientes caractersticas, en variables cualitativas y cuantitativas continuas o discretas:

a) Consumo de corriente (Kw.) mensual en un ao.

b) El nmero de panes producidos en una panadera en un mes.

c) Estado civil, opinin pblica, lugar de nacimiento de las personas que viven en Tarma.

d) Marca y pas de procedencia de los automviles vendidos durante el ao en el Per.

2. En cada aparato que produce una empresa de equipos elctricos se incluye una pliza de garanta para el cliente. Adems de validar la garanta y proporcionar a la compaa el nombre y domicilio del cliente, la pliza pide otra informacin complementaria que se emplea en los estudios de mercado. Para cada uno de los blancos numerados de la pliza, determine las caractersticas ms probables de las categoras que utilizar la compaa para registrar la informacin. En particular:

a) Sern cuantitativas o cualitativas?b) Continuas o discretas?

3.- Cules de los siguientes enunciados representa el esquema ms exacto para clasificar datos? a) Mtodos cuantitativos.

b) Mtodos cualitativos.

c) Una combinacin de mtodos cuantitativos y cualitativos.

d) El esquema se determina solo mediante la informacin concreta sobre la situacin.

4.- Para cada uno de los siguientes enunciados, identifique la unidad estadstica:

a) El alcalde de una ciudad desea estimar el porcentaje de votantes en su distrito que estar a favor de la aprobacin de una ley municipal.

b) Una cadena de supermercados desea conocer la opinin de sus empleados acerca de un plan de seguro mdico patrocinado por la compaa.

c) Un ejecutivo de mercadotecnia de una compaa desea hacer una encuesta entre los compradores para determinar su actitud hacia una nueva lnea de productos.

5.- En los siguientes enunciados identifique usted: La poblacin, la muestra, la variable, el tipo de variable, la unidad estadstica y el parmetro.

a) Se va ha realizar un estudios de la cantidad de azcar vendida por semana, en un supermercado de cierto sector de Tarma, para el ao 2007, para lo cual se utilizar el promedio de ventas de ese ao, los registros se hacen en kg/semana.

b) Una firma industrial, comprometida en la produccin de aceros, produce tornillos para los cuales existen estrechos mrgenes de tolerancia.

IV. APLICACIONES DE LA ESTADSTICALa Estadstica proporciona un conjunto de mtodos aplicables en todas las reas cientficas donde se acumulan, se analizan y se interpretan datos. Resulta pues muy difcil nombrar reas donde no se aplica. Citaremos aqu brevemente algunos campos en los cuales los mtodos estadsticos juegan un papel principal, como: Salud y Medicina; biologa, economa, administracin, contabilidad, ingeniera, etc. y en la Investigacin Cientfica.

1. SALUD Y MEDICINA: Las estadsticas de salud incluyen toda informacin numrica relacionada de modo directo con los problemas de salud, concebidos en una escala social. Podemos citar muchos ejemplos que muestran lo necesario que son las estadsticas de salud con los mtodos para su anlisis e interpretacin para fomentar y desarrollar una poltica sanitaria adecuada; de acuerdo a las siguientes interrogantes:

Cul es la causa ms importante de muerte en esta regin; el cncer, la tuberculosis, los accidentes de trnsito, etc?

A que edad resulta ms alta la mortalidad y por cul enfermedad? En que zona, un determinado tipo de enfermedad presenta una incidencia mucho ms elevada que la incidencia promedio? Qu condiciones prevalecen en esa zona? existen algunas reas especficas o algunas pocas en que se registran preferentemente brotes de alguna enfermedad?

Mencionaremos algunos usos principales de las estadsticas de salud:

Describir el nivel de salud de una comunidad.

Diagnosticar las enfermedades de una comunidad.

Encontrar soluciones a los problemas de salud.

Determinar prioridad para los programas de salud, etc.

2. ECONOMA: La estadstica constituye uno de los pilares de la aplicacin de la teora econmica. Se utiliza en la descripcin de fenmenos econmicos, en la estimacin de las relaciones econmicas, en la verificacin, prediccin y previsin de las variables econmicas.

3. BIOLOGA: La estadstica se puede utilizar para estimar el tamao real de la poblacin de una especie animal en particular, la propagacin de bacterias, en mejorar la raza de los animales.4. LA INVESTIGACIN CIENTFICA:El desarrollo del conocimiento en la ciencia, se caracteriza porque su ejecucin se lleva a cabo segn un mtodo: El Mtodo Cientfico. La aplicacin de este mtodo es lo que diferencia al conocimiento cientfico del conocimiento ordinario.

Las etapas del Mtodo Cientfico, segn el matemtico filsofo Bertrand Russel, son tres:

1. La Observacin del Fenmeno que se estudia.

2. La formulacin de una o varias hiptesis mediante la cual puedan explicarse los hechos observados.

3. La verificacin de las hiptesis mediante nuevas observaciones.

Esta divisin en etapas, sugiere que el mtodo cientfico este definido por un proceso de observacin, de racionalizacin y de experimentacin. La estadstica desempea un papel importante en cada una de las tres etapas de que consta el mtodo cientfico de investigacin.

En la primera etapa interviene, mediante la presentacin, en forma sinptica y resumida los resultados de la observacin, facilitando su anlisis e interpretacin. En esta primera etapa, la estadstica cumple una funcin esencialmente descriptiva. En la segunda etapa; interviene, proporcionando el lenguaje adecuado para la formulacin rigurosa de la hiptesis de investigacin.

En la tercera etapa; la utilizacin del mtodo estadstico es decisiva, no solo en cuanto a la planificacin y adecuado diseo del experimento, sino tambin en la seleccin del procedimiento de anlisis y en la interpretacin de los resultados que se obtenga al aplicar dicho procedimiento.

El Papel de la Estadstica en la Investigacin, es funcionar como una herramienta en el diseo de investigacin, en el anlisis de datos y en la extraccin de conclusiones a partir de ellos.

Otras aplicaciones de la estadstica: En Control estadstico de calidad, en poltica para orientar la estrategia electoral de un partido poltico, en educacin ayuda a interpretar un test de inteligencia; en los negocios, ayuda a juzgar las ventas respecto a la demanda potencial de un producto mediante un estudio de mercado; en la Industria, ayuda a decidir si un proceso industrial funciona o no adecuadamente de acuerdo con las especificaciones.4.1. EL MTODO ESTADSTICO

El Mtodo Cientfico de Investigacin se basa en dos tipos de razonamiento, el Inductivo y el Deductivo; el Mtodo Inductivo se basa en sacar conclusiones de las observaciones Particulares de ciertos fenmenos e intenta deducir unas reglas generales aplicables a todos ellos. El Mtodo Deductivo procede de lo general a lo particular y utiliza especialmente el razonamiento matemtico, se establecen hiptesis generales que caracterizan un problema y se deducen ciertas propiedades particulares por razonamientos lgicos.La Investigacin Estadstica se desarrolla utilizando el ciclo deductivo inductivo en las siguientes cuatro etapas:

a) Planteamiento del problema

El primer paso de la investigacin es definir claramente los objetivos del estudio y relacionar este objetivo con los valores numricos de las variables observables. La investigacin cientfica es una actividad con propsito (Finalidad, meta) y como tal para quedar enteramente caracterizado debe dar respuesta a las siguientes interrogantes fundamentales:

1. En qu consiste el problema, objeto de la investigacin? O bien Qu se quiere conocer?2. Porqu o para qu se plantea una investigacin?

3. Sobre quin recae la investigacin?

4. Cmo se va a investigar?

5. Quin va a realizar la investigacin?

6. Dnde se va a realizar?

7. Cundo se va a realizar?

Solo cuando se esta en condiciones de dar respuestas a todos y cada uno de estas interrogantes, se puede redactar el Plan de un trabajo de investigacin, que es el documento bsico.Los objetivos surgen al contestar la pregunta acerca de Para que se va a realizar la investigacin? Y estn directamente vinculados a la justificacin e importancia de la investigacin proyectada.

La Hiptesis es una conjetura (o un supuesto, o proposicin) acerca de determinados hechos que va ms all (trasciende) de los datos (evidencia emprica) que intenta explicar.

Cuando se ha considerado un problema cientfico y se ha logrado formular una hiptesis en relacin al mismo, la labor investigativa posee un grado de lucidez y de claridad considerablemente mayor. Es precisamente esta claridad la que permite definir los objetivos con mucha mayor precisin y orientar la realizacin de los experimentos o la prctica de las observaciones con un alto grado de especificidad.

b) Recoleccin de la informacinLa recoleccin correcta de los datos es de extrema importancia para el investigador, que tiene que ser realizada o vigilada por ste; esta etapa consiste en determinar los mtodos de recoleccin adecuado, preparar los instrumentos de recoleccin, prueba del mtodo y de los instrumentos de recoleccin seleccionados y realizar la recoleccin de los datos.

c) Organizacin y clasificacin de los datosAqu se debe de hacer un anlisis de consistencia y ajuste de los datos. Se trata de asegurar la validez y confiabilidad de los datos recopilados. Luego se debe clasificar y tabular los datos y finalmente presentarlos en cuadros estadsticos y grficas.d) Anlisis e interpretacin de los resultadosEn esta etapa se calculan indicadores y medidas resumen que describen al conjunto de datos; tambin se establecen relaciones entre variables de modelos estadsticos que nos permitan aceptar o rechazar los modelos.

V. MUESTREOLa muestra es el subconjunto de la poblacin. Para que un sector de la poblacin sea considerado como muestra, se requiere que todos los elementos de ella pertenezcan a la poblacin. No sern muestras cuando algunos sujetos de la muestra no pertenecen a la poblacin.

La seleccin de la muestra esta ntimamente relacionado con la estimacin que se har posteriormente, a partir de ella, de los parmetros poblacionales, razn por la cual en el presente capitulo abordaremos los conceptos bsicos que se deben tener en cuenta para la seleccin de la muestra y las estimaciones poblacionales.

En ocasiones, el muestreo es una necesidad, como cuando estamos en presencia de poblaciones virtuales o infinitas, o poblaciones finitas grandes. Tambin es obligado en situaciones como las que se presentan en el Control de Calidad de productos farmacuticos, ingreso de turistas a un pas, cantidad de dinero prestado por un banco, etc. En otras ocasiones muestrear constituye una alternativa frente al estudio de todo el universo; la alternativa de muestrear es favorable porque ello ahorra tiempo, recursos y esfuerzo.

A continuacin se ver algunos usos del muestreo en diversos campos:1. Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos midan la opinin pblica y el apoyo en las elecciones.

2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan para determinar la eficiencia de una tcnica o programa de enseanza.

3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la calidad.

4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban la eficacia de una tcnica o de un frmaco nuevo.

5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la produccin los efectos de un fertilizante nuevo.

6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad nacional.

5.1. Desventaja del empleo de Muestras

Una de las principales desventajas, es que el empleo de muestras introduce el llamado error de muestreo, que tiene su origen en la variabilidad de los elementos que componen la poblacin, muestras del mismo tamao arrojan resultados diferentes.

Supongamos por ejemplo que tenemos una poblacin formada por cuatro personas, cuyas estaturas en centmetros son 158, 160, 166 y 172, respectivamente, la talla promedio de las personas de esta poblacin es de:

Si no se conociera dicho promedio poblacional, podramos estimar esta estatura promedio como una muestra, por ejemplo, solo dos individuos. Los resultados serian como se muestra en el cuadro siguiente:PersonasValores MuestralesEstatura Promedio

1, 2158, 160

1, 3158, 166

1, 4158, 172

2, 3160, 166

2, 4160, 172

3, 4166, 172

Como vemos, a cada muestra le corresponde un valor promedio diferente y diferente a su vez del verdadero promedio de la poblacin. Esta diferencia entre el valor promedio que arroja la muestra y el valor promedio de la poblacin, se llama Error de Muestreo.El error de muestreo, desde luego, solo puede estimarse a condicin de que la muestra sea adecuadamente seleccionada, y adems, puede disminuirse cuando se desee, aumentando el tamao de la muestra. Este hecho hace que el muestreo sea un arma muy poderosa y por consiguiente, una alternativa a valorar particularmente cuando se trata de poblaciones grandes cuyo estudio exhaustivo es difcil y costoso.5.2. Condiciones de una buena muestra

Aunque cualquier parte o subconjunto de una poblacin constituye una muestra, parece intuitivamente evidente que no cualquier muestra resulta til para hacer inferencias adecuadas en relacin con la poblacin. Las muestras deben cumplir determinadas condiciones que son dos:

a) La relativa al Tamao Muestral

b) La Calidad Muestral

De lo que se trata a menudo es pues, de tener una muestra suficientemente grande, pero no mayor de lo necesario. Esto depende generalmente de la frecuencia con que el fenmeno o caracterstica en estudio se encuentre en la poblacin y de la variabilidad de sta.

Sin embargo, el tamao de la muestra por si solo no puede garantizar que la muestra sea til o adecuado. Por ejemplo que ocurrira si para estudiar la presencia del clera en la poblacin de la ciudad de Lima, tomaramos una muestra del cercado de Lima. Esta muestra, an cuando fuese tan grande que cubriera toda la poblacin del cercado, no sera una muestra representativa de la poblacin. Entonces la condicin de calidad solo se garantiza con muestras representativas, que son las que reproducen las caractersticas esenciales que posee la poblacin que se desea estudiar, y con muestras exentas de errores sistemticos, que son originados al no tener en cuenta determinados principios de seleccin.

Por qu se sacan Muestras?

Son muchas las razones por las cuales no se trabaja con toda la poblacin, sino con una parte representativa de ella, pero lo ms importante a nuestro entender son los siguientes:

Mayor exactitud: Al reducir el volumen del trabajo, se puede capacitar a un nmero de personal que realizar un mejor trabajo. Mejor supervisin y procesamiento de datos.

Menor Costo: Los menores costos se derivan de un menor esfuerzo para la obtencin de datos, pues se trabaja con un pequeo sector de la poblacin. Si se realiza un censo completo, los esfuerzos y los costos seran mayores. Al trabaja con una muestra implica reducir los costos y hacer que la investigacin sea factible Ms posibilidad de Aplicacin: Las tcnicas censales requieren de la participacin de personal altamente capacitado, de equipos especializados, de procesamiento de informacin, etc. Por eso las tcnicas de muestreo tienen ms posibilidades de aplicacin porque flexibilizan el trabajo, al permitir trabajar con personal no necesariamente con altas calificaciones ni especializacin. Mayor Rapidez: Al trabajar con pequeas cantidades, los datos pueden obtenerse ms rpidamente. Cuando se requiere la informacin con urgencia esta ventaja es inapreciable. Tiempo: El trabajar con una muestra nos permite un uso adecuado del tiempo de tal manera que la investigacin sea factible y asimismo tenga vigencia en el tiempo. Por ejemplo: si trabajamos con toda la poblacin estudiantil del III y IV semestre de estudios universitarios del Per, para determinar su nivel de rendimiento acadmico, cabra la posibilidad de que al finalizar el semestre acadmico no se haya terminado de evaluar a todos los miembros de la poblacin, quedando la investigacin truncada, ya que estos estudiantes ya han cambiado de semestre o estn en otras universidades.Cmo se determinan las muestras?

Las muestras pueden ser extradas de diferentes formas, dependiendo estas de las caractersticas de la poblacin, de los objetivos y de la naturaleza del trabajo de investigacin, as como los recursos disponibles. Las muestras pueden ser seleccionadas con o sin reemplazo y en forma probabilstica y no probabilstica.

Se denomina Muestras Probabilsticas a las que se obtienen por procedimientos del azar o de la probabilidad. Para que el hecho sea considerado del azar, se requiere que cumpla:

1. Igualdad de oportunidades.

2. Independencia en la ocurrencia de los eventos

La igualdad de oportunidades significa que todos los sujetos tienen la misma oportunidad que los dems y la independencia significa que la ocurrencia de un evento no anticipa la ocurrencia del siguiente.

Lo contrario a estos casos es la intencin o el sesgo. Azar e intencin son, en consecuencia, dos extremos de un mismo continuo que nos interesa por igual en el caso de la investigacin de la conducta. As, cuando los eventos suceden por el azar, se dice que el muestreo es probabilstico. De lo contrario, si los eventos se producen por la intencin del investigador el muestreo es intencionado o llamado no probabilstico.

MUESTRA PROBABILSTICA: Son aquellas en que todos los elementos de la poblacin tienen una posibilidad (una probabilidad conocida) de ser incluida en la muestra. Naturalmente no es necesario que todos tengan la misma posibilidad, basta que tengan alguna posibilidad.

MUESTRA NO PROBABILISTICA: Llamada tambin, muestras de conveniencias o de juicio, se basan en el conocimiento y la opinin personal para identificar los elementos de la poblacin que van a incluirse en la muestra. Una muestra seleccionada a juicio se basa en el conocimiento de la poblacin por parte de una persona que generalmente es un experto en la materia.

5.3. TIPOS DE MUESTREO PROBABILSTICO5.3.1. SORTEO: Este es el muestreo probabilstico ms conocido. Para realizar un muestreo es necesario que todos los sujetos de la poblacin estn identificados por un cdigo y cuando se ejecuta el sorteo, todos los sujetos deben tener la misma oportunidad de ser sorteados.5.3.2. MUESTREO ALEATORIO SIMPLE: Para realizar muestreos de este tipo es necesario disponer de una tabla de nmeros aleatorios. Esta tabla es una secuencia de dgitos que se generan en el ms completo desorden, es decir, sin que entre ellos exista ninguna correlacin. Se realiza desde el tradicional procedimiento que consiste en escribir en papelitos los cdigos de los sujetos de la poblacin y hasta los mtodos ms sofisticados mediante la computadora.

Para seleccionar una muestra por este mtodo, deben darse las siguientes condiciones:

Ser posible la enumeracin o codificacin de todos los miembros de la poblacin en estudio.

Las caractersticas en estudio deben distribuirse en forma homognea en toda la poblacin.

Si el tamao de la poblacin es una cifra de 3 dgitos, los nmeros se leern de 3 en 3, si el tamao de la poblacin es una cifra de 4 dgitos, los nmeros se leern de 4 en 4 y as respectivamente segn los dgitos del tamao de la poblacin.

La lectura de los nmeros se puede realizar partiendo de cualquier fila o columna de la tabla.

Supongamos que estuviramos interesados en determinar el coeficiente intelectual (CI) promedio de los alumnos de la Facultad de Ciencias Aplicadas de la UNCP. Para realizar finalmente la seleccin, podramos utilizar una tabla de Dgitos Aleatorios de nmeros como la que public Rand Corporation en 1955, de la cual podramos utilizar una parte del milln de dgitos:000001009732533765201358634673548768095909117

000013754204805648947429624805240372063610402

000020842268953196450930323209025601595334764

000039901902529093767071538311311658867674364

000041280799970801573614764032366539895116877

000056606574717340727685036697361706581339885

000063106010805455718240635303426148679907439

000078526977602020516569268665748187305385247

000086357332135053254704890553575482846828709

000097379645753035296477835808342826093520344

Ejemplo:Supongamos que queremos seleccionar una muestra aleatoria simple de 30 alumnos de un total de 600, debemos asignar a cada alumno un nmero desde 001 hasta 600, luego elegimos al azar cualquier nmero de la tabla, el cual ser nuestro punto de partida, por ejemplo, 37542, elegimos la direccin en que vamos a elegir el segundo nmero (puede ser hacia la derecha o izquierda, hacia arriba o hacia abajo) la cual se debe mantener para el 3er, el 4to y as sucesivamente hasta completar los 30 estudiantes. En este caso elegimos hacia abajo.Como los nmeros asignados de nuestra poblacin tienen solo tres cifras y la mayor es 600, entonces tomamos cada vez las tres primeras cifras que sean menores a 600. Como el nmero elegido es 37542, entonces el primer nmero de la muestra ser: 375, el segundo 084, el tercero 128, etc.

Por lo tanto, los alumnos que pertenecern a nuestra muestra son los siguientes:

375084128310325025

108321457196093340

455020053035135093

361470346248232383

366353358548240311

Si se requiere extraer varias muestras de una misma poblacin, es aconsejable cambiar el punto de partida en la tabla.5.3.3. MUESTREO SISTEMTICO: El muestreo sistemtico es una tcnica diferente a la anterior. Para el caso se requiere listados de los sujetos que puedan estar identificados por sus nombres o por sus cdigos numricos. Para ello es preciso conocer el tamao de la poblacin (P) y el tamao de la muestra (m). Este tipo de muestreo consiste en dividir a la poblacin entre el nmero de la muestra requerida. En este caso

Ejemplo: Si tuviramos una poblacin de 950 y quisiramos seleccionar de ella una muestra de 50 sujetos, procederamos de la siguiente manera:

El tamao de los intervalos que vamos a seleccionar es 19, es decir, tendremos 50 intervalos de tamao 19 cada uno.

Seleccionamos al azar un nmero entre 1 al 19; digamos que se eligi el nmero 12.

Seguidamente se aplica la constante a partir del 12, es decir, los otros elementos de la muestra se obtendrn sumando 19 al anterior.

As, el segundo elemento de la muestra se obtiene sumando: 12 + 19 = 31

Luego el tercero sumando: 31 + 19 = 50

La muestra estar constituida por los elementos:

1231506988107126145164183

202221240259278297316335354373

392411438448468487506525544563

582601620639658677696716734753

772791810828848867886905924943

ste mtodo tiene la gran ventaja de entresacar a los sujetos de la muestra de manera uniforme en toda la poblacin5.3.4. MUESTREO ESTRATIFICADO:El muestreo estratificado consiste en reducir la poblacin segn los estratos que se hayan identificado, es decir, la poblacin esta dividido en subconjuntos disjuntos marcadamente diferentes con relacin a las variables en estudio. Cuando eso ocurre, para que la muestra sea representativa se debe seleccionar sujetos de cada uno de los subconjuntos donde debe dividirse de acuerdo a las caractersticas del objeto de estudio.

Ejemplo:

Sea el caso de la poblacin estudiantil de una universidad y se desea estudiar las actitudes de afiliacin poltica de los estudiantes. Adems, estratificar la poblacin sobre la base a que partido poltico pertenece:

Estrato 1: Accin Popular

Estrato 2: Partido Popular Cristiano.

Estrato 3: Per Posible

Estrato 4: Partido Aprista Peruano

Estrato 5: Otros

Si todos los estratos son iguales, se seleccionarn el mismo nmero de elementos para cada estrato, en caso contrario, la aportacin de cada estrato es proporcional al tamao de ste con relacin a la poblacin.

Ejemplo:

Sea el caso de la poblacin escolar de la ciudad de Junn; se desea estratificar la poblacin a partir de dos variables: Sexo de los estudiantes y tipo de gestin de los Centros Educativos.

Cada variable tiene dos valores, entonces tendremos 4 estratos:

Estrato 1: Varones de los I. E. Estatales

Estrato 2: Mujeres de las I. E. Estatales

Estrato 3: Varones de las I. E. Particulares

Estrato 4: Mujeres de las I. E. Particulares

Estos estratos tienen cada uno sus respectivos tamaos, es decir, no todos son iguales. Por ejemplo, si deseamos obtener una muestra de 300 estudiantes de una poblacin que ha sido dividida en 4 estratos como:

En el estrato 1 el 35 % de la poblacin

En el estrato 2 el 30 % de la poblacin

En el estrato 3 el 19 % de la poblacin

En el estrato 4 el 16 % de la poblacin

Por lo tanto, la muestra se conformara de la siguiente manera:

105 estudiantes en el estrato 1

90 estudiantes en el estrato 2

57 estudiantes en el estrato 3

48 estudiantes en el estrato 4

Como habr podido notar, el muestreo estratificado se utiliza cuando las caractersticas en estudio no se distribuyen en forma homognea en toda la poblacin, pero si en cada subconjunto disjunto o estrato.

5.3.5. MUESTREO POR CONGLOMERADOS:Este tipo de muestreo que es para poblaciones muy grandes, consiste en definir y delimitar los conglomerados y luego seleccionamos en forma aleatoria uno de ellos para finalmente de l seleccionar tambin en forma aleatoria los elementos que conformarn la muestra.La diferencia de este tipo de muestreo con el estratificado radica en que en este ltimo los sujetos se distribuyen en forma homognea en cada uno de los estratos, siendo diferente los estratos, razn por la que se seleccionan sujetos y datos de cada uno de ellos, y en el muestreo por conglomerados se seleccionan los elementos que conformarn la muestra, de un solo subconjunto, porque se considera que en cada uno de ellos se dan todas las caractersticas de la poblacin.

Ejemplo: Si estamos interesados en determinar las preferencias vocacionales de los estudiantes del quinto grado de educacin secundaria de las I. E. nacionales de la Regin Centro, podramos seleccionar al azar una de la Instituciones de esta regin y de l seleccionamos a los estudiantes del quinto de secundaria.5.4. TIPOS DE MUESTREO NO PROBABILSTICO5.4.1. MUESTREO POR CUOTAS

Consiste en un muestreo de juicio, con la restriccin de que la muestra incluye un nmero mnimo de cada subgrupo especfico dentro de la poblacin; es cuando se desea obtener una muestra de una poblacin organizada, piramidal o arborescente, como es el caso del sistema educativo nacional, a cada escaln de la organizacin se le asigna cuotas.

Ejemplo: Se desea conocer el nmero de hijos de los padres de familia que estudian en las regiones: Junn, Pasco, Huanuco, Huancavelica y Ayacucho, con ese fin se realizar un muestreo por cuotas en las capitales de cada regin. Se cuenta con los siguientes datos:CapitalesPorcentajesN de hijos

Huancayo2047

Cerro de Pasco2025

Huanuco2063

Huancavelica2015

Ayacucho2042

100191

El porcentaje de capitales no tiene que ser necesariamente igual

Ejemplo: Se desea hacer una investigacin a nivel nacional, sobre el aprendizaje significativo durante los tres ltimos aos de los estudiantes de educacin secundaria de menores, se estima que la poblacin estudiantil sobrepasa los 2 millones y medio de estudiantes y se desea obtener una muestra de 8000 estudiantes. Procedemos de la siguiente manera:

Sabemos que el Per esta dividido en 25 regiones, asignamos cuotas a cada una de las regiones, estas cuotas pueden ser proporcionales a la importancia del nmero de alumnos matriculados o bien pueden ser iguales para todos.Supongamos que para el caso que se decidiera que fueran iguales, entonces (8000/25 = 320) se asignan cuotas de 32 alumnos para cada regin; seguidamente en cada una de las regiones, se asignarn nuevas cuotas para ser cubiertas por cada una de las UGEL; luego, las autoridades haran el reporte inverso, de abajo hacia arriba, y se lograra sumando las cuotas de las regiones, para obtener la muestra de los 320 estudiantes para el estudio.5.4.2. MUESTREO POR CRITERIO O JUICIO DE EXPERTOSLa caracterstica principal de este tipo de muestreo es que tanto el tamao de muestra como la eleccin de los elementos estn sujetos al juicio del investigador, esto es, para realizar un estudio mediante este tipo de muestreo debe recurrirse a la experiencia que se tenga. El xito y la eficacia dependen de la opinin del investigador que haya seleccionado los elementos.Hay situaciones en las que el muestreo de juicio es til y aconsejable, cuando el muestreo probabilstica no es factible o resulta costoso.

El juicio de expertos es el criterio de seleccin que maneja un profesional especializado. El experto decide que sujetos van a participar en la muestra. Si por ejemplo se convoca a nivel de la Regin Junn un Concurso de Matemtica, sern los profesores de matemtica quienes debern emitir su opinin o seleccionar ellos a los mejores estudiantes.Ventajas e inconvenientes de los distintos tipos de muestreo probabilstica

MuestreoPRIVATE

CARACTERISTICASVENTAJASINCONVENIENTES

Aleatorio simpleSe selecciona una muestra de tamao n de una poblacin de N unidades, cada elemento tiene una probabilidad de inclusin igual y conocida de n/N. Sencillo y de fcil comprensin.

Clculo rpido de medias y varianzas.

Se basa en la teora estadstica, y por tanto existen paquetes informticos para analizar los datos Requiere que se posea de antemano un listado completo de toda la poblacin. Cuando se trabaja con muestras pequeas es posible que no represente a la poblacin adecuadamente.

SistemticoConseguir un listado de los N elementos de la poblacin

Determinar tamao muestral n.

Definir un intervalo k= N/n.

Elegir un nmero aleatorio, r, entre 1 y k (r= arranque aleatorio).

Seleccionar los elementos de la lista. Fcil de aplicar.

No siempre es necesario tener un listado de toda la poblacin.

Cuando la poblacin est ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos. Si la constante de muestreo est asociada con el fenmeno de inters, las estimaciones obtenidas a partir de la muestra pueden contener sesgo de seleccin

EstratificadoEn ciertas ocasiones resultar conveniente estratificar la muestra segn ciertas variables de inters. Para ello debemos conocer la composicin estratificada de la poblacin objetivo a hacer un muestreo. Una vez calculado el tamao muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la poblacin usando una simple regla de tres. Tiende a asegurar que la muestra represente adecuadamente a la poblacin en funcin de unas variables seleccionadas.

Se obtienen estimaciones ms precisa.

Su objetivo es conseguir una muestra lo ms semejante posible a la poblacin en lo que a la o las variables estratificadoras se refiere. Se ha de conocer la distribucin en la poblacin de las variables utilizadas para la estratificacin.

ConglomeradosSe realizan varias fases de muestreo sucesivas (polietpico)

La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior. Es muy eficiente cuando la poblacin es muy grande y dispersa.

No es preciso tener un listado de toda la poblacin, slo de las unidades primarias de muestreo. El error estndar es mayor que en el muestreo aleatorio simple o estratificado.

El clculo del error estndar es complejo.

ACTIVIDADES PARA RESOLVER POR LOS ALUMNOS1. Son representativas las siguientes muestras? Explique

a. El editor de una revista desea predecir el resultado de la siguiente eleccin presidencial y con esta finalidad entrevista a 1000 suscriptores de su revista para determinar sus preferencias al votar.

b. Se entrevista a los estudiantes de una clase de estadstica acerca de sus actitudes hacia la legalizacin del aborto; sus respuestas se utilizarn para predecir la opinin de la comunidad universitaria en lo referente a este problemas.2. Una organizacin no lucrativa est efectuando una encuesta domiciliaria de opinin sobre los servicios que presta la municipalidad a la comunidad. La organizacin a ideado un esquema para realizar el muestreo aleatorio de las casas y planea efectuar la encuesta los das laborables desde las 12 a.m. hasta las 5 p.m. Producir este esquema una muestra aleatoria?3. Debera utilizarse muestreo estratificado o muestreo por conglomerados, y como? para obtener una muestra aleatoria en cada una de las siguientes situaciones.

a. Se realiza un estudio para determinar el patrn de gastos familiares en cierta ciudad.

b. SE realiza una encuesta para determinar la actitud de los estudiantes universitarios del Per, con respecto a la pena capital.

4. El Centro Federado de Estudiantes de la facultad de Ciencias Aplicadas informa que el 50 % de las alumnas de la Facultad se han casado con sus profesores. Existe algn defecto en la informacin?

II CAPTULOII. ORGANIZACIN Y CLASIFICACIN DE DATOS

Frente a un conjunto de datos, el primer paso a dar, debe ser expresarlo y clasificarlo de acuerdo a criterios convenientes, en alguna forma simple que permita ver rpidamente todas las caractersticas posibles para obtener conclusiones tiles, ya sea directamente o por medio de clculos posteriores. Se consideran los siguientes pasos:a) Revisin y correccin de los datos. b) Construccin de Tablas de Frecuencias

c) Representacin tabular o cuadros estadsticos y grficos.

2.1. REVISIN Y CORRECCIN DE LOS DATOS

Ningn anlisis estadstico, por acabado y seguro que sea es capaz de suministrar respuestas adecuadas a un problema de estudio, si aquel se basa en una informacin incorrecta. De aqu que la revisin y correccin de la informacin recolectada debe ser obligatoriamente el paso previo a la clasificacin y computacin de los datos.Una regla emprica ampliamente contrastada (Huber 1984) es esperar entre un 2 % y un 5 % de observaciones con errores de medicin, trascripcin, etc. Por tanto antes de utilizar los datos muestrales conviene aplicar tcnicas simples para probarlos, como dar respuestas a las siguientes preguntas:1. Los datos apoyan o contradicen otra evidencia que tengamos?2. Es lgica la conclusin? Hemos obtenido conclusiones que no estn sustentados por los datos?3. Cuntas observaciones se tiene? Ellas representan a todos los grupos que se desea estudiar?

2.2. DESCRIPCIN Y ELABORACIN DE UNA TABLA DE FRECUENCIASAl realizar las observaciones de un hecho estadstico, se obtienen un conjunto de datos desordenados y en estos casos no se puede realizar un juicio razonable de dicho fenmeno, si los datos que se disponen son numerosos, es necesario clasificarlos en un cuadro o tabla resumen de las observaciones originales, para tratar dicho fenmeno se puede actuar de dos maneras:

Elaborar una tabla de Frecuencias para datos discretos en clases

Elaborar una tabla de Frecuencias para datos no agrupados en intervalos de clase.

Elaborar una tabla de frecuencias para datos agrupados en intervalos de clase.

Tabulacin: puede ser a travs de una serie simple, con la presentacin de los datos recogidos en forma de tabla ordenada, o a travs de la agrupacin de datos, este mtodo se utiliza cuando el nmero de observaciones es muy grande.

Ejemplo: En un curso de 40 alumnos, se desea estudiar el comportamiento de la variable estatura, registrndose los siguientes valores:

2.2.1. TABLA DE DATOS CON VARIABLES DISCRETAS.

Es aquel dato de una variable cuantitativa que toma solo valores enteros positivos, surgen solo por el procedimiento de conteo. 0,1,2,.n.Sean x1, x2, ., xn un conjunto de n observaciones discretas y sean y1, y2, ., ym el conjunto de valores diferentes que toman los datos originales (mn).Si los datos que se disponen son numerosos, es indispensable clasificarlos en un cuadro o tabla resumen de las observaciones originales, a las que en adelante llamaremos Tabla de Distribucin de Frecuencias o simplemente Tabla de Frecuencias.

Ejemplo de Variables Discretas: Nmero de alumnos de un centro educativo, Nmero de docentes de la UNCP, Nmero de habitantes por distrito, Nmero de hijos de una familia.

Clculos realizados en una Tabla de Distribucin de Frecuencias:

a) Frecuencia Absoluta (ni fi): Se llama frecuencia absoluta del valor yi, al nmero de veces que se repite este valor en el conjunto de observaciones. Donde: i = 1, 2, 3, 4,...m.Entonces la tabla de distribucin de frecuencias absolutas toma la forma siguiente:

Valores Diferentes

Observados (yi)Frecuencias Absolutas

(ni)

y1y2.

.

ymn1n2.

.

nm

Totaln

b) Frecuencia Absoluta Acumulada Menor que (Ni Fi): correspondiente al valor yi, al nmero de observaciones menores o iguales a yi, donde:

Ni = n1 + n2 + n3 + ......+ nm

As tenemos:

c) Frecuencia Absoluta Acumulada Mayor que (Ni* Fi*): correspondiente al valor yi, al nmero de observaciones mayores o iguales a yi.

Se denota por:

Ni* = ni + ni+1 + ..... + nm

En notacin de sumatoria:

As tenemos:

d) Frecuencia Relativa (hi): Correspondiente al valor yi, es el cociente de la Frecuencia absoluta ni, y el nmero total de observaciones (n).

As tenemos:

e) Frecuencia Relativa Acumulada Menor que (Hi): Correspondiente al valor yi, a la frecuencia relativa total de las observaciones menores o iguales a yi.

Se denota por:

Por notacin de sumatoria.

f) Frecuencia Relativa Acumulada Mayor que (Hi*): Correspondiente al valor yi, a la frecuencia total de las observaciones mayores o iguales a yi.

Se denota por:

En notacin de sumatoria:

As tenemos:

g) Frecuencia Relativa Porcentual (hi%): Es la frecuencia relativa hi multiplicada por 100 y representa el porcentaje de observaciones que corresponde al valor yi.

La frecuencia porcentual estar comprendida entre 0 y 100 y se denota por:

Pi = 100 hi

%h1 = 100.h1

%h3 = 100.h3

%h5 = 100.h5%h2 = 100.h2

%h4 = 100.h4h) Frecuencia Relativa Acumulada Porcentual (Hi): a la frecuencia relativa acumulada Hi multiplicada por 100. Es decir, 100.%Hi, y representa el porcentaje de observaciones menores o iguales a yi.

Ejemplo:

%Hi = 100 Hi

%H1 = 100.H1

%H3 = 100.H3

%H5 = 100.H5

%H2 = 100.H2

%H4 = 100.H4Problema Resuelto1. Se realiza la encuesta a un conjunto de 16 familias sobre el nmero de hijos que tienen; los resultados en el orden obtenido es:

x1 = 2x2 = 1x3 = 3x4 = 1x5 = 2x6 = 1x7 = 3x8 = 0

x9 = 2x10 = 1x11 = 2x12 = 3x13 = 4x14 = 1x15 = 1x16= 2

a) Construya una tabla de distribucin de frecuencias para estos datos discretos.

b) Interprete cada frecuencia obtenida.

Solucin:

a)

Vemos que el conjunto de observaciones (N de datos) es de tamao 16, o sea: n = 16

Luego identificamos el nmero de observaciones diferentes, m = 5

y1 = 0

y2 = 1

y3 = 2

y4 = 3

y5 = 4

Los cuales se ubican en el orden de arriba hacia abajo en la Tabla de frecuencias

Hallamos ahora el nmero de repeticiones de cada dato, o sea, determinamos la frecuencia absoluta (ni):

n1 = 1

n2 = 6

n3 = 5

n4 = 3

n5 = 1

b) Interpretacin de las frecuencias: n1 = 1; significa que, una familia encuestada no tiene ningn hijo

n2 = 6; significa que, 6 familias encuestadas tienen un hijo cada una

N2 = 7, familias encuestadas tienen 1 hijo cada una o menos.

N4 = 15, familias encuestadas tienen 3 hijos cada una o menos.

N3* = 9, familias tienen 2 hijos o ms.

h5 = 0,0623, es la proporcin de familias que tienen 4 hijos cada una.

h2 = 0,3750, es la proporcin de familias que tienen un hijo cada una.

H3 = 0,75, es la proporcin de familias que tienen 2 hijos o menos.

H2* = 0,9375, es la proporcin de familias que tienen un hijo cada una o ms.

H3% = 31,25; es el porcentaje de familias que tienen 2 hijos cada una.

H4% = 93,75; es el porcentaje de familias que tienen 3 hijos o menos.

2. Problema:

Sean los calificativos de veinte estudiantes en la asignatura de Estadstica: 13, 06, 15, 10, 14, 10, 10, 13, 12, 12, 09, 12, 15, 09, 11, 09, 11, 07, 11, 12. Elabore la tabla de Frecuencias de datos discretos.PROPIEDADES DE LAS FRECUENCIAS

A. Las frecuencias absolutas y las frecuencias acumuladas son siempre enteros no negativos. Es decir:

Para: i = 1, 2, 3, ., m

B. La suma de todas las frecuencias absolutas es igual al nmero total del conjunto de observaciones, o sea:

= n

C. Las frecuentas relativas y las frecuencias relativas acumuladas son siempre nmeros fraccionarios no negativos, no mayores que uno. Es decir:

Para: i = 1, 2, 3, .., m

D. La frecuencia absoluta acumulada MENOR QUE correspondiente al valor ym coincide con el nmero total del conjunto de observaciones. O sea:

E. La frecuencia absoluta acumulada MAYOR QUE correspondiente al valor y1 coincide con el nmero total del conjunto de datos. Es decir:

F. La frecuencia relativa acumulada MENOR QUE correspondiente al valor ym coincide con la unidad. Es decir:

G. La frecuencia relativa acumulada MAYOR QUE correspondiente al valor y1 coincide con la unidad, o sea:

H. La frecuencia absoluta acumulada MENOR QUE correspondiente al valor y1 es n1. Es decir:

I. La frecuencia absoluta acumulada MAYOR QUE correspondiente al valor ym es nm. O sea:

J. La frecuencia relativa acumulada MENOR QUE correspondiente al valor y1 es h1. Es decir:

K. La frecuencia relativa acumulada MAYOR QUE correspondiente al valor ym, es hm. O sea:

El conocimiento de estas propiedades sirve para controlar la correcta confeccin de las tablas de frecuencia.

Problemas para Resolver por el alumnoEjercicio 1: En la tabla de frecuencias que se da a continuacin faltan algunos datos compltala utilizando las propiedades mencionadas:

YiniNihiHi

02

15

29

3140,70

40,2

5

total

Ejercicio 2: Un Administrador de Empresas visita 25 Cooperativas Agrarias de naranjas en el valle de La Merced y en cada una de ellas anoto el nmero de miles de soles que se emplean para la produccin de cada una de ellas, los datos son los siguientes:

1520251518

1617182018

1818191617

1916171717

1918191815

a) Diga que tipos de datos son estos.

b) Construya una tabla de distribucin de frecuencias, adecuada a este conjunto de valores.

c) Cuntas cooperativas, tienen a lo ms 20 mil soles en produccin de naranjas?

d) Cuntas cooperativas agrarias tiene por lo menos 17 mil soles en la produccin de naranjas?

e) Qu proporcin de cooperativas bajo estudio tienen una produccin de 18 mil soles en su produccin?

f) Qu proporcin de cooperativas tienen 18 mil o menos en la produccin de naranjas?

g) Qu porcentaje de cooperativas tienen 18 mil o menos en su produccin de naranjas?2.2.2. TABLA DE DATOS CON VARIABLES CONTINUASEs el conjunto original de datos u observaciones por x1, x2, ...., xn, siendo n el tamao del conjunto (tamao muestral) y donde estos datos son del tipo continuo.En este caso debido a que la magnitud de las caractersticas pueda tomar, no es tan simple elaborar una tabla de distribucin de frecuencias, es ms bien un problema de clasificacin de datos donde el investigador o estadista debe tomar decisiones.Clases: Se denomina clases a cada uno de los grupos en que se divide el conjunto de datos.El primer paso para resolver este problema de clasificacin, es decidir cules y cuntas han de ser las clases a considerarse. Para ellos normalmente se empieza por determinar la observacin que tiene el valor mximo Xmax y la observacin que tiene el valor mnimo Xmin; con estos valores obtendremos el Recorrido o Rango del conjunto de observaciones.* Intervalos de clase (m).- Es cada uno de los grupos en que se divide el conjunto de datos. En la cual:i = 1, 2, 3,., m

Variable

--

ConteoniNihiHi%hi%Hi

---

---

---

: :

---

Total

* Recorrido o Rango (R).- Es la amplitud o longitud del recorrido del conjunto de datos.

R = xmax x min.

* Nmero de Intervalos de clase (m).- Es la cantidad de filas m del conjunto de datos.

yi-1 yi

Donde: i = 1, 2, ...., m.

m se puede hallar de diferentes maneras:

1) m n

2) Regla de Sturges: m = 1 + 3,3 log (n) recomendable para: 5 m 20

* Marca de Clase (yi).- Es el punto medio del intervalo que representa a dicha clase.

Donde: i = 1, 2, 3,., m* Amplitud de Clase (c): Es la longitud del intervalo que define la clase. Es decir:

Donde:i = 1, 2, 3, ., m

As:

Longitud del primer intervalo de clase

Longitud del segundo intervalo de clase

Si los intervalos tienen igual longitud c, entonces:

CONSTRUCCIN DE LOS INTERVALOS DE CLASE:

Los intervalos de clase se construyen partiendo de xmin o , luego se va asignando consecutivamente a las clases, lmite inferior y superior de clases (yi-1 yi), de la siguiente manera:

Lmite Inferior

Lmite Superior

1er Int.

2)

3)

4)

5)

m)

Variable

[ -->Marca de Clase

yiniNihiHi%hi

---

---

---

: :

--

Y1Y2Y3Y4:

:

ymnin2n3n4:

:

nmN1N2N3N4:

:

Nmh1h2h3h4:

:

hmH1H2H3H4:

:

Hm%h1

%h2

%h3

%h4

:

:

%hm

Total

2.2.3. REGLA GENERAL PARA ELABORAR LAS DISTRIBUCIONES DE FRECUENCIAS DE DATOS CONTINUOS

1. Decidir el nmero de clases (m) a determinar.

Respecto al nmero de clases (m) no existe un consenso unnime entre los autores, Bradford Hill seala que debe tomarse un nmero de clases comprendido entre 10 y 20, mientras que Camel indica que el nmero apropiado es entre 8 y 15. Sin embargo el sentido comn nos dice que el nmero de clases no deben ser pocas debido a que la condensacin sera mucha y con ello habra prdidas de informacin fuerte en relacin con la contenida en el conjunto de datos originales. Por otra parte un nmero excesivo de clases, si bien produce poca prdida de informacin no reduce o simplifica el trabajo, siendo en ocasiones preferible el trabajo con los propios datos originales. Tambin algunas pueden resultar vacas o con frecuencias nulas. Mencionaremos algunas reglas:a) m = 2n, igualar el resultado al entero ms prximo. n = nmero de datos.

b) m n, donde n = nmero de observaciones.

c) Regla de Sturges; m = 1 + 3,3 log (n) donde; n = nmero de observaciones.

En general se recomienda que el nmero de clases este entre:

2.

3. Determinar el recorrido o rango de los datos y la amplitud (l) del recorrido.

R = xmax. - x min4. Determinar la amplitud o la longitud de los intervalos de clase.

C = R/m

5. Determinar los lmites de clase, de manera que cada observacin se clasifique sin ambigedades en una sola clase.

y0 = xmin. y3 = y2 + c

y1 = y0 + c y4 = y3 + c

y2 = y1 + c y5 = y4 + c

6. Determinamos las marcas de clases (yi):

.

7. Por ltimo determinamos la frecuencia absoluta de cada clase, teniendo en cuenta que estamos considerando intervalos de clase abiertos a la derecha y cerrados a la izquierda, es decir:

yi-1 - yi [ yi-1 , yi >

* Al elaborar la tabla de frecuencias de datos de variables continuos, siempre hay una ligera prdida de informacin, que ocurre al no considerar ms los datos individuales, sino la marca de clase (punto medio de cada clase) como un valor representativo de cada clase. As, yi representa a todas las observaciones mayores o iguales a y0 y menores que yi. Sin embargo esta prdida de informacin queda compensada por la ganancia en concisin, sencillez y claridad.

Ejercicio para resolver por el docente:

En el mercado de Tarma se realiz una inspeccin en pesos (Kg.) de 50 sacos de papas, para saber si contenan el peso completo (100 Kg.), la muestra fue obtenida de la produccin semanal del distrito de Huasahuasi, de acuerdo a estos datos el alumno elaborar y clasificar una tabla de frecuencias con 5 clases de amplitud (m) y con los resultados que son representativos de toda la poblacin de produccin de papas de dicho distrito, el alumno informar lo siguiente:

a) Cual es el mayor tanto por ciento de sacos que pesan entre 93,5 y 94,5.

b) Si el peso apropiado de los sacos para su aceptacin en el mercado es como mnimo 93,5 Kg. (de la columna 100H3), que har con el resto la comunidad?

94,3 93,7 94,7 94,3 92,4 94,5 92,8 95,4 93,6 95,5

92,9 92,7 95,0 93,0 94,0 93,9 93,6 93,3 92,3 93,7

94,2 95,7 94,2 93,8 92,7 94,4 96,2 91,6 93,6 91,9

94,7 93,6 95,7 93,7 94,8 93,7 92,7 93,2 93,7 96,4

94,1 93,0 95,5 95,3 92,9 93,9 92,7 94,6 94,6 94,4

Ejemplos para resolver por el alumno:

Ejemplo 1. Suponer que la siguiente tabla de distribucin de frecuencias representa los salarios de los trabajadores de construccin civil de la ciudad de Tarma, el sindicato de construccin civil solicita que en el nuevo pacto colectivo se establezca un salario mnimo de S/. 14,00, que porcentaje de trabajadores se beneficia con este pacto, construya la tabla de frecuencias.

SALARIOS DIARIOS (s/. )FRECUENCIA

De 8 a 12 36

De 12 a 16 42

De 16 a 20 51

De 20 a 24 66

De 24 a 28 57

Lmites Reales o verdaderos de intervalos de clase.- El lmite real de un intervalo de clase es igual al valor aparente ms o menos la mitad de la medida utilizada.

Ejemplo 2

Con las cuotas anuales (en soles) de 40 compaas para un seguro de vida de S/. 25 000, para hombres de 60 aos de edad se ha formado una tabla de frecuencias cuyos intervalos de clases son:

82 87; 87 92; 92 97; 97 102; 102 107; 107 112

Determine los nmeros reales de clase.

La cuota de S/. 82 se interpreta como el valor al cual se han redondeado cuotas comprendidas entre S/. 81,50 y 82,49, similarmente los otros lmites de clase. Entonces los 6 intervalos reales de clase son:

81,5 87,5 ; 87,5 92,5 ; 92,5 97,5 ..etc.

Ejemplo 3.

En la siguiente tabla de frecuencias que se da, faltan algunos datos, compltalas:

yi-1 - yiyiNihiNiHi

30 - 34

--- ---

--- ---

--- ---

--- 50 110,10

0,25

0,55

0,85

1.00

Ejemplo 4.

En cierta tabla de frecuencias se perdi informacin del ingreso diario en cientos de soles de una agencia de turismo y solo quedaron algunos datos, reconstruir la tabla de frecuencias:

H3 h2 = 0,26 c = constante y2 = 550 h2 = 0,14 y5 = 850

H5 = 0, 20

h6 = 4 / 100 = H1 m = 6 H4 = 0, 76

Ejemplo 5.

La inversin real en miles de soles anuales de un grupo de pequeas empresas fueron:

101284068103028614

1620252830263046101817

13172176814715192722

01468911131518203060

126556871215363952

Se pide:

a. Formar una tabla de todas las distribuciones de frecuencias con intervalos de amplitud constante.

b. El nmero de pequeas empresas con inversiones menores de 40 mil soles.

c. El nmero de pequeas empresas que han invertido 40 mil soles o ms.

d. El nmero de pequeas empresas que invirtieron 10 mil soles o ms pero menos de 35 mil soles.

e. La proporcin de pequeas empresas con inversiones menores de 8 mil soles

f. La proporcin de pequeas empresas que invirtieron por lo menos 20 mil soles, pero a lo mas 38 mil soles.

g. El porcentaje de pequeas empresas que han invertido entre 6 mil soles y 30 mil soles inclusive.

h. El porcentaje de pequeas empresas que invirtieron ms de 64 mil soles.

Ejemplo 6:

En la tabla de frecuencias que se da a continuacin faltan algunos datos, compltalas:

--

yiniNihiHi%hi%Hi

20 24

24 28

28 32

32 36

36 - 40110,10

0,25

0,55

0,85

1.00

2.2.4. SIMETRIA DE UNA TABLA DE DISTRIBUCIN DE FRECUENCIAS

1) Una tabla de distribucin de frecuencias que tiene un nmero impar de (m = 2k 1) clases, se dice que es simtrica, si las clases equidistantes de la clase central tienen frecuencias iguales. Es decir, si las frecuencias absolutas cumplen la relacin:

,

2) Una tabla de distribucin de frecuencias que tiene un numero par (m = 2k) de clases, se dice que es simtrica, si las dos clases centrales tienen frecuencias iguales y las clases equidistantes de stas centrales tienen tambin frecuencias iguales.

Ejemplo: En una tabla de distribucin simtrica con siete intervalos de clases de igual amplitud, se conocen los datos siguientes:

c = 10; n1 = 8 y3n3 = 1260, n2 + n5 = 62, h3 = 0,21 y H4 = 0,96

Se pide reconstruir la tabla de distribucin de frecuencias

Solucin:

1. Datos:m = 7 = 2k -1,

Entonces para:

j = 1;

j = 2

j = 3

Por tanto:n1 = n7 = 8

2. Evidentemente, en tablas simtricas de distribucin de frecuencias, las relaciones entre las frecuencias relativas son las mismas que hay entre las frecuencias absolutas. Es decir, en este caso:

,

con: k = 4

As pues, para:j = 1;

h3 = h5

j = 2;

h2 = h6

j = 3;

h1 = h7

Luego:

h3 = h5 = 0,21

3. Hallando las frecuencias relativas:Por propiedades:

1 = H7 = H6 + h7 = 0,96 + h7De donde:h7 = 1 0,96 = 0,04

Es decir: h1 = h7 = 0,04

4. Hallando el Nmero total de datos:

De donde:

5. Hallando las Frecuencias Absolutas:De 2) y la ecuacin: ni = nhi

Se tiene: n3 = n5 = 200 (0,21) = 426. Hallando las frecuencias relativas faltantes:

De datos y 5):

n2 + n5 = n2 + 42 = 62

de donde:n2 = n6 = 20Por tanto:h2 = h6 = 20/200 = 0,107. Completando las frecuencias relativas simples y acumuladas:

As:0,96 = H6 = H5 + h6 = H5 + 0,10

Es decir: H5 = 0,96 0,10 = 0,86

0,86 = H5 = H4 + h5 = H4 + 0,21

De donde:H4 = 0,86 0,21 = 0,650,65 = H4 = H3 + h4 = 0,35 + h4Luego:

h4 = 0,65 0,35 = 0,30

Por tanto:n4 = nh4 = 200(0,30) = 608. Hallando los intervalos de clases:

De los datos:1260 = y3n3 = y3(42)

luego:y3 = 1260/42 = 30Pero:

De donde:

Como:

y c =10,

Se construye los intervalos de clases, quedando:

--

yiNihiNiHi%hi%Hi

5 15

15 25

25 35

35 45

45 55

55 65

65 7510

20

30

40

50

60

708

20

42

60

42

20

80,04

0,10

0,21

0,30

0,21

0,10

0,048

28

70

130

172

192

2000,04

0,14

0,35

0,65

0,86

0,96

1.00

Totales2001.00

Ejercicio para el estudiante:

De una tabla de distribucin de frecuencias absolutas con 5 intervalos de clase de igual amplitud se sabe:

a) Sus marcas de clase forman una progresin aritmtica cuya suma es 45 y ltimo termino 15.

b) Las 3 primeras frecuencias absolutas forman una progresin geomtrica y las tres ltimas una progresin aritmtica.

c) El producto de la primera y la tercera frecuencia absoluta es 100.

d) El producto de la tercera y quinta frecuencia absoluta es 480.

e) La diferencia comn de la progresin aritmtica y la razn de la progresin geomtrica son iguales.

Reconstruir la tabla de distribucin de frecuencias.2.2.5. TABLA DE DATOS CON VARIABLES CUALITATIVAS

Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en varias categoras. La situacin ms sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotmicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificacin no es suficiente y se requiere de un mayor nmero de categoras (color de los ojos, grupo sanguneo, profesin, etctera). En el caso de datos cualitativos, la tabla de distribucin de frecuencias adoptar la forma siguiente:VariableFrecuencia

AbsolutaFrecuencia

RelativaFrecuencia

Relativa

Porcentual

Caracterstica A

Caracterstica B

:

:

Caracterstica ZnAnB:

:

nZhAhb:

:

hZ%hA%hB:

:

%hZ

Ejemplo: Una revista muy conocida efectu una encuesta respecto a lo adecuado de la proteccin policial de patrimonios culturales en la ciudad. Se seleccion un total de 419 personas en una muestra aleatoria simple. Los siguientes datos reflejan las respuestas de las personas encuestadas a la pregunta Es adecuada la proteccin policial de patrimonios culturales en su ciudad?

RespuestasFrecuencia

Absoluta

Si

No

No opina293

80

46

Total419

a) Qu proporcin de personas no opinan?

b) Qu porcentaje de personas contestaron Si?

Problemas para resolver por el alumno:

1. Cuando se construye una distribucin de frecuencias, el nmero de clases que se usan depende de:

a) Nmero de datos

b) Intervalos de los datos reunidos

c) Tamao de la poblacin

d) Todas las anteriores

2. Explique la diferencia entre distribuciones de frecuencias relativas y de porcentajes.

3. A continuacin se transcriben las edades de 50 integrantes de un programa de Servicio Social del Gobierno Peruano:81536760806456549161

66886765527274657369

43547670976882757960

39877697864560456576

92728280706550587056

Construya con estos datos las distribuciones de frecuencia relativa usando 7 y 13 intervalos de clases iguales. Las polticas estatales de los programas de servicio social exigen que aproximadamente el 40 % de los participantes del programa sean mayores de 50 aos.

a) Se ajusta el programa a esa poltica?

b) Cul de las distribuciones de frecuencia relativa le ayuda a contestar mejor la parte a)

c) Suponga que el Director de los servicios sociales quiera conocer la proporcin de participantes en la empresa cuya edad flucta entre 45 y 80 aos. Con cul de las dos distribuciones podra estimar mejor la respuesta el director?

4. La compaa SPEEDY, una empresa situada en Arequipa, muestre sus registros de embarque durante cierto da, obteniendo los siguientes resultados:TIEMPO TRANSCURRIDO DESDE LA RECEPCIN DE LA ORDEN HASTA LA ENTREGA (EN DAS)

4128141167131311

11205191015247296

Construya una distribucin de frecuencias para los datos anteriores y una distribucin de frecuencia relativa. Use intervalos de 6 das.a. Qu afirmacin puede hacer sobre la eficacia del procesamiento de pedidos a partir de la distribucin de frecuencia?

b. Si la compaa quiere asegurarse de que la mitad de sus entregas se realicen en 10 a menos das, Puede usted determinar mediante la distribucin de frecuencias si la compaa ha alcanzado su meta?

5. Las marcas de clase de una distribucin de frecuencias con intervalos de clase de igual amplitud son: 46, 55, 64, 73, 82, 91. Halle:a) El intervalo de clase

b) Los lmites de clase

c) El rango

c) los lmites reales de clase

6. Se tiene una distribucin de frecuencias con cuatro intervalos de clase de igual amplitud y los siguientes datos:

y1 = 10

y4 = 22

h1 = 0,30h4 = 17,5 %

H2 = 0,45Reconstruir la tabla de frecuencias

7. Los puntajes de 50 alumnos se clasifican en un cuadro de distribucin de frecuencias de cuatro intervalos de clase de amplitud constante, sabiendo que: y2 = 50, n1 = 4 N2 = 20, n3 = 25, c = 62.

Reconstruir el cuadro

8. En cada uno de los siguientes casos, determine si son consistentes o no, los datos:

a) m = 6, h1 = 0,2 h4 = 0,2 H2 = 0,6 H3 + H4 = 1,9

b) H4 = 0,30 n = 10 n1 = 0,31

c) h2 = 0,40 n = 50 n1 = 20

d) h1 = 4 % h3 = 12 % H4 = 15 %e) H5 = 0,36 N4 = 30 h5 = 6 n = 50

9. Suponga que la siguiente tabla de distribucin representa los salarios de los trabajadores de construccin civil de Tarma.Salarios

S/.Frecuencia

N

8 12

12 16

16 20

20 24

24 28

28 32360

420

510

660

570

480

Total3000

a) El sindicato de construccin civil solicita que en el nuevo pacto colectivo se establezca un salario diario mnimo de S/. 14. Qu porcentaje de trabajadores se beneficiarn con este pacto?b) Los trabajadores que reciben mas de 30 soles diarios, se supone son muy calificados (maestros de obra). Qu porcentaje de trabajadores se supone son muy calificados?

c) Estime el nmero de trabajadores que ganan entre 15 y 27 soles diarios.

10. Los siguientes datos indican el nmero de minutos que ocuparon sus asientos 50 turistas en un restaurante:73658270455070543275

75676560758783407264

58758970735561788993

43515938657175856585

49475560767569354563

a) Cuntos turistas ocuparon entre 35 y 52 minutos sus asientos?b) Cuntos turistas ocuparon ms de una hora los asientos?

c) Qu porcentaje ocuparon los asientos menos de 92 minutos?11. Richard que es un Jefe de Prctica muy divertido, pierde los exmenes de Estadstica. Pero recuerda que las 120 notas tenan una distribucin simtrica con 7 intervalos de clase de amplitud constante. Adems en sus archivos encuentra la siguiente informacin:h1 = 5 %h3 = 15 %

y4 = 72

a) Reconstruya la tabla de distribucin de frecuencias.

b) Si para aprobar el examen se necesita obtener por lo menos 70 puntos. Cuntos desaprobaron dicho examen?12. En una investigacin agrcola en el valle de Tarma, se determin la produccin total en kilogramos de un cierto cultivo, el cual fue sembrado en 20 parcelas experimentales. Los resultados obtenidos fueron:40353840413741403820

25332725284422202936

a) Construya una distribucin de frecuencias con cinco clases

b) Si el 80 % de los pesos estn por arriba de los 30 kilogramos se recomendara su cultivo en el valle. A la vista de los resultados se recomendar su cultivo? 13. Una compaa tiene 60 trabajadores. El sueldo mnimo de un trabajador es 100 Euros y el mximo 590 euros mensuales. El 80 % de los trabajadores ganan por lo menos 210 euros; 18 perciben sueldos inferiores a 390 euros mensuales, 20 % son profesionales y perciben un haber de por lo menos 490 euros, se pide:a) Construir la tabla de distribucin de frecuencias relativas.

b) Cuntos ganan ms de 450 euros mensuales?c) Qu porcentaje de trabajadores tienen un sueldo de 300 euros ms pero menos de 500 euros mensuales?14. El contenido de nicotina en miligramos de 40 cigarrillos de cierta marca se registraron de la siguiente manera:1,091,922,311,792,281,741,471,970,851,24

1,582,031,702,172,552,111,861,901,681,51

1,640,721,691,851,821,792,461,882,081,67

1,371,931,401,642,091,751,632,371,751,69

a) Construya la tabla de distribucin de frecuencias absolutas y relativas e interprete: n1, N2, h3, H4, %h5, %H3.2.4. REPRESENTACIONES GRFICAS DE DATOS ESTADSTICOS

Un grfico es la representacin de un fenmeno estadstico por medio de figuras geomtricas (crculos, rectngulos, paraleleppedos, puntos, lneas, etc) cuyas dimensiones son proporcionales a la magnitud de los datos presentados. El objetivo principal es la representacin de los datos en forma grfica, que permita a simple vista darse cuenta del conjunto de elementos presentados y de evidenciar sus variaciones y caractersticas. El grfico es un auxiliar del cuadro estadstico al cual no lo sustituye sino lo representa.Es de vital importancia puesto que basta con observar un grfico para interiorizar con facilidad los cambios que se efectan en las variables involucradas.Un conjunto de observaciones o medidas realizadas en una poblacin, atendiendo a una o ms caractersticas determinadas, es llamado tambin Serie Estadstica. Las Series Cronolgicas o temporales se ocupan del comportamiento de los hechos a lo largo del tiempo.Una vez que se ha efectuado la investigacin y se ha recolectado y clasificado la informacin o serie estadstica, resulta imprescindible representarlo de manera adecuada, de tal forma que nos permita hacer un anlisis til. Existen dos tipos de presentacin mediante los Cuadros Estadsticos y Grficos.2.4.1. CUADROS ESTADSTICOSUn cuadro estadstico es un arreglo ordenado de filas y columnas de los datos o series estadsticas, por lo tanto tiene dos entradas o ms. En ellas pueden representarse caractersticas cualitativas, cuantitativas o una combinacin de ambas. Se puede tambin considerar variables discretas, continuas o de ambos tipos. La finalidad es, ofrecer informacin resumida de fcil lectura, comparacin e interpretacin. Segn su objetivo, las lneas (horizontales) y columnas (verticales) de un cuadro se deben organizar de modo que pongan en evidencia los aspectos que interesa mostrar y resalten las comparaciones que se desean hacer notar.La tabla de distribucin de frecuencias es un caso especial de un cuadro estadstico.

PARTES DE UN CUADRO ESTADSTICO: Las partes de un cuadro estadstico son:1. Nmero: Es el Cdigo de identificacin del cuadro. Este nmero se escribe a continuacin de la palabra Cuadro. Por ejemplo: Cuadro N 2.5; indica el quinto cuadro del capitulo dos.

2. Ttulo: Es la indicacin que preside a la tabla y es colocada en la parte superior de la misma. El Ttulo debe reunir las condiciones siguientes: Completo y Conciso.

a) COMPLETO: Un ttulo completo debe indicar claramente cul es el contenido del Cuadro Estadstico. Debe responder a las preguntas: Qu, cmo, dnde y cundo?

QUE: Se refiere al contenido de la tabla. Cul es el universo que se investiga.

COMO: Cmo se estudia; de acuerdo a cuales caractersticas se clasifican los individuos u objetos estudiados. Las variables ubicadas en las filas se identifican con la proposicin Por y las de las columnas con la proposicin Segn.

CUANDO: Momento o periodo de tiempo a que se refiere el estudio.

DONDE: Lugar a que se refiere la informacin.

b) CONCISO: El ttulo debe ser breve, lo ms conciso posible, aunque no debe sacrificarse la claridad a la concisin.

Ejemplo: En el Cuadro 2.1, indicar si el ttulo contiene las 4 preguntas bsicas del cuadro estadstico:

Cuadro 2.1Per: Distribucin de las mujeres de 15 a 49 aos, por rea urbana, rural y regin natural. Segn estado conyugal: 2008

REAREGION NATURAL

Estado

ConyugalTotalUrbanaRuralAMLCostaSierraSelva

TOTAL499934061593149113311561516

Soltera17601335425660481473147

Casada20041335668640495676193

Conviviente895491405185266304138

Viuda7034351393710

Divorciada2020014350

Separada2501916079776628

Qu?:

Cmo?:

Cundo?:

Dnde?:

Ejemplo: Cul sera el Ttulo adecuado para este enunciado?

CUADRO QUE MUESTRA LA DISTRIBUCIN DE LAS DEFUNCIONES EN LA PROVINCIA DE LIMA, DURANTE EL AO 1990 CLASIFICADOS DE ACUERDO CON LA EDAD Y EL SEXO DE LOS FALLECIDOS

3. CUADRO PROPIAMENTE DICHO:Es la parte del cuadro que contiene la informacin y consta de un conjunto de casillas o celdas, dispuestas en filas y columnas. Sus elementos esenciales son: Encabezamiento de las columnas, Columna principal o Matriz y Cuerpo.ENCABEZAMIENTO: Es la primera fila del cuadro, en el se explica las categoras y el objeto de cada una de las columnas, es decir, indica la naturaleza de los datos inscritos en cada celda que se hallan debajo. Deben ser breves y explcitos.

Por ejemplo en el Cuadro 2.1: El Encabezamiento, es el rea, urbana y rural y la regin natural, subdividida en AML, Costa, Sierra y Selva, y el Estado Conyugal.

COLUMNA PRINCIPAL O MATRIZ: Es aquella en que se anotan las categoras o las diferentes clases de la escala de clasificacin utilizada. Por ejemplo: en el Cuadro 2.1.: La columna principal esta constituida por el Estado Conyugal: Soltera, Casada, etc.

CUERPO: Es el conjunto de de celdas o casillas que son las intersecciones de filas y columnas, donde estn anotados los datos numricos.

4. NOTAS EXPLICATIVAS: Contiene habitualmente la Fuente de los datos representados y cualquier nota aclaratoria sobre el contenido del cuadro.FUENTE: Es la indicacin al pie del cuadro que sirve para nombrar la entidad responsable de donde se obtuvieron los datos.

2.4.2. REPRESENTACIN GRFICAREGLAS PRINCIPALES PARA EL TRAZADO DE GRFICAS LINEALES1.- Por lo general las frecuencias se ponen en el eje vertical (ordenadas) y el mtodo de clasificacin en el eje horizontal (abscisas).

2.- Las dos escalas deben guardar proporcin de tal forma que el grfico no de impresiones de fluctuaciones muy lentas o muy exageradas. Se acepta una proporcin de 1 a1 o de 1 a 2; por ejemplo si la ordenada mide 5 unidades, la abcisa debe medir entre 5 y 10 unidades.

15 -

10 -

5 -

0 . . . . .

60 61 62 63 64 65

3.- La escala que representa la frecuencia debe empezar por cero. Cuando no puede aparecer de forma normal se parte la escala con una lnea en zigzag.

4.- El ttulo se coloca generalmente en la parte superior del grfico, fuera del mismo y explicara lo ms claro y preciso posible el contenido que expone.

5.- Cada escala debe ser rotulada de tal manera que se comprenda fcilmente qu representa; edad en aos o meses, kilos o libras en peso, etc.

6.- El grfico progresa generalmente de izquierda a derecha y de abajo hacia arriba.

7.- Las lneas del propio grfico deben dibujarse mas gruesas que las escalas.

8.- El grfico generalmente debe ir acompaado de la tabla que le dio origen.

9.- El grfico no debe contener ms lneas o smbolos que los que el ojo pueda seguir cmodamente. A. TIPOS DE GRFICOS

Es la representacin grfica de un conjunto de datos estadsticos, en la cual el estadstico o investigador elegir la ms conveniente que se adapten a un tipo de series estadsticos. Estos son:

1. Diagrama de Barras: Sencillas, dobles, mltiples, proporcionales.

2. Pictogramas.3. Grficas de sectores o circular de pastel.4. Diagramas de frecuencias.5. Histogramas de frecuencias.6. Polgono de frecuencias absolutas y relativas.7. Polgono de frecuencias acumuladas u ojivas.8. Grficos de lnea o aritmtico simple.9. Grficos de pirmides.10. Cartogramas.

1) GRAFICO DE BARRASEs aquella que se representa por una serie de barras o paraleleppedos o rectngulos, los cuales pueden dibujarse horizontal o verticalmente. Este grfico se utiliza para representar variables de tipo cualitativo o cuantitativo discreto.

Reglas para su construccin:

No existen reglas estrictas y se graficaran por criterio propio.

1.- Todas las barras, rectngulos o paraleleppedos deben tener el mismo grosor.

2.- El espacio entre las barras deben tener la misma magnitud.

3.- Las barras, por esttica deben ordenarse de mayor a menor cuando se pueda.

4.- La escala de la frecuencia debe empezar por cero.

5.- Deben dibujarse a buen criterio, lneas de fondo en la grfica, ellas facilitan la lectura de los valores.

6.- Si el grfico tiene muchas barras es preferible reemplazarlo por un diagrama lineal.2. GRFICOS DE SECTORES O DE PASTELEste sistema de representacin es de la misma naturaleza que el grfico de barra