teoria

25
Carrera : Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor 1 1. INTRODUCCIÓN La estadística es el lenguaje universal de la ciencia. Como usuarios potenciales de la estadística, es necesario dominar la ’’ciencia” y el “arte” de utilizar correctamente su metodología. El empleo cuidadoso de los métodos estadísticos permite obtener información precisa de los datos. Estos métodos incluyen; definir cuidadosamente la situación, recolectar datos, resumir con precisión los datos y obtener y comunicar las conclusiones importantes. La estadística implica información, números y gráficas para resumir la información; y su interpretación. El término estadística posee varios significados para personas de diversos entornos e intereses. Para algunos, se trata de un medio para recolectar y representar grandes cantidades de información. Para otros, se trata de un medio para “lomar decisiones de frente a la incertidumbre”. En la perspectiva idónea, cada uno de estos puntos de vista es correcto. El terreno de la estadística puede dividirse en dos áreas: estadística descriptiva y estadística inferencial. La estadística descriptiva es en lo que piensa la mayoría de las personas al escuchar la palabra estadística ya que incluye la recolección, presentación y descripción de los dalos' muéstrales. El término estadística inferencial se refiere a la técnica de interpretación de los valores resultantes de las técnicas descriptivas y a la toma de decisiones y obtención de conclusiones sobre la población. La estadística es más que sólo números; son los datos, lo que se hace con los dalos, lo que se aprende de los datos y las conclusiones resultantes. 2-CONCEPTO DE ESTADISTICA La estadística según Kendall y Buckland: La estadística según Gini; La estadística según Spiegel: La estadística según Yale y Kendall: 3. CLASIFICACIÓN DE ESTADISICA El terreno de la estadística puede dividirse en dos campos de aplicación: estadística descriptiva y estadística inferencial. 3.1 Estadística Descriptiva Tiene por objeto fundamental la obtención, presentación, análisis y descripción de un conjunto de datos. “Estudia las técnicas que se utilizan para describir o caracterizar los datos obtenidos”. 3.2 Estadística Inferencial Abarca las técnicas que permiten utilizar los datos muéstrales para inferir o extraer conclusiones sobre las poblaciones de las cuales fueron obtenidos dichos datos. “Incluye las técnicas que emplean los datos obtenidos en la muestra, para, a partir de ellos, hacer inferencias sobre sus respectivas poblaciones” 4. COMPONENTES DE UNA INVESTIGACIÓN ESTADISICA Los componentes son: 4.1 Población: Es una colección o conjunto' de individuos, objetos o dalos que el investigador está interesado en estudiar. En un experimento, la población es el grupo más grande del cual se pueden tomar los elementos que participarán en dicho experimento. Para definirla es necesario tener en cuenta las siguientes características: Homogeneidad: los miembros de la población deben tener características semejantes. Tiempo: período de tiempo donde se ubica la población de interés. Espacio, lugar donde se ubica la población de interés. La población puede ser: Finita; se pueden enumerar todos los elementos de la población. Infinita; no se pueden enumerar todos los elementos de la población. Cuando la información deseada está disponible para todos los objetos de la población, se tiene lo que se llama “censo”. Las restricciones de tiempo, dinero y otros recursos hacen que un censo sea, generalmente, impráctico o infactible. 4.2 Muestra Es un subconjunto de la población, que se escoge a través de un proceso llamado muestreo La estadística es un valor resumido, calculado, con base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra. La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivos, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos; asi como para sacar conclusiones válidas y lomar decisiones razonables basadas en tal análisis. La estadística es la ciencia que traía de la recolección, clasificación y presentación de tos hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los

description

combinatoria

Transcript of teoria

Page 1: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

1

1. INTRODUCCIÓN

La estadística es el lenguaje universal de la ciencia. Como usuarios potenciales de la estadística, es necesario dominar la ’’ciencia” y el “arte” de utilizar correctamente su metodología. El empleo cuidadoso de los métodos estadísticos permite obtener información precisa de los datos. Estos métodos incluyen; definir cuidadosamente la situación, recolectar datos, resumir con precisión los datos y obtener y comunicar las conclusiones importantes. La estadística implica información, números y gráficas para resumir la información; y su interpretación. El término estadística posee varios significados para personas de diversos entornos e intereses. Para algunos, se trata de un medio para recolectar y representar grandes cantidades de información. Para otros, se trata de un medio para “lomar decisiones de frente a la incertidumbre”. En la perspectiva idónea, cada uno de estos puntos de vista es correcto. El terreno de la estadística puede dividirse en dos áreas: estadística descriptiva y estadística inferencial. La estadística descriptiva es en lo que piensa la mayoría de las personas al escuchar la palabra estadística ya que incluye la recolección, presentación y descripción de los dalos' muéstrales. El término estadística inferencial se refiere a la técnica de interpretación de los valores resultantes de las técnicas descriptivas y a la toma de decisiones y obtención de conclusiones sobre la población. La estadística es más que sólo números; son los datos, lo que se hace con los dalos, lo que se aprende de los datos y las conclusiones resultantes.

2-CONCEPTO DE ESTADISTICA La estadística según Kendall y Buckland: La estadística según Gini; La estadística según Spiegel: La estadística según Yale y Kendall:

3. CLASIFICACIÓN DE ESTADISICA

El terreno de la estadística puede dividirse en dos campos de aplicación: estadística descriptiva y estadística inferencial. 3.1 Estadística Descriptiva Tiene por objeto fundamental la obtención, presentación, análisis y descripción de un conjunto de datos. “Estudia las técnicas que se utilizan para describir o caracterizar los datos obtenidos”.

3.2 Estadística Inferencial Abarca las técnicas que permiten utilizar los datos muéstrales para inferir o extraer conclusiones sobre las poblaciones de las cuales fueron obtenidos dichos datos. “Incluye las técnicas que emplean los datos obtenidos en la muestra, para, a partir de ellos, hacer inferencias sobre sus respectivas poblaciones”

4. COMPONENTES DE UNA INVESTIGACIÓN ESTADISICA

Los componentes son: 4.1 Población: Es una colección o conjunto' de individuos, objetos o dalos que el investigador está interesado en estudiar. En un experimento, la población es el grupo más grande del cual se pueden tomar los elementos que participarán en dicho experimento. Para definirla es necesario tener en cuenta las siguientes características:

Homogeneidad: los miembros de la población deben tener características semejantes.

Tiempo: período de tiempo donde se ubica la población de interés.

Espacio, lugar donde se ubica la población de interés.

La población puede ser: • Finita; se pueden enumerar todos los elementos de la población.

• Infinita; no se pueden enumerar todos los elementos de la población.

Cuando la información deseada está disponible para todos los objetos de la población, se tiene lo que se llama “censo”. Las restricciones de tiempo, dinero y otros recursos hacen que un censo sea, generalmente, impráctico o infactible.

4.2 Muestra Es un subconjunto de la población, que se escoge a través de un proceso llamado muestreo

La estadística es un valor resumido, calculado, con base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra.

La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivos, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares

La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos; asi como para sacar conclusiones válidas y lomar decisiones razonables basadas en tal análisis.

La estadística es la ciencia que traía de la recolección, clasificación y presentación de tos hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos..

Page 2: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

2

Unidad 1Estadística: concepto. Estadística descriptiva e Inferencial. Variables. Población. Muestra. Tipos de muestra. Parámetro y

Estadístico. Unidad de observación. Inferencia estadística. Variable. Clasificación. Recopilación de datos. Obtención de la información. Fuentes de información. Etapas de estudio de una investigación estadística. Representación de datos estadísticos: Tablas y gráficos estadísticos para variables cualitativas y cuantitativas.

1. Definición de Estadística

La Estadística Es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados precisos o unas previsiones para el futuro. La estadística, en general, es la ciencia que trata de la recopilación, organización presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de decisión más efectiva. La estadística es una parte de la matemática que trata de establecer las características comunes de una cantidad de datos. La palabra tiene tres significados: la palabra estadística, en primer término se usa para referirse a la información estadística;

también se utiliza para referirse al conjunto de técnicas y métodos que se utilizan para analizar la información estadística; y el

término estadístico, en singular y en masculino, se refiere a una medida derivada de una muestra. La Estadística trata de la

recolección, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar

conclusiones.

Utilidad e Importancia

Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas descriptivas. Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis de resultados en deportes; administradores de instituciones; en la educación; organismos políticos; médicos; y por otras personas que intervienen en la toma de decisiones. Es decir los datos pueden surgir de diferentes campos, como experimentos médicos con el fin de determinar el efecto de una nueva droga, el control de calidad de productos industriales elaborados en una fábrica, para la medición de la opinión pública, etc. Con respecto a la investigación su papel es actuar como una herramienta en el diseño investigaciones, en el análisis de datos y en la extracción de conclusiones a partir de ellos. División de la Estadística

La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial. Estadística Descriptiva: Consiste sobre todo en la presentación de datos en forma de tablas y gráficas. Esta comprende

cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin factores pertinentes

adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como tales; es decir trata solamente de describir

y analizar un grupo dado sin sacar conclusiones de un grupo mayor.

Estadística Inferencial: Se deriva de muestras, de observaciones hechas sólo acerca de una parte de un conjunto numeroso

de elementos y esto implica que su análisis requiere de generalizaciones que van más allá de los datos; es decir trata las

condiciones bajo las cuales las inferencias para un grupo mayor son validas. Como consecuencia, la característica más

importante del reciente crecimiento de la estadística ha sido un cambio en el énfasis de los métodos que describen a

métodos que sirven para hacer generalizaciones. La Estadística Inferencial investiga o analiza una población partiendo de una

muestra tomada.

Método Estadístico

El conjunto de los métodos que se utilizan para medir las características de la información, para resumir los valores individuales, y para analizar los datos a fin de extraerles el máximo de información, es lo que se llama métodos estadísticos. Los métodos de análisis para la información cuantitativa se pueden dividir en los siguientes seis pasos: 1. Definición del problema. 2. Recopilación de la información existente (recolección de datos). 3. Obtención de información original. 4. Clasificación. 5. organización y representación de datos. 6. Análisis de datos. 7. obtención de conclusiones. Errores Estadísticos Comunes

Al momento de recopilar los datos que serán procesados se es susceptible de cometer errores así como durante los cómputos de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitación y que no son tan fácilmente identificables. Algunos de estos errores son: Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o estado mental pueda influir en la recopilación y en el análisis de la información. En estos casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan su opinión que a aquellos que la contradicen. Un caso extremo de sesgo sería la situación donde primero se toma una decisión y después se utiliza el análisis estadístico para justificar la decisión ya tomada.

Page 3: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

3

Datos no comparables: el establecer comparaciones es una de las partes más importantes del análisis estadístico, pero es

extremadamente importante que tales comparaciones se hagan entre datos que sean comparables.

Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas hacia el futuro es uno de los errores

que más ha desacreditado el uso del análisis estadístico.

Muestreo Incorrecto: En la mayoría de los estudios sucede que el volumen de información disponible es tan inmenso que se

hace necesario estudiar muestras, para derivar conclusiones acerca de la población a que pertenece la muestra. Si la muestra

se selecciona correctamente, tendrá básicamente las mismas propiedades que la población de la cual fue extraída; pero si el

muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen nada

Población: Estadísticamente, la población se define como un conjunto de individuos o de objetos que poseen una o

varias características comunes. No se refiere esta definición únicamente a los seres vivientes; una población puede estar

constituida por los habitantes de un país o por los peces de un estanque, así como por los establecimientos comerciales de

un barrio o las unidades de vivienda de una ciudad. Es la totalidad de valores posibles de una característica de un grupo

específico de objetos; en definitiva una población es el conjunto de todos los elementos a los que se somete a un estudio

estadístico.

Este conjunto debe estar bien definido, de tal forma que se puedan distinguir quienes pertenecen o no a dicho conjunto.

Una población puede ser finta o infinita. Se dice que es finita si esta compuesta por una cantidad finita, determinable de elementos .es infinita si no se puede determinar la cantidad de elementos que posee, sin embargo Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aquí el término infinito no está siendo tomado con el rigor semántico de la palabra; por ejemplo, los peces dentro de un estanque son un conjunto finito; sin embargo, en términos estadísticos, puede ser considerado como infinito.

Muestra: Es cualquier subconjunto de la población que estudiamos, seleccionada de acuerdo con una regla o un plan, se pide que sea representativa; es decir que todos los elementos de la población tengan la misma posibilidad de ser elegidos, o sea que sea aleatoria. Por lo general es poco practico medir a todos los miembros de una población por lo tanto es necesario seleccionar una muestra de la población con el objeto de estudiarla. La precisión de la investigación depende en gran parte de la forma en que la muestra es escogida.

En la práctica, estudiar todos y cada uno de los elementos que conforman la población no es aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos, porque a veces es necesario destruir lo que se está midiendo, por ser demasiado grande el número de sus componentes o no se pueden controlar; por eso se recurre al análisis de los elementos de una muestra con el fin de hacer inferencias respecto al total de la población. Existen diversos métodos para calcular el tamaño de la muestra y también para tomar los elementos que la conforman. Hay que tener en cuenta que la muestra debe ser representativa de la población y sus elementos escogidos al azar para asegurar la objetividad de la investigación.

En definitiva, Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población.

Muestreo: El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población.

Tipos de muestra

En la práctica se han encontrado varias clases o tipos de muestras. Las características que distinguen a un tipo de otro son: la manera de obtención de la muestra; el número de variables y el fin para el que fue extraída la muestra.

La manera de obtención de la muestra o sea el muestreo es muy importante y pueden agruparse, según su método de selección, en dos grandes clases:

a) Las que se seleccionan por criterio: La selección de la muestra es fijada por cierto tipo de criterio subjetivo de manera que no todos los miembros de la población tienen la misma posibilidad de ser elegidos y por lo tanto no resulta objetivo realizar generalizaciones.(a esto se llama muestra no aleatoria). En este caso los sesgos pueden influir para evitar que ciertos miembros de la población no sean seleccionados.

b) Las que se seleccionada azar: Cuando la muestra es seleccionada de tal forma que todos los elementos de la población tienen la misma oportunidad de ser elegidos, se llama aleatoria. Es decir cada elemento de la población tiene una probabilidad conocida de pertenecer a la muestra.

Recordamos que una buena muestra es aquella a partir de la cual pueden hacerse generalizaciones respecto a la población, mientras que una mala muestra es aquella que no permite tales generalizaciones. Por lo tanto una buena muestra debe ser aleatoria y representativa de la población de estudio.

Existen diferentes tipos de muestreo:

a) Muestreo aleatorio simple: Se obtiene al azar y todos los elementos de la población tienen la misma probabilidad de ser elegidos y se elige un elemento por vez. Puede hacerse a través de diferentes procedimientos como el método de los números aleatorios; El método consiste en enumerar todos los elementos de una población y luego utilizar tablas de números aleatorios o la función random de la calculadora, o sorteo aleatorio.

Page 4: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

4

b) Muestreo sistemático: El procedimiento comienza eligiendo el primer elemento al azar simple y después se seleccionan los elementos cada k-ésimo unidad de la población.

c) Muestreo estratificado: Se divide la población en grupos o clases llamados estratos, dentro de cada uno de los estratos los elementos están situados de manera más homogénea con respecto a las características que están estudio. Luego, para cada estrato se toma una submuestra mediante el procedimiento aleatorio simple. Es frecuente que se tome la misma proporción por cada estrato.

d) Muestreo por conglomerados: Se selecciona primero al azar los grupos, llamados conglomerados y se toma luego todos los elementos o una submuestra de ellos dentro de cada conglomerado. Se puede llevar acabo en varias etapas.

Parámetro: Número resultante de una manipulación de ciertos datos pertenecientes a una población, de acuerdo con determinados procedimientos específicos. Por ejemplo el promedio de inasistencia semanal de un determinado colegió. Mas adelante veremos que utilizáremos algunas letras para referirnos a estos valores.

Estadístico: Número resultante de una manipulación de ciertos datos pertenecientes a una muestra, de acuerdo con determinados procedimientos específicos. Comúnmente, usamos un estadístico que se calcula a partir de una muestra para estimar el parámetro de una población.

Unidad de observación: Es un solo miembro de la población que estudiamos. También se lo denomina individuo, Un individuo o unidad estadística es cada uno de los elementos que componen la población.

Inferencia estadística: Una inferencia estadística es una conclusión obtenida de una población completa desde la información

tomada de una muestra. Este es un proceso por el cual se atribuyen a la población completa características mas significativas que se obtuvieron y midieron en una muestra. Dicho proceso no es infalible pero en la mayoría de los casos, podemos predecir un margen de error y asignar toda la validez del estudio. Una cuidadosa conducción de la investigación estadística produce generalmente una muy confiable información.

Por ejemplo supongamos que un sociólogo desea hacer un estudio de la relación entre la salud y el ingreso. La población en estudio podría estar constituida por todos los matrimonios con hijos o sin ellos. Después de seleccionar una muestra de parejas, el sociólogo mide en cada una el ingreso total anual y su estado de salud del momento, la mortalidad infantil, las condiciones sanitarias, el registro de vacunación, las visitas al medico, el numero de ausencias a la escuela provocadas por enfermedades, etc. El sociólogo obtendrá estadísticos de los resultados de estas mediciones y aplicara los mismos haciendo una inferencia estadística para informar acerca de la población completa.

Frecuencia: Es la cantidad de veces que un elemento se repite en un conjunto. La frecuencia es arbitraria pero debe haber dos por lo menos.

Variable: Una variable es un número, (cantidad o medida) o denominación es un conjunto de valores medidas, u observaciones que estudia las características comunes a todos los elementos de la población. Al hacer investigaciones estadísticas uno efectúa mediciones

sobre las unidades de observación. Estas mediciones pueden ser cuantitativas o cualitativas. En otras palabras una variable estadística es cada una de las características o cualidades que poseen los individuos de una población.

Para introducir una variable se debe tener en cuenta la característica o cualidad que se va a estudiar de manera que la población quede dividida en grupos bien diferenciados. Las variables deben cumplir con:

Deben ser una característica que se pueda diferenciar.

Distintos grupos de presentación tienen diferentes tipos de frecuencia.

Las variables deben introducir diferencias sustanciales en el grupo

Introducir variables y establecer la frecuencia en la que se presenta la variable es la única forma que tiene la estadística para describir la población

CLASIFICACIÓN DE VARIABLES

Dependiendo del pipo de característica o cualidad que se a estudiar, se puede clasificar las variables en: CUANTITATIVAS o CUALITATIVAS.

Variables Cualitativas: Se refieren a características, atributos, actitudes o cualidades asociados a la unidad de

observación, que no pueden ser medidas con números. Es decir Las variables cualitativas se refieren a características o

cualidades que no pueden ser medidas con números.

Por ejemplo: La variable que se refiere al color de ojos puede tomar valores como azul, marón, negro etc. O también registro de opiniones, jerarquía, agrupamiento de personas por razas, lugar de nacimiento, conducta del alumno, entre otras.

Las variables cualitativas se dividen en Ordinales y Nominales.

La variable cualitativa nominal: No admite orden de jerarquía; es decir Una variable cualitativa nominal presenta

modalidades no numéricas que no admiten un criterio de orden .Por ejemplo: El estado civil, con las siguientes

modalidades: soltero, casado, separado, divorciado y viudo. Lugar de nacimiento, sexo (si), carrera, profesión, color de ojos,

de cabello, afiliación política, etc.

La variable cualitativa ordinal: Admite jerarquía, tiene un orden jerárquico (escalas); es decir Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden.

Page 5: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

5

Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, Medallas de una prueba deportiva: oro, plata, bronce. Grado de opinión, notas cualitativas, grado de escolaridad.

Variable Cuantitativa: Es la que se expresa mediante un número, son de dimensión o capacidad y dependiendo de que

tipo de número se trate se pueden clasificar en cuantitativas Discretas y cuantitativas Continuas. Por ejempló estatura, peso, profundidad, longitud, tiempo, volumen, área, etc.

Variable cuantitativa Discreta aquella que toma valores aislados, es decir no admite valores intermedios entre dos

valores específicos. Se utiliza para contar es decir los valores de la variable se pueden enumerar. Por ej. Cantidad de

hermanos, cantidad de hermanos, etc. El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua una variable continua es aquella que puede tomar valores comprendidos entre dos números

enteros, es decir, todos los valores de un intervalo, los valores se pueden medir. Existen infinitos Valores. Son de dimensión

o capacidad, por ejemplo: La altura de los 5 amigos: 1,73; 1,82; 1,77; 1,69; 1,75; el peso, profundidad, longitud, tiempo,

volumen, área, etc.

VARIABLE DEFINICIÓN EJEMPLO

CUALITATIVA

(indican

atributos,

características,

actitudes, etc.)

NOMINAL NO SE PUEDE ESTABLECER UN

ORDEN DE JERAQUIA

PROFESION, LUGAR DE

NACIMINETO

ORDINAL SE PUEDE ESTABLECER UN

ORDEN DE JERARQUIA

NOTAS CUAKITATIVAS,

GRADO DE OPINION

CUANTITATIVA

(indican

cantidades)

DISCRETA LOS VALORES POSIBLES SE

PUEDEN ENNUMERAR

CANTIDAD DE HERMANOS,

NUMERO DE ALUMNOS

CANTINUA LOS VALORES SE PUEDEN

MEDIR

ALTURA, PESO,

TEMPERATURA

ORGANIAZCIÓN DE DATOS ESTADISTICOS

Los datos estadísticos deben ser representados en forma efectiva, tanto como una ayuda para el análisis como para comunicar los resultados de este .Sin una preparación efectiva, los datos estadísticos pierden mucho de valor y de su impacto.

Los datos pueden ser organizados en:

Serie simple: Los datos son ordenados en forma creciente o decreciente.

Supongamos que los siguientes datos corresponden al resultado de un test de razonamiento.

62 88 79 92 86 87 83 78 41 67

68 76 46 81 92 77 84 76 70 66

77 75 98 81 82 81 87 78 70 60

99 79 52 82 77 81 77 70 74 61

La serie simple seria:

41 61 68 74 77 78 81 82 86 92

46 62 70 75 77 78 81 82 87 98

52 66 70 76 77 79 81 83 87 98

60 67 70 76 77 79 81 84 88 99

Page 6: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

6

Arreglo tronco y hojas: técnica que remen simultáneamente los datos numéricos y presenta una discusión

grafica de la distribución.

Para el ejemplo anterior las decenas serán los troncos y las unidades formaran las hojas:

Tablas de Frecuencias:

Las tablas de frecuencia sirven para ordenar los datos de una muestra y permitir que se pueda leer la información en forma mas clara o sea es un resumen de información respecto a una o más variables, que ofrezca claridad al lector sobre lo que se pretende describir. Podemos construir una tabla de frecuencia o distribución de frecuencia ya sea que los datos sean cualitativos o cuantitativos.

En una tabla de frecuencia podemos encontrar las siguientes simbolizaciones

N: Tamaño de

n: El tamaño de la muestra, es el número de observaciones.

Xi: La variable; es cada uno de los diferentes valores que se han observado. La variable Xi, toma los x1, x2... xm valores.

fi: La frecuencia absoluta o simplemente frecuencia, es el número de veces que se repite la variable Xi; así f1, es el número de veces que se repite la observación x1, f2 el número de veces que se repite la observación x2 etc.

Fi: La frecuencia acumulada, se obtiene acumulando la frecuencia absoluta.

hi: Frecuencia relativa; es el resultado de dividir c/u de las frecuencias absolutas por el tamaño de la muestra.

Hi: Frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre el tamaño de la muestra.

Intervalo de clase: Es un rango de números definido arbitrariamente por los números más altos y los más bajos de ella.

Frecuencia: Se refiere al número de veces que ocurre un valor particular o fenómeno.

Frecuencia de un intervalo: Se refiere al número de valores que ea dentro del intervalo.

Frecuencia relativa de un intervalo: Se refiere a la proporción de todos lo valores dados que caen dentro del intervalo.

Page 7: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

7

Aunque es difícil dividir la estadística en partes separadas, una división clásica hasta hace unos 30 años ha sido

entre estadística descriptiva y estadística inferencial.

La estadística descriptiva tiene como fin presentar resúmenes de un conjunto de datos y poner de manifiesto sus

características, mediante representaciones gráficas. Los datos se usan para fines comparativos, y no se usan

principios de probabilidad. El interés se centra en describir el conjunto dado de datos y no se plantea el extender

las conclusiones a otros datos diferentes o a una población.

La inferencia estadística, por el contrario, estudia los resúmenes de datos con referencia a un modelo de

distribución probabilístico o una familia de modelos, determinando márgenes de incertidumbre en las estimación

de los parámetros desconocidos del mismo. Se supone que el conjunto de datos analizados es una muestra de

una población y el interés principal es predecir el comportamiento de la población, a partir de los resultados en la

muestra.

Inferencia: conclusión que se obtiene al finalizar un estudio estadístico. En todo estudio estadístico hay que seguir una serie de pasos hasta llegar a las conclusiones finales (inferencia) que normalmente se dan en forma de gráficos, ya que es la manera más sencilla de entender los resultados del estudio estadístico. Se comienza por determinar que se quiere estudiar y a continuación se hace una elección del tipo y la cantidad de los datos que se van a utilizar. Pasos: una vez definida la población, se introducen las variables y surgen los subconjuntos estos tienen el mismo valor de la variable, de la población se obtiene la muestra de estudio la cantidad de elementos que forman prte de un conjunto no son los mismos siempre hay diferencias a esto se llama frecuencia. No todos los valores de la variable tienen la misma frecuencia de aparición. Advertencia: si al introducir las variables se produce una misma frecuencia de presentación, quiere decir que la variable introducida no es la correcta (es una constante) porque no da ninguna característica de la población que se quiere estudiar o sea que si la variable no produce subgrupos no sirve.

Siguiendo este proceso, de recolección de datos, se procede a organizar los datos a tabularlos (tabulación de la información) Tabular significa: hacer tablas de frecuencias, en estas tablas lo que se hace es organizar los datos en función de los valores que toma la variable y la frecuencia con que aparece cada uno de estos valores y por ultimo producir los graficos correspondientes y obtener una conclusión para efectuar una acción

Distribución de frecuencias y Representación Gráfica

Gráficos Estadísticos: Sirven para entender de manera más rápida y sencilla los resultados de un estudio

estadístico.

El método grafico consiste en representar los datos obtenidos de un estudio estadístico, mediante figuras

simples que faciliten las comparaciones y permitan de inmediato describir hechos y relaciones que podrían pasar

desapercibidos en las tablas.

A pesar de la gran ayuda que prestan las tablas y cuadros con información organizada, no todos los públicos alcanzan a comprenderla o no disponen del tiempo suficiente para analizarla. Es por ello que la mayoría de los investigadores acostumbran a reforzar la descripción a través de dibujos, generalmente con formas geométricas, que ayudan a visualizar el comportamiento de las variables tratadas. Una gráfica o diagrama estadístico es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables allí relacionadas. Se debe elegir el grafico que mas se adecue al tipo de estudio realizado y para ello se observan las variables de

estudio.

Componentes de una gráfica

Una gráfica, al igual que un cuadro o una tabla, debe constar de:

Page 8: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

8

0102030405060708090

a

l

u

m

n

o

s

Municipios de Residencia

fi Cantidad de alumnos del I.F.D.R Nº 6.018 de otras Localidades

Título adecuado: El cual debe ser claro y conciso, que responda a las preguntas: Qué relaciona, cuándo y dónde se hicieron las observaciones o sea que describa el contenido del grafico. El cuerpo: o gráfico en sí, cuya elección debe considerar el o los tipos variables a relacionar, el público a quien va dirigido y el diseño artístico del gráfico. Notas de pie de gráfico: Donde se presentan aclaraciones respecto al gráfico, las escalas de los ejes, o se otorgan los créditos a las fuentes respectivas.

Principales tipos de gráficos

Gráficos para variables cualitativas

Gráficos de barras: Consiste en representar mediante barras la magnitud de las frecuencias referidas a una tabla. El

gráfico de barras, como su nombre lo indica, está constituido por barras rectangulares de igual ancho, conservando la misma distancia de separación entre sí. El eje horizontal de la gráfica, representa frecuencias absolutas o relativas y el otro eje los valores de la variable. Se utiliza básicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el tiempo, cuando el número de ítems es reducido. Son útiles para comparar datos y se utilizan para variables cualitativas; si la variable es cualitativa nominal la posición o el orden de las barras no importa, pero si es cualitativa ordinal el orden o la posición si importan. Tipos de gráficos de barras:

a) Gráficos de barras simples: representan una sola serie de datos Ejemplo, un estudio realizado con una variable cualitativa nominal.

Población: Todos los alumno que asisten al I.F.D.R Nº 6.018 en H. Irigoyen.

X/Xi Es un alumno del I.F.D.R. Nº 6.018

Variable: Municipio donde viven los alumnos del I.F.D.R Nº 6.018.

Xi Municipio fi hi

Oran 80

Pichanal 41

Irigoyen 35

Ingenio 6

Embarcación 4

Colonia santa Rosa

8

N=174

Ejemplo de variable cualitativa ordinal Xi nivel de escolaridad.

Xi fi hi Fi Hi

Analfabeto 40

Primaria 120

Secundaria 85

Terciario 35

Universitaria 27

Postgrado 10 b) Grafico de barras múltiples: representan dos o mas series de datos. Son adecuados para efectuar comparaciones.

Gráfico de Sectores Circulares: Usualmente llamado gráfico de pastel, debido a su forma característica de una circunferencia dividida en cascos, por medio de radios que dan la sensación de un pastel tajado en porciones.

Page 9: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

9

Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el número de ítems no es superior a 5 y se quiere resaltar uno de ellos. Para su construcción se procede de la siguiente forma: La circunferencia tiene en su interior 360 grados, los cuales hacemos corresponder al total de la información, es decir al 100%; luego, para determinar el número de grados correspondiente a cada componente se multiplica el porcentaje respectivo por 360 y se divide por 100, los cuales se miden con la ayuda de un transportador para formar los casquetes de los diferentes ítems.

Gráficos para variables cuantitativas.

Grafico de bastón: se utiliza cuando la variable es cuantitativa discreta. Por ejemplo: nota, número de hijos,

cantidad de materias aprobadas.

Variable cuantitativa discreta: Xi: Aplazos de los alumnos de segundo año de la carrera de matemática.

Xi fi hi Fi Hi fp

0 2

1 4

2 7

3 10

4 5

5 2

6 1

7 0

otros 0

Histograma:

Es una representación gráfica de una tabla de frecuencias de una variable cuantitativa continua. Los intervalos de clase, que pueden ser o no ser iguales, y están marcados sobre el eje horizontal. Las frecuencias absolutas o relativas están marcadas sobre el eje vertical. El histograma se construye por medio de rectángulos unidos cuyos anchos son las de los intervalos de clase que ellos representan, y cuyas alturas representan a las frecuencias absolutas o a las frecuencias relativas y sus frecuencias acumuladas respectivas.

Los rectángulos tienen sus bases sobre el

eje horizontal con centros en las marcas de

clase y medida igual al tamaño de los

intervalos de clase y superficies

proporcionales a las frecuencias.

Page 10: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

10

Polígono de frecuencia. Es una forma geométrica obtenida de segmentos de recta que unen los puntos medios de intervalos de clase adyacentes en un histograma. Cerramos el polígono al prolongar los segmentos de recta de los extremos de tal forma que encuentren al eje horizontal en el punto medio de la clase hipotética siguiente.

Se trata de un grafico de líneas trazado sobre las marcas de clase y se obtiene uniendo los puntos medios de los techos de los rectángulos del histograma. Se utiliza únicamente en variables cuantitativas continuas. La forma de los polígonos de frecuencia no es infinita, la idea es encontrar una función de manera que relacione cada valor de la variable con su respectiva frecuencia. Para trazar un polígono de frecuencias usamos segmentos de recta que conecten los puntos medios de

La frecuencia acumulada relativa o frecuencia acumulada en porcentajes, es la frecuencia acumulada dividida por

la frecuencia total.

Observación:

Distribuciones de frecuencias relativas: Las representaciones de distribuciones de frecuencias relativas pueden

obtenerse del histograma o del polígono de frecuencias, cambiando la escala vertical de frecuencia a frecuencia

relativa, conservándose el mismo diagrama, se conocen también como histogramas porcentuales.

Distribuciones de frecuencias acumuladas u ojiva: El grafico que representa esta frecuencia se llama polígono de

frecuencias acumuladas u ojiva.

Distribuciones de frecuencias relativas acumuladas: Para representarlas se realiza el polígono de frecuencias con

las frecuencias relativas acumuladas en el eje vertical; también se las conoce como ojiva porcentual.

Ojiva: es la representación grafica de la frecuencia absoluta acumulada.

En la ojiva se representan los puntos extremos superiores de los intervalos.

Page 11: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

11

Curvas de frecuencias. Curva suavizada:

Es el proceso de alisar las esquinas del polígono de frecuencias de tal forma que se obtenga una curva suave,

sugiriendo la forma básica de la distribución de números.

El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extraída de una

población grande. Si se realizan muchas observaciones sobre la población, es posible teóricamente (para datos

cuantitativos continuos) elegir los intervalos de clase muy pequeños y todavía tener un número adecuado de

observaciones dentro de cada clase. Así se tiene que, el polígono de frecuencias relativas de una población grande

puede estar formada por muchos pequeños segmentos rectos que aproximan el conjunto a una curva, las curvas

de este tipo pueden llamarse curvas de frecuencias o curvas de frecuencias relativas respectivamente.

en definitiva se trata de aproximar el polígono de frecuencias a través de una curva

Es razonable esperar que tales curvas teóricas provengan de la suavización de los polígonos de frecuencias o de

los polígonos de frecuencia relativa a la muestra, la aproximación es tanto más exacta conforme aumenta el

tamaño de la muestra. Por esta razón una curva de frecuencia se conoce como un polígono de frecuencia

suavizado.

De una forma analógica las ojivas suavizadas provienen de la suavización de los polígonos de frecuencias

acumuladas u ojivas normalmente es mas sencillo suavizar una ojiva que un polígono de frecuencias

Tipos de curvas de frecuencias: puede ser simétrica, sesgada a la derecha, sesgada la izquierda, en forma de j, en

forma de jota invertida, bimodal, multimodal.

Preguntas para los finales:

¿Cuál es la diferencia entre un polígono de frecuencias y una ojiva?

Distribución de frecuencias. Uso de tablas y graficas. Tablas de frecuencias: Frecuencias absolutas, relativas y acumuladas. Tablas con datos agrupados. Gráficos estadísticos: Histogramas. Polígonos de frecuencia. Diagramas de barras. Gráficos circulares.

Page 12: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

12

MMeeddiiddaass ddee CCeennttrraalliizzaacciióónn Análisis y resumen de la información. Para comparar poblaciones se debe de buscar las características comunes a ellas; y esto implica, encontrar una variable que genere características diferentes a una misma situación. Para poder comparar las poblaciones tendremos que reducir la información de la población a una sola cantidad; a esto se llama reducción o resumen de datos.

La fase previa de cualquier estudio estadístico se basa en la recogida y ordenación de datos; esto se realiza con la ayuda de los resúmenes gráfico visto en la unidad anterior y los numéricos que veremos a continuación.

En la unidad anterior se describió en forma grafica el resumen de los datos pero el análisis estadístico necesita con frecuencia sintetizar las características básicas de un conjunto total de números en un resumen numérico de datos que consista solo en uno o dos números. Los resúmenes numéricos de datos presentan dos características básicas:

Una medición representativa; un valor que, en algún sentido, representa a todas las medidas del conjunto, llamada medida de centralización.

Un indicador de cuanto varían las mediciones o están dispersas con respecto a otra o con respecto de algún valor central, llamada medida de dispersión.

Las medidas de centralización sirven para hacer comparaciones entre poblaciones y además implica que todos los datos deben reducirse a una sola cantidad para poder compararlas. Para calcular una medida de centralización hago uso de todos los valores de la muestra o de la población Medidas de centralización o de posición: La medida de centralizacion de un conjunto de datos es la disposicion de estos para agruparse ya sea alrededor del centro o de ciertos valores numericos, es decir, Son los valores alrededor de los cuales estan concentrados los datos. Se pretende que la medida de posicion sea representativa del conjunto, ya que como se dijo, indica la ubicación del centro de la distribucion o la medicion mas representativa en un conjunto. Existen principalmente tres medidas de tendencia central: la media, la mediana y la moda.

aa)) MMeeddiiaa aarriittmmééttiiccaa (( 𝑿 )) La media aritmética o simplemente media es el promedio aritmético de un conjunto de datos, que denotaremos por 𝑋 , y se obtiene al dividir la suma de todos los valores observados de la variable entre el número total de observaciones. Calculo de la media: si calculamos la media de una población se simboliza con la letra 𝜇 y si se calcula de una muestra se

simboliza con 𝑿 .

PPaarraa ddaattooss ssiinn aaggrruuppaarr

Para la muestra 𝑥 = 𝑥𝑖

𝑛

𝑛𝑖=1 =

𝒙𝟏+𝒙𝟐+⋯+𝒙𝒊+⋯+𝒙𝒏

𝒏

𝑥 ∶ 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑥𝑥𝑖 :𝑉𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑋𝑛:𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠

Para la población 𝜇 = 𝑥𝑖

𝑁𝑁𝑖=1

PPaarraa ddaattooss aaggrruuppaaddooss

Serie de frecuencias simples 𝑥 = 𝑥𝑖 ∙𝑓𝑖

𝑛𝑘𝑖=1 para variables cuantitativa discretas.

Serie de datos por intervalo 𝑥 = 𝑥𝑖𝑚 ∙𝑓𝑖

𝑛𝑘𝑖=1 para variables cuantitativas continúas.

IInntteerrpprreettaacciióónn:: La interpretación de la media viene dado por el promedio de los datos observados y actúa como un centro de masa o equilibrio significa que el peso de los datos de la izquierda es igual al peso de los datos de la derecha. Sin embargo no significa que exista una misma cantidad de datos a la izquierda y ala derecha.

VVeennttaajjaass ee iinnccoonnvveenniieenntteess:: La media aritmética viene expresada en las mismas unidades que la variable y es única. Solo se aplica a variables cuantitativas. En su cálculo intervienen todos los valores de la distribución. Su principal inconveniente es que se ve afectada por los valores extremadamente grandes o pequeños de la

distribución. La media hace uso de todos lo datos recogidos ya sea de la población o de la muestra, por eso se dice que es la mas

representativa.

EEjjeemmpplloo ppaarraa ddaattooss ssiinn aaggrruuppaarr Sea xi / es el numero de notas de un examen parcial de probabilidad y estadística 1. 2, 1, 3, 4, 5, 10, 9

𝒙 = 𝒙𝒊

𝒏

𝒏

𝒊=𝟏

= 𝒙𝟏 + 𝒙𝟐 + ⋯+ 𝒙𝒊+⋯+𝒙𝒏

𝒏=

𝟐 + 𝟏 + 𝟑 + 𝟓 + 𝟏𝟎 + 𝟗

𝟕=

𝟑𝟒

𝟕= 𝟒,𝟖 ≅ 𝟓

Variable: puntuación en un examen parcial de probabilidad y estadistica1. Tipo: Cuantitativa Discreta. Interpretación: el promedio de las notas del examen parcial fue de 5.

EEjjeemmpplloo ppaarraa ddaattooss aaggrruuppaaddooss:: Para serie de datos simples: Si tenemos la siguiente distribución, se pide hallar la media aritmética de la cantidad de materias aprobadas por los alumnos de segundo año de matemática. Variable: cantidad de materias aprobadas.

Page 13: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

13

Tipo de variable: Cuantitativa discreta Xi /cantidad de materias

aprobadas fi Xi fi

1 2 2

2 2 4

3 2 6

4 1 4

5 4 20

6 2 12

8 5 40

9 3 27

10 2 20

N = 23 135

𝑥 = 𝑥𝑖 ∙ 𝑓𝑖𝑛

𝑚

𝑖=1

= 1 ∙ 2 + 2 ∙ 2 + 3 ∙ 2 + 4 ∙ 1 + 5 ∙ 4 + 6 ∙ 2 + 8 ∙ 5 + 9 ∙ 3 + 10 ∙ 2

23=

135

23= 𝑥 = 5,87 ≅ 6 → 𝑥 = 6

𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑚𝑎𝑡𝑒𝑟𝑖𝑎𝑠 𝑎𝑝𝑟𝑜𝑏𝑎𝑑𝑎𝑠 𝑝𝑜𝑟 𝑙𝑜𝑠 𝑎𝑙𝑢𝑚𝑛𝑜𝑠 𝑒𝑠 6

PPaarraa sseerriiee ddee ddaattooss ppoorr iinntteerrvvaallooss: Si los datos están agrupados en intervalos, la expresión de la media aritmética, es la misma, pero utilizando la marca de clase (𝑋𝑖𝑚 ). Variable Xi /Xi es el peso de las alumnas de la carrera de turismo. Tipo: cuantitativa continua.

Xi fi Xi m Xi m fi

[45,50) 2 47,5 95

[50,55) 2 52,5 105

[55,60) 2 57,5 115

[60,65) 1 62,5 62,5

[65,70) 4 67,5 270

[70,75) 2 72,5 145

[75,80) 5 77,5 387,5

[80,85) 3 82,5 247,5

[85,90) 2 87,5 175

n = 23

bb)) MMeeddiiaannaa ((MMee)) Dada una distribución de frecuencias con los valores ordenados de menor a mayor, llamamos mediana y la representamos por 𝑀𝑒, al valor de la variable, que deja a su izquierda el mismo número de frecuencias que a su derecha, es decir es el valor de la variable que se encuentra en la mitad de los datos previamente ordenados.

IInntteerrpprreettaacciióónn:: En una serie de datos ordenados el valor de la mediana es aquel número, que puede o no ser un valor de la variable, que divide al conjunto de datos en dos partes iguales de manera que: El 50 % de los datos son menores o iguales al valor de la mediana y el otro 50 % son mayores o iguales al valor de la mediana.

50 % 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 ≤ 𝑚𝑒 ≤ 50 % 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 La mediana deja igual número de datos por debajo y por arriba de ella. Calculo de la mediana: Variara según el tipo de dato. Pero para calcular la mediana los datos deben estar ordenados.

PPaarraa ddaattooss ssiinn aaggrruuppaarr,, VVaarriiaabblleess ddiissccrreettaass nnoo aaggrruuppaaddaass Si 𝒏 es impar, entonces 𝑴𝒆 = 𝑿

𝒏+𝟏

𝟐 , o sea si la cantidad de datos es impar, la mediana será el valor que ocupa la

posición del medio de los datos ordenados.

Si 𝒏 es par, entonces 𝑴𝒆 =

𝑿𝒏𝟐

+𝑿 𝒏𝟐

+𝟏

𝟐, o sea si la cantidad de datos es par, la mediana será el promedio de los dos

valores centrales de los datos ordenados.

EEjjeemmpplloo: Sean los valores de 𝑋𝑖 : 1, 2, 4, 8, 10; 𝑛 = 5

La posición donde se encuentra la mediana será 𝑛+1

2=

5+1

2 = 3 ⟹ 𝑚𝑒 = 𝑋3 = 4

EEjjeemmpplloo: Xi: 4, 8, 10, 11, 15, 20 ⇒ 𝑛 = 6 o sea existen dos valores que ocupan la posición del medio. Hay dos medianas por lo que hay que sacar el promedio de ellas.

𝑀𝑒 =

𝑋𝑛2

+𝑋𝑛2

+1

2 =

𝑋3+𝑋4

2=

10+11

2 = 3 ⟹ 𝑀𝑒 = 10,5

𝒙 ≅ 𝟕𝟎 El peso promedio de las alumnas de turismo es de 70 kg.

La marca de clase es el punto medio entre los límites de

cada clase o intervalo. Xi m =𝑽𝑴𝑨𝑿 𝒊−𝑽𝒎𝒊𝒏𝒊

𝟐=

𝑳𝑺−𝑳𝑰

𝟐

𝒙 = 𝒙𝒊𝒎 ∙ 𝒇𝒊

𝒏

𝒏

𝒊=𝟏

= 𝟏.𝟔𝟎𝟐,𝟓

𝟐𝟑= 𝟔𝟗,𝟔𝟕𝟑𝟗

Page 14: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

14

PPaarraa DDaattooss AAggrruuppaaddooss DDiissttrriibbuucciióónn ddee FFrreeccuueenncciiaass SSiimmpplleess:: Es el valor de la variable cuya frecuencia acumulada contenga a

𝒏

𝟐.

Se observa cual es la primera 𝐹𝒊 que supera o iguala a 𝑛

2, distinguiéndose dos casos:

EEjjeemmpplloo:: Sea la distribución 𝑥𝑖 cantidad de días que una mujer va al gimnasio en un mes 𝑥𝑖 𝑓𝑖 𝐹𝑖 1 3 3

2 4 7

5 9 16

7 10 26

10 7 33

13 2 35

𝑛 = 35

IInntteerrpprreettaacciióónn:: El 50 % de las mujeres van al gimnasio de 1 a 7 días por mes y el otro 50 % de mujeres va de 7 a 13 días al mes. O también la mitad de las mujeres va al gimnasio 7 días o menos por mes y la otra mitad va de 7 a 13 días por mes. El otro caso lo podemos ver en la siguiente distribución

𝑥𝑖 𝑓𝑖 𝐹𝑖 1 3 3

2 4 7

5 9 16

7 10 26

10 6 32

𝑛 = 32

DDiissttrriibbuucciióónn ddee FFrreeccuueenncciiaass aaggrruuppaaddaass ppoorr iinntteerrvvaallooss En este caso lo primero que hay que hacer es detectar en que intervalo está el valor mediano, o sea buscamos el número

(valor de la variable 𝑋𝑖 ) qué está en la posición del medio 𝑛

2. Dicho intervalo se denomina “𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚𝑒𝑑𝑖𝑎𝑛𝑜”.

El símbolo utilizado para el intervalo mediano es 𝑰𝒎𝒆= 𝑳𝑰;𝑳𝑺) ;

Es decir tenemos que mirar la columna de las frecuencias acumuladas 𝐹𝑖 y buscar el primer intervalo cuya frecuencia

acumulada sea mayor o igual a 𝑛

2, (𝐹𝑖 ≥

𝑛

2 o sea el 𝐹𝑖 que contenga a

𝑛

2), este será el intervalo mediano; antes de calcular la

mediana debemos distinguir dos casos:

a) Si 𝑭𝒊 =𝒏

𝟐, entonces la mediana es 𝑳𝒊correspondiente. 𝑴𝒆 = 𝑳𝒊 donde 𝑳𝒊 es el límite inferior del intervalo mediano.

b) Si existe alguna frecuencia acumulada que contenga a 𝒏

𝟐, entonces 𝐅𝐢−𝟏 <

𝒏

𝟐 < 𝐅𝐢 y el intervalo de la mediana será

𝑰𝒎𝒆= 𝑳𝒊 ; 𝑳𝑺) ; después se aplica la siguiente formula.

𝐌𝒆 = 𝐿𝑖 +𝑛

2−Fi−1

𝐟𝐢∙ 𝐶

EEjjeemmpplloo Variable: Edad de los empleados de una empresa

n = 671 Interpretación: Del total de 671 empleados de una empresa la mitad de ellos tiene entre 20 a 30 años y la otra mitad 30 a 45

años.

𝐿𝑖 , 𝐿𝑠 𝑓𝑖 𝐹𝑖 20, 25

100 100

25, 30 150 250

30, 35 200 450

35, 40 180 630

40, 45 41 671

Li: Es el límite inferior del intervalo mediano n: Es la cantidad de datos observados. Fi-1: es la frecuencia absoluta acumulada del intervalo anterior el intervalo mediano fi : es la frecuencia absoluta del intervalo mediano. C : es la amplitud del intervalo

𝑛

2=

35

2= 17,5

𝐹𝑖 que contiene a 𝑛

2

Como se cumple que 𝑭𝒊−𝟏 <𝒏

𝟐 < 𝑭𝒊 ⟹16 <17,7< 26 ⟹ 𝑴𝒆 = 𝑿𝒊 por lo tanto Me = 7

En este caso 𝒏

𝟐= 𝑭𝒊 ⟹16 ⟹ 𝑀𝑒 =

𝑋1+𝑋𝑖+1

2 =

5+7

2=6

𝑛

2=

32

2= 16

𝐹𝑖 que contiene a 𝑛

2

671

2 = 335,5; 𝑚𝑒 Estará en el intervalo

30, 35 , por lo tanto tenemos:

𝑀𝑒 = 𝐿𝑖 +𝑛2−Fi−1

𝐟𝐢∙ 𝐶 = 30 +

33,5−250

200 ∙ 5= 32,138

Page 15: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

15

VVeennttaajjaass ee iinnccoonnvveenniieenntteess:: - Es la medida más representativa en el caso de variables que solo admitan la escala ordinal. - Es fácil de calcular. - En la mediana solo influyen los valores centrales y es insensible a los valores extremos. - En su determinación no intervienen todos los valores de la variable. La mediana sirve para comparar y es más representativa que la media cuando esta influenciada por valores muy extremos.

CC)) MMooddaa ((MMoo)) Es el valor de la variable que mas se repite o sea el que tiene mayor frecuencia absoluta o sea el mas común.

La moda es el valor de la variable que más veces se repite, y en consecuencia, en una distribución de frecuencias, es el valor

de la variable que viene afectada por la máxima frecuencia de la distribución. En distribuciones no agrupadas en intervalos se

observa la columna de las frecuencias absolutas, y el valor de la distribuci6n al que corresponde la mayor frecuencia será la

moda. A veces aparecen distribuciones de variables con más de una moda (bimodales, trimodales, etc), e incluso una

distribución de frecuencias que presente una moda absoluta y una relativa.

Para datos sin agrupar: Es el valor de la variable que mas se repite.

Distribución de Frecuencias simples: Es el Xi que tiene mayor frecuencia absoluta ( fi) Xi: Cantidad de hermanos

Xi fi hi Fi Hi

1 5 0,16 5 0,16

2 4 0,12 9 0,28

3 10 0,31 19 0,59

4 6 0,19 25 0,78

5 7 0,22 32 1

Distribución de Frecuencias agrupadas por intervalos de clase: En el caso de estar la variable agrupada en intervalos de clase, se define el intervalo modal, y se denota por [Li , Ls), como

aquel que posee mayor frecuencia absoluta (fi) y una vez identificado este, se emplea la siguiente formula:

Se calcula con la siguiente formula 𝑀𝑜 = 𝐿𝑖 +𝑑1

𝑑1+𝑑2∙ 𝑐

Donde: Variable: temperaturas máximas registradas durante 20 días en la ciudad de oran.

Xi fi Fi

[12; 20) 4 4

[20; 28) 7 11

[28, 36) 15 15

[36; 44) 5 20

𝐿𝑖: Limite inferior modal

𝑑1: es la diferencia entre 𝑓𝑖 − 𝑓𝑖−1

𝑑2: es la diferencia entre 𝑓𝑖 − 𝑓𝑖+1 C: amplitud del intervalo

Interpretación: La mayoría tiene 3 hermanos

La moda es tener 3 hermanos

Page 16: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

16

Medidas de dispersión En el análisis estadístico no basta el cálculo e interpretación de las medidas de tendencia central o de posición, ya que, por

ejemplo, cuando pretendemos representar toda una información con la media aritmética, no estamos siendo absolutamente

fieles a la realidad, pues como ya vimos suelen existir datos extremos inferiores y superiores a la media aritmética, los cuales,

a decir verdad, no están siendo bien representados por este parámetro.

Si tenemos dos informaciones con igual media aritmética, no significa este hecho, que las distribuciones sean exactamente

iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus datos.

Por ejemplo, los valores 1, 200, 399 tiene igual media aritmética, y mediana que los valores 199, 200, 201; sin embargo, para

la primera información la media aritmética, se encuentra muy alejada de los valores extremos 1 y 399, cosa que no ocurre

con la segunda información que posee igual media aritmética y mediana, vemos entonces que la primera información es mas

heterogénea o dispersa que la segunda, por lo tanto para datos muy dispersos la media no me es muy útil, de ahí que

necesitamos de un nuevo tipo de medida que me muestren cuando la media es representativa y cuando no, o sea cuando los

datos están muy dispersos de la media.

En definitiva, las medidas de dispersión indican la variación que tienen los datos con respecto a la media. Las medidas de

dispersión tratan de medir el grado de dispersión que tiene una variable estadística en torno a una medida de posición o

tendencia central, indicándonos lo representativa que es la medida de posición. A mayor dispersión menor representatividad

de la medida de posición y viceversa.

Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes indicadores: Rango o recorrido,

Desviación media, Varianza y desviación típica o estándar, Coeficiente de variabilidad.

1) RANGO O RECORRIDO Es la medida de dispersión más sencilla ya que solo considera los dos valores extremos de una colección de datos.

Se obtiene haciendo la diferencia entre el mayor y menor valor de la variable.

𝑹 = 𝑿𝒎𝒂𝒙 − 𝑿𝒎𝒊𝒏= medición mas grande – medición mas pequeña

Ej: Sea X, las indemnizaciones recibidas por cuatro trabajadores de dos empresas A y B

A 100 120 350 370

B 225 230 240 245

R (A) = 370 – 100= 270

R (B) = 245 – 225= 20 por lo tanto la Distribución menos dispersa es la de la empresa B.

Esta medida es poco utilizada debido a que únicamente considera el valor de los datos extremos sin considerar el

comportamiento de los demás datos.

Otros recorridos:

Rango intercuartílico: 𝑅 = 𝑄3 − 𝑄1

Intervalo interdecílico: 𝑅 = 𝐷9 − 𝐷1

Intervalo intercentílico: 𝑅 = 𝑃99 − 𝑃1

2) Desviación media: La desviación media, mide la distancia absoluta promedio entre cada uno de los datos, y el parámetro que caracteriza la

información. Usualmente se considera la desviación media con respecto a la media aritmética:

Nos indica las desviaciones con respecto a la media con respecto a la media aritmética en valor absoluto, o sea es el

promedio de las distancias de los datos respecto de la media.

Para datos sin agrupar

𝐷𝑚 = 𝑥𝑖 − 𝑋

𝑛

𝑛

𝑖=1

Ejemplo: obtener la desviación media de los siguientes datos 7, 16, 9, 22, 17, 23, 15 , 11, 25, 18, 13. (La media es 16)

𝐷𝑚 =9 + 0 + 7 + 6 + 1 + 7 + 1 + 5 + 9 + 2 + 3

11= 4,5

Esto significa que los datos se encuentran alejados en promedio 4,5 unidades de la media aritmética; es decir que la mayoría

de los datos están comprendidos entre 11,5 y 20,5. ¿Cuantos datos se encuentra en este intervalo, en donde su punto medio

es la media igual 16?

𝐷𝑚: Desviación media.

𝑥𝑖 : Son los diferentes valores de la

variable X.

𝑋 : Media Aritmética de la información.

𝑛: Tamaño de la muestra

𝑥 = 16 11,5 20,5

Quizás la imaginación no sea sino una

inteligencia que se divierte

Page 17: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

17

𝑫𝒎: Desviación media.

𝒙𝒊 : Son los diferentes valores de la variable X.

𝑿 : Media Aritmética de la información.

𝒇𝒊 : Cantidad de veces que se repite la

observación 𝒙𝒊

𝒏: Tamaño de la muestra.

𝒎 : Número de agrupamientos.

𝑫𝒎: Desviación media.

𝒙𝒊𝒎 : Es la marca de clase, del intervalo i.

𝑿 : Media Aritmética de la información.

𝒇𝒊 : Frecuencia absoluta correspondiente al intervalo i.

𝒏: Tamaño de la muestra.

𝒎: Número de intervalos.

Para datos agrupados Distribución de Frecuencias simples

Para obtener la desviación media cuando se tienen datos agrupados

𝐷𝑚 = 𝑥𝑖 − 𝑋 ∙ 𝑓𝑖

𝑛

𝑚

𝑖=1

Distribución de Frecuencias agrupadas por intervalos Para obtener la desviación media cuando se tienen datos agrupados en intervalos de clase

𝑫𝒎 = 𝒙𝒊𝒎 − 𝑿 ∙ 𝒇𝒊

𝒏

𝒎

𝒊=𝟏

Ejemplo 2: En la fábrica del Ingenio del Tabacal el salario de 142 empleados se muestra en la siguiente tabla:

Salarios en

miles de

pesos ($) 𝑋𝑖

Número de

empleados

𝑓𝑖

𝑥𝑖 ∙ 𝑓𝑖 𝑥𝑖 − 𝑋 𝑥𝑖 − 𝑋 𝑥𝑖 − 𝑋 ∙ 𝑓𝑖

1,4 36 50,4 -0,1838 0,1838 6,6168

1,5 42 63,0 -0,0838 0,0838 3,5196

1,6 23 36,8 0,0162 0,0162 0,3726

1,7 13 22,1 0,1162 0,1162 1,5106

1,8 11 19,8 0,2162 0,2162 2,3782

1,9 12 22,8 0,3162 0,3162 3,7944

2,0 5 10,0 0,4162 0,4162 2,081

𝑛 = 142 224,9 20,2732

La media aritmética del salario de 142 empleados del ingenio tabacal será:

𝑥 = 𝒙𝒊 ∙ 𝒇𝒊

𝒏

𝒎

𝒊=𝟏

=224,9

142= 1,5838

Es decir, el salario promedio de los 142 empleados es de$ 1.583,8

La desviación media es de:

𝑫𝒎 = 𝑥𝑖 − 𝑋 ∙ 𝑓𝑖

𝑛

𝑚

𝑖=1

=20,2732

142= 0,14277

Significa que los sueldos de los 142 empleados están desviados con respecto al sueldo promedio en $ 142,77; y que la

mayoría de los sueldos varían o están, entre $1.441,03 y $1.726,57.

¿Cuál será el error que se comete al reemplazar el ingreso salarial de cada uno de los 142 obreros por $1.538,8?

Ejemplo 3 Determinar la desviación media para el siguiente conjunto de datos

Variable Xi /Xi es el peso de las alumnas dela carrera de turismo. Tipo: cuantitativa continua.

Xi fi Xi m Xi m fi 𝒙𝒊𝒎 − 𝑿 𝒙𝒊𝒎 − 𝑿 𝒙𝒊𝒎 − 𝑿 ∙ 𝒇𝒊 [45,50) 2 47,5 95 -22,1739 22,1739 44,3478

[50,55) 2 52,5 105 -17,1739 17,1739 34,3478

[55,60) 2 57,5 115 -12,1739 12,1739 24.3478

[60,65) 1 62,5 62,5 -7,1739 7,1739 7,1739

[65,70) 4 67,5 270 -2.1739 2,1739 8,6956

[70,75) 2 72,5 145 2,8261 2,8261 5,6522

[75,80) 5 77,5 387,5 7,8261 7,8261 39,1305

[80,85) 3 82,5 247,5 12,8261 12,8261 38,4783

[85,90) 2 87,5 175 17,8261 17,8261 35,6522

n = 23 1.602,5 237,8261

No se preocupe por sus dificultades en

matemática. Yo puedo asegurarle que las

mías son todavía mayores. John Locke

Page 18: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

18

𝒙 = 𝒙𝒊𝒎∙𝒇𝒊

𝒏

𝒏𝒊=𝟏 =

𝟏.𝟔𝟎𝟐,𝟓

𝟐𝟑= 𝟔𝟗,𝟔𝟕𝟑𝟗 𝒙 ≅ 𝟕𝟎 El peso promedio de las alumnas de turismo es de 70 kg.

𝑫𝒎 = 𝒙𝒊𝒎 − 𝑿 ∙ 𝒇𝒊

𝒏

𝒎

𝒊=𝟏

=237,8261

23= 10,3401

Significa que los pesos de las alumnas de turismo están desviados con respecto al promedio de 69,6739 Kg en 10,3401 Kg.

Características de la desviación media:

Su cálculo está basado en todos los valores e indica la dispersión con relación a un promedio.

Al ignorarse los signos de las desviaciones, la medida no resulta adecuada para un manejo matemático.

3) Varianza: El problema de los signos en la desviación media, es eludido tomando los valores absolutos de las diferencias de los datos

con respecto a la media aritmética. Ahora bien, la varianza obvia los signos elevando las diferencias al cuadrado, lo cual

resulta ser más elegante, aparte de que es supremamente útil en el ajuste de modelos estadísticos que generalmente

conllevan formas cuadráticas.

La varianza es uno de los parámetros más importantes en estadística, se puede decir que, teniendo conocimiento de la

varianza de una población, se ha avanzado mucho en el conocimiento de la población misma.

En definitiva, la varianza es el promedio de los cuadrados de las desviaciones de los valores de la variable con respecto a su

media aritmética.

Se simboliza con 𝑆2 cuando trabajo con la muestra

Se simboliza con 𝜎2 cuando trabajo con la población

Para datos sin agrupar

𝑆2 = 𝑥𝑖 − 𝑋 𝟐𝒏

𝒊=𝟏

𝒏 − 𝟏 𝜎2 =

𝑥𝑖 − 𝑋 𝟐𝒏𝒊=𝟏

𝑵

La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética. Cuanto mayor sea

la varianza mayor dispersión existirá y por tanto menor representatividad tendrá la media aritmética.

La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas al cuadrado.

Para datos agrupados Distribución de Frecuencias simples

𝑆2 = 𝑥𝑖 − 𝑋 2 ∙ 𝑓𝑖

𝑛 − 1

𝑚

𝑖=1

𝜎2 = 𝑥𝑖 − 𝑋 2 ∙ 𝑓𝑖

𝑁

𝑚

𝑖=1

Distribución de Frecuencias agrupadas por intervalos

𝑆2 = 𝑥𝑖𝑚 − 𝑋 2 ∙ 𝑓𝑖

𝑛 − 1

𝑚

𝑖=1

𝜎2 = 𝑥𝑖𝑚 − 𝑋 2 ∙ 𝑓𝑖

𝑁

𝑚

𝑖=1

Características de la varianza

La varianza es matemáticamente lógica ya que considera los signos de los desvíos, de allí su ventaja con respecto a la desviación media.

La varianza no esta expresada en unidades originales, sino en una unidad al cuadrado. Esto es debido a la operación de elevar al cuadrado las desviaciones.

Cuando las varianzas son grandes se hace difícil su interpretación.

4) Desviación Típica o Estándar Debido a que la varianza no está expresada en unidades originales y para restaurarlas se obtiene la raíz cuadrada de esta

medida.

La desviación estándar es la raíz cuadrada de la varianza; o sea es la raíz cuadrada del promedio de los cuadrados de las

desviaciones de los valores respecto de su media aritmética del promedio.

Se simboliza con 𝑆 cuando trabajo con la muestra 𝑆 = 𝑆2 =

Se simboliza con 𝜎 cuando trabajo con la población 𝜎 = 𝜎2

Page 19: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

19

Para datos sin agrupar

𝑆 = 𝑆2 = 𝑥𝑖 − 𝑋 𝟐𝒏

𝒊=𝟏

𝒏 − 𝟏 𝝈 = 𝜎2 =

𝑥𝑖 − 𝑋 𝟐𝒏𝒊=𝟏

𝑵

Ejemplo obtener la varianza y la desviación estándar para los siguientes datos: 7, 16, 9, 22, 17, 23, 15, 11, 25, 18, 13. (La

media es 16)

𝑆2 = 𝑥𝑖 − 𝑋 𝟐𝒏

𝒊=𝟏

𝒏 − 𝟏=

92 + 0 + 72 + 62 + 12 + 72 + 12 + 52 + 92 + 22 + 32

10

𝑆2 =81 + 0 + 49 + 36 + 1 + 49 + 1 + 25 + 81 + 4 + 9

10= 33,6

Desviación estándar S= 33,6 = 5,7966

El promedio de cada dato se aleja de su media aritmética en 5,7966 unidades.

Para datos agrupados Distribución de Frecuencias simples

𝑆 = 𝑥𝑖 − 𝑋 2 ∙ 𝑓𝑖

𝑛 − 1

𝑚

𝑖=1

𝜎2 = 𝑥𝑖 − 𝑋 2 ∙ 𝑓𝑖

𝑁

𝑚

𝑖=1

Distribución de Frecuencias agrupadas por intervalos

𝑆2 = 𝑥𝑖𝑚 − 𝑋 2 ∙ 𝑓𝑖

𝑛 − 1

𝑚

𝑖=1

𝜎2 = 𝑥𝑖𝑚 − 𝑋 2 ∙ 𝑓𝑖

𝑁

𝑚

𝑖=1

Interpretación En promedio cada dato se aleja de su media en … unidades

Características de desviación típica

Al igual que la varianza, la desviación estándar se calcula en base a todos los valores. Mide la dispersión alrededor de la media y no con respecto a ciertos valores como el rango.

La desviación típica es matemáticamente lógica, ya que como la varianza, tiene en cuenta los signos positivos y negativos de los desvíos individuales.

Esta expresada en unidades originales lo que facilita su análisis e interpretación. Cuanto mayor es la desviación típica o estándar, mas dispersos están los datos respecto de la media

Page 20: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

20

Media geométrica: para datos sin agrupar, la media geométrica de una serie de números es la enésima raíz del

producto de esos números

Sea una distribución de frecuencias (xi, ni). La media geométrica, que denotaremos por G. se define como la raíz

n-ésima del producto de los n valores de la distribución.

G =

COMPARACIÓN ENTRE LA MEDIA MEDIANA Y LA MODA

La comparación entre la media, mediana y moda nos ofrece una gran ventaja a la hora de decidir cual de ellas

usar como medida de centralización de manera que los datos queden correctamente representados .

Sabemos que la media aritmética no siempre es la mas representativa, pues no siempre conviene usarla como

promedio porque es muy sensible a los valores extremos que causa que la distribución sea

Page 21: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

21

Trabajos prácticos

MMeeddiiddaass ddee CCeennttrraalliizzaacciioonn TTrraabbaajjoo pprraaccttiiccoo NNºº 33 1.- Clasifica en discretas o continuas las siguientes variables:

a) Número de habitantes por kilómetro cuadrado.

b) Número de bacterias de cierto tipo, por mililitro

c) intensidad que recorre un circuito electrónico cerrado.

d) Número de frutos de un árbol.

e) Velocidad de un vehículo al pasar por un determinado punto

f) Puntuaciones obtenidas en un test por un grupo de personas

g) Superficie dedicada a cierto cultivo, por hectáreas, en un municipio

h) Peso de un niño al cumplir 3 años

i) Número de alumnos de tu Instituto.

2.- De un examen realizado a un grupo de alumnos, cuyas notas se han evaluado del 1 al 8, se ha obtenido el siguiente cuadro estadístico:

Se pide: (a) Acabar de rellenar la tabla estadística. (b) Nº de alumnos que se han examinado. (c) Nº de alumnos que han obtenido una nota superior a 3 (d) % de alumnos que han sacado una nota igual a 6 (e) % de alumnos que han obtenido una nota superior a 4 (f) Nº de alumnos que han obtenido una nota superior a 2 e inferior a 5.

3.- Una fábrica empaqueta en lotes de 100 unidades, condensadores que produce. Se establece un plan de inspección por muestreo consistente en examinar, de cada lote, 20 condensadores elegidos al azar y rechazar el lote si de los 20 aparecen más de 4 defectuosos; almacenar el lote como “revisable” si el número de defectuosos es menor que 5 pero mayor que 1, y aceptarlo en otro caso. Se inspeccionan 52 lotes y resulta el siguiente número de condensadores defectuosos de cada muestra:

1 2 4 3 2 0 9 2 0 2 0 0 4 3 0 2 0 1 6 5 2 0 0 1 0 3

𝑋𝑖 𝑓𝑖 ℎ𝑖 𝐹𝑖 𝐻𝑖 1 4 0,08

2 4

3 0,16 16

4 7 0,14

5 5 28

6 38

7 7 0,14 45

8

Page 22: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

22

2 0 7 1 4 3 0 2 1 0 4 3 0 7 1 0 0 3 2 0 1 0 5 2 0 1

a) Construye la tabla de frecuencias absolutas y relativas del resultado de la inspección

b) Dibuja el diagrama de barras para los resultados de la inspección c) Dibuja el diagrama acumulativo de frecuencias.

Agrupa los resultados por lotes: Rechazados, revisables y aceptados y: d) Construye la tabla de frecuencias para los lotes e) Determina la proporción de lotes rechazados f) Representa la distribución de frecuencias mediante un histograma g) Dibuja el diagrama acumulativo de frecuencias h) Comenta las diferencias entre los resultados de los apartados c) y g)

4.- El precio del pan sufrió los siguientes incrementos: del 7% de 1990 a 1991, del 6% de 1991 a 1992, del 4% de 1992 a 1993, del 3% de 1993 a 1994 y de 1994 a 1995. ¿Cuál es el incremento medio anual de 1990 a 1995? 5.-Se ha realizado una encuesta en 30 hogares en la que se les pregunta el nº de individuos que conviven en el domicilio habitualmente. Las respuestas obtenidas han sido las siguientes:

4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3. a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. b) ¿Qué proporción de hogares está compuesto por tres o menos personas? ¿Qué proporción de individuos vive en hogares con tres o menos miembros? c) Dibuje el diagrama de frecuencias absolutas y el diagrama de frecuencias acumuladas. d) Agrupe por intervalos de amplitud 2 los valores de la variable, calcule su distribución de frecuencias y represente con los correspondientes gráficos las frecuencias absolutas y acumuladas. 6.-Por un error, un profesor borró la calificación obtenida por uno de diez alumnos. Si los otros nueve estudiantes obtuvieron 43, 66, 74, 90, 40, 52, 70, 78 y 92 y la media de las diez calificaciones es 67, ¿Qué calificación borró el profesor? 7.-Los siguientes datos muestran las ventas (en miles de pesos), de 20 vendedores de una CÍA. de computadores. 99,8 42,9 44,2 31,7 88,2 35,6 25,1 40,2 26,9 32,3 36,8 37,8 5,6 39,7 29,3 28,9 55,2 45,2 25,4 50,6 Calcule medidas de tendencia central. Interprete. 8.- Con el Objetivo de invertir en cierto proyecto, se ha tomado una muestra aleatoria de 100 semanas, respecto de la rentabilidad de las acciones de una empresa A (en %). Para ello se han recopilado los datos, los que se han resumido en la siguiente tabla:

Frecuencias

Rentabilidad Marca de clase Absoluta Relativa Absoluta acumulada Relativa acumulada 0,505; 5 ; 1,505 25 ; 1,755 50 ; 95 ;

a) Reconozca y clasifique la variable de estudio. b) Realice un gráfico adecuados a los datos. c) Determine las medidas de tendencia central.

Page 23: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

23

9.-Una empresa con el fin de contratar un grupo de empleados operarios aplicó una prueba a todos los postulantes, a cada uno se les asignó el mismo trabajo. Los datos obtenidos son los siguientes: tiempo (hrs.) postulantes 1,45 - 2,15 3 2,15 - 2,85 9 2,85 - 3,55 15 3,55 - 4,25 22 4,25 - 4,95 10 9,95 - 5,65 6 5,65 - 6,35 3 a. ¿Cuál es el tiempo de ejecución más común entre los postulantes?. b. La empresa contratará a todos los postulantes que tengan un tiempo de ejecución superior o igual a 4.5 hrs. ¿Cuál es el porcentaje de postulantes contratados?. c. La empresa asignará a otras labores a los empleados que tengan un tiempo de ejecución mayor o igual a 3.3 hrs. ¿Cuál es el porcentaje de empleados (contratados) que se encuentran en esta situación?.

Page 24: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

24

Completar y analizar el tipo de combustible que utilizan los automóviles de una provincia. Se considera una muestra de 100 autos.

Tipos de combustibles if ih iF iH ph

GASOIL 450

NAFTA 350

GAS 200

TOTAL

Examen 2014 Ejercicio 1: En los siguientes enunciados identifique la población, tamaño de la muestra, variable a medir, su clasificación y unidad de observación.

a) Supongamos que el dueño de la despensa “santa rosa”, ubicada en la ciudad de oran, le interesa averiguar si sus clientes consideran que son bien atendidos; para esto está planeando entrevistar a 100 de ellos y consultarles sobre la atención recibida clasificándola en muy buena, buena, regular y mala. (5p).

b) De una producción de 1.000 tuercas de la fabrica “Don Tomas” (obtenidas en el mes de julio), se extrajeron 40 y se midió su diámetro (5p)

c) Un investigador educativo quiere evaluar la efectividad de un nuevo método para enseñar a leer a estudiantes de la escuela para niños sordos “santa Cecilia”. Para ello toma un grupo de 30 alumnos elegidos al azar. El aprovechamiento al final de un periodo de enseñanza se mide con el resultado (malo, regular y bueno) del estudiante en un examen de lectura. (5p).

Ejercicio 2: en una fabrica se midieron los tiempos (en minutos) usados por 30 operarios para realizar una operación de

ensamble:

11,0 11,1 11,4 11,5 11,8 11,8 11,9 12,3 12,3 12,5 12,5 12,7 12,9 13,0 13,2 13,5 14,0 14,3 14,4 14,5 14,5 14,6 15,0 15,0 15,3 15,3 15,5 15,8 16,0 16,2

a) ¿Cuál es tiempo medio requerido para la operación? Utilice redondeo simétrico, con dos decimales (5p) b) ¿Cuál es el valor de la mediana? (3p) c) Calcule el 𝑷𝟐𝟑 e interprete el valor encontrado (3p) d) Complete:

Page 25: teoria

Carrera: Asignatura: Probabilidad y estadística Curso: Profesor: Blanco Víctor

25

El 80 % de los empleados utilizaron menos de……….minutos para realizar la operación (7p) El 25 % de los empleados utilizaron mas de …………. minutos para realizar la operación (7p)

Ejercicio 3: En cierto es establecimiento comercial se obtuvo el volumen de ventas diarias. Las observaciones se realizaron durante 150 días.

Volumen de ventas (miles de pesos)

𝑓𝑖 ℎ𝑖 𝐹𝑖 𝐻𝑖 % 𝑚𝑖

0 − 2 15 2 − 4 20 4 − 6 30 6 − 8 50 8 − 10 25 10 − 12 10

a) Complete la tabla de frecuencias. (Trabaje con 2 decimales y aplique redondeo simétrico) (5p) b) Represente el polígono de frecuencia asociado, usando 𝒉𝒊 (5p) c) Complete e intérprete cada uno de los valores obtenidos.

N (1p)

Media (5p)

Mediana (5p)

Moda (5p)

𝐷3 (5p)

𝑃90 (5p)