Antología de Probabilidad y Estadística I

72
Antología de Probabilidad y Estadística I COBACH PLANTEL 01 TUXTLA- TERAN TURNO MATUTINO AUTOR MC FRANCISCO JAVIER RUIZ CRUZ 18/08/2013

description

Es una antología muy completa de probabilidad y estadística, ideal para profesores de Cobach

Transcript of Antología de Probabilidad y Estadística I

Page 1: Antología de Probabilidad y Estadística I

Antología de Probabilidad y Estadística I COBACH PLANTEL 01 TUXTLA-TERAN TURNO MATUTINO

AUTOR MC FRANCISCO JAVIER RUIZ CRUZ

18/08/2013

Page 2: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Contenido Temático PROBABILIDAD Y ESTADISTICAS I

UNIDAD I RECOLECCION DE DATOS 1.1. TÉRMINOS BÁSICOS DE LA ESTADÍSTICA 1.1.1. Términos básicos de la estadística. 1.1.2. Definición de la Estadística. 1.1.3 Clasificación de la estadística. 1.1.4. Definición de: población, Muestra, Variable, dato(s), experimento, muestreo, parámetro, tipos de variables. 1.2 MÉTODOS DE MUESTREO. 1.2.1 Definición de muestreo, censo, poblaciones finitas e infinitas 1.2.2 Métodos de muestreo: aleatorio simple, sistemático, estratificado y por conglomerados. UNIDAD II REPRESENTACION TABULAR Y GRAFICA 2.1 DISTRIBUCIÓN DE FRECUENCIAS 2.1.1 Frecuencia absoluta, relativa y acumulada. 2.1.2 Construcción de una tabla de frecuencias para datos agrupados y no agrupados. 2.2 REPRESENTACIÓN GRAFICA Histograma Polígono de frecuencia Ojiva De barras Circular. UNIDAD III MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD 3.1 MEDIDAS DE TENDENCIAS CENTRAL * Media * Mediana * Moda 3.1.1 Datos no agrupados 3.1.2 Datos agrupados

Page 3: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

3.2 MEDIDAS DE VARIABILIDAD * Rango * Varianza * Desviación estándar 3.2.1 Datos no agrupados 3.2.2 Datos agrupados. UNIDAD IV PROBABILIDAD 4.1 Conceptos básicos y operaciones elementales en la teoría de conjuntos. 4.1.1 Definición de conjunto, conjunto universo, subconjunto. 4.1.2 Definición y representación con simbología y diagramas de: * Conjunto vació * Intersección * Unión * Complemento * Diferencia. 4.2 CONCEPTOS BÁSICOS DE PROBABILIDAD 4.2.1 Definición de experimento, espacio muestral, punto muestral y evento. 4.3 TÉCNICAS DE CONTEO. 4.3.1 Factorial de un número. 4.3.2 Principio de la multiplicación 4.3.3 Permutaciones y combinaciones CRITERIO DE EVALUACION 1.- EVALUACION ESCRITA ……………..100% 2.- TRABAJOS DE INVESTIGACION…. 100% 3.- TAREAS…………………………………100% 4.- ACTIVIDADES EXTRACLASE……….100% 5.- PARTICIPACION Y ASISTENCIA…...100% SUMA…………….100%

Page 4: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

BIBLIOGRAFÍA Básica: *Fuenlabrada Samuel, Probabilidad y Estadística. México. Edit Mc Graw Hill, 2012. * Kazmier J. Leonard, Estadística aplicada a la administración y a la economía Edit Mc Graw Hill; México 209 *Pastor Guillermo, Estadística Elemental, Edit Trillas, México, 2010. * Sánchez Octavio, Probabilidad y Estadística, Edit. Mc Graw Hill, México 2010. * Estadística elemental, Edit Mc Graw Hill, México 2007 * Elena Ruiz Ledesma, Elvia Ruiz Ledesma, Probabilidad y Estadística, Edit. Mc Graw Hill. México 2011 Complementaria: * Enciclopedia interactiva serie Matemáticas; Azar y Estadística, Lectus Vergara, Nech computers, el periódico. Página Web: www.aulaclic.org

Page 5: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Origen

El término alemán Statistik, que fue primeramente introducido por Gottfried Achenwall (1749), designaba originalmente el análisis de datos del Estado, es decir, la "ciencia del Estado" (también llamada aritmética política de su traducción directa del inglés). No fue hasta el siglo XIX cuando el término estadística adquirió el significado de recolectar y clasificar datos. Este concepto fue introducido por el militar británico Sir John Sinclair (1754-1835).

En su origen, por tanto, la Estadística estuvo asociada a los Estados, para ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La colección de datos acerca de estados y localidades continúa ampliamente a través de los servicios de estadísticas nacionales e internacionales. En particular, los censos suministran información regular acerca de la población.

Ya se utilizaban representaciones gráficas y otras medidas en pieles, rocas, palos de madera y paredes de cuevas para controlar el número de personas, animales o ciertas mercancías. Hacia el año 3000 a. C. los babilonios usaban ya pequeños envases moldeados de arcilla para recopilar datos sobre la producción agrícola y de los géneros vendidos o cambiados. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XI a. C. Los libros bíblicos de Números y Crónicas incluyen en algunas partes trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 a. C. Los antiguos griegos realizaban censos cuya información se utilizaba hacia el 594 a. C. para cobrar impuestos

ESTADISTICA: La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.

La estadística se divide en dos grandes áreas:

La estadística descriptiva, se dedica a la descripción,

Page 6: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, clústers, entre otros.

La estadística inferencial, se dedica a la generación de los modelos,

inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. Hay también una disciplina llamada estadística matemática, la que se refiere a las bases teóricas de la materia. La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas criminales, entre otros.

Población debe entenderse el total de los elementos que conforman a un conjunto. Por ejemplo el total de las manzanas producidas en la Huerta LA FLOR o bien el número total de empleados de una empresa.

Muestra Es un conjunto de elementos extraídos de un conjunto mayor a fin de conocer aproximadamente las características de la población de donde proviene.

El conocimiento exacto de una población requiere un estudio muy detallado, mientras que una muestra solo permite resultados aproximados pero su tiempo y costo de realización son, por lo general, menores que el estudio de la población.

ESTUDIO DE LA POBLACION ESTUDIO DE LA MUESTRA

Conocimiento exacto

Mucho tiempo requerido

Alto costo

Conocimiento aproximado

Rápido

Económico

Una población puede clasificarse como finita cuando el número de elementos que la componen es limitado como son el número de ballenas en el mundo, o bien es infinita cuando el número de sus elementos es muy grande, como los granos de arena del mar o francamente no medibles como son las estrellas del universo.

Page 7: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Una muestra puede ser grande o pequeña, en función del número de elementos que lo contenga. Convencionalmente se dice que una muestra es grande si tiene 30 o más elementos.

En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población.

Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población.

Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la población sino estimar también los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa pero sí podemos actuar de manera que esta condición se alcance con una probabilidad alta.

En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral.

Técnicas de muestreo

Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso en el proceso de selección). Cuando este último cumple con la condición de que todos los elementos de la población tienen alguna oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada sujeto de la población es conocida de antemano, recibe el nombre de muestreo probabilístico. Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante.

Muestreo probabilístico

Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcular la probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque en ocasiones no es posible optar por él. En este caso se habla de muestras probabilísticas, pues no es en rigor correcto hablar de muestras representativas dado que, al no conocer las características de la población, no es posible tener certeza de que tal característica se haya conseguido.

Page 8: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Sin reposición de los elementos: Cada elemento extraído se descarta para la subsiguiente extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla seleccionada.

Con reposición de los elementos: Las observaciones se realizan con reemplazamiento de los individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición aunque, realmente, no lo sea.

Con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición. Cada elemento extraído se descarta para la subsiguiente extracción.

Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.

Muestreo estratificado

Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos con respecto a alguna característica de las que se van a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra. Dentro de cada estrato se suele usar la técnica de muestreo sistemático, una de las técnicas de selección más usadas en la práctica.

Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos técnicas de muestreo estratificado:

Asignación proporcional: el tamaño de la muestra dentro de cada estrato es proporcional al tamaño del estrato dentro de la población.

Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más variabilidad. Para ello es necesario un conocimiento previo de la población.

Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que contenga también esos mismos porcentajes de hombres y mujeres.

Para una descripción general del muestreo estratificado y los métodos de inferencia asociados con este procedimiento, suponemos que la población está

Page 9: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

dividida en h subpoblaciones o estratos de tamaños conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean homogéneas respecto a la característica en cuestión. La media y la varianza desconocidas para el i-ésimo estrato son denotadas por mi y si

2, respectivamente.

Muestreo sistemático

Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n el tamaño de la muestra. Determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenómeno.

Esto quiere decir que si tenemos un determinado número de personas que es la población (N) y queremos escoger de esa población un número más pequeño el cual es la muestra (n), dividimos el número de la población por el número de la muestra que queremos tomar y el resultado de esta operación será el intervalo, entonces escogemos un número al azar desde uno hasta el número del intervalo, y a partir de este número escogemos los demás siguiendo el orden.

Muestreo por estadios múltiples

Esta técnica es la única opción cuando no se dispone de lista completa de la población de referencia o bien cuando por medio de la técnica de muestreo simple o estratificado se obtiene una muestra con unidades distribuidas de tal forma que resultan de difícil acceso. En el muestreo a estadios múltiples se subdivide la población en varios niveles ordenados que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla en varias fases o extracciones sucesivas para cada nivel.

Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un país determinado, éstos pueden subdividirse en unidades primarias representadas por circunscripciones didácticas y unidades secundarias que serían los propios profesores. En primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de cada una de las primarias seleccionadas en la primera extracción.

Muestreo por conglomerados

Técnica similar al muestreo por estadios múltiples, se utiliza cuando la población se encuentra dividida, de manera natural, en grupos que se supone que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la

Page 10: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio.

Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es decir, los miembros del grupo, o sólo se le podría aplicar a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de simplificar la recogida de información muestral.

Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la muestra, el diseño se llama muestreo bietápico.

Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer método funciona mejor cuanto más homogénea es la población respecto del estrato, aunque más diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre sí.

Homogeneidad de las poblaciones o sus subgrupos

Homogéneo siginifica, en el contexto de la estratificación, que no hay mucha variabilidad. Los estratos funcionan mejor cuanto más homogéneos son cada uno de ellos respecto a la característica a medir. Por ejemplo, si se estudia la estatura de una población, es bueno distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya menos variabilidad, es decir, sean menos heterogéneos. Dicho de otro modo, no hay tantas diferencias entre unas estaturas y otras dentro del estrato que en la población total.

Por el contrario, la heterogeneidad hace inútil la división en estratos. Si se dan las mismas diferencias dentro del estrato que en toda la población, no hay por qué usar este método de muestreo. En los casos en los que existan grupos que contengan toda la variabilidad de la población, lo que se construyen son conglomerados, que ahorran algo del trabajo que supondría analizar toda la población. En resumen, los estratos y los conglomerados funcionan bajo principios opuestos: los primeros son mejores cuanto más homogéneo es el grupo respecto a la característica a estudiar y los conglomerados, si representan fielmente a la población, esto es, contienen toda su viariabilidad, o sea, son heterogéneos.

Muestreo de juicio

Aquél para el que no puede calcularse la probabilidad de extracción de una determinada muestra. Se busca seleccionar a individuos que se juzga de

Page 11: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

antemano tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la información aportada por esas personas es vital para la toma de decisiones.

Muestreo por cuotas

Es la técnica más difundida sobre todo en estudios de mercado y sondeos de opinión. En primer lugar es necesario dividir la población de referencia en varios estratos definidos por algunas variables de distribución conocida (como el género o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte proporcional de población que representan. Finalmente se multiplica cada peso por el tamaño de n de la muestra para determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado en que una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato.

Muestreo de bola de nieve

Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en contacto entre sí. Consiste en identificar sujetos que se incluirán en la muestra a partir de los propios entrevistados. Partiendo de una pequeña cantidad de individuos que cumplen los requisitos necesarios estos sirven como localizadores de otros con características análogas.

Muestreo subjetivo por decisión razonada

En este caso las unidades de la muestra se eligen en función de algunas de sus características de manera racional y no casual. Una variante de esta técnica es el muestreo compensado o equilibrado, en el que se seleccionan las unidades de tal forma que la media de la muestra para determinadas variables se acerque a la media de la población.

DISTRIBUCIONES DE FRECUENCIA

La capacidad humana para comprender al mismo tiempo grandes cantidades de datos es muy limitada, por otra parte, la mayoría de los análisis estadísticos incluyen un gran número de datos, los cuales sería casi imposible utilizar si no se les compactara mediante un sencillo procedimiento conocido como TABLA DE DSITRIBUCION DE FRECUENCIAS.

UNA DISTRIBUCION DE FRECUENCIAS es una tabla que presenta el número de elementos que pertenecen a cada una de las clases o categorías en las que se halla dividido para su estudio un grupo de datos.

Las distribuciones de frecuencias son la forma más común de organizar un gran número de datos, por ejemplo, las calificaciones de los alumnos del primer

Page 12: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

semestre de bachillerato en una escuela pública y a partir de ellas lograr conclusiones que no eran visibles originalmente. Por ejemplo, la concentración de calificaciones en sus niveles bajo, medio y alto; incluso permiten definir líneas de decisión, como los precios al mayoreo de cierto artículo, las tarifas de agua potable para una ciudad o las tablas de impuesto sobre la renta que se aplica en un país.

Conceptos fundamentales de una distribución de frecuencias son:

a) Numero de clases o categorías en que se agruparan los datos b) El intervalo o ancho de la clase, delimitado por los valores mínimos y máximos

aceptables en cada clase c) La frecuencia o número de elementos de cada clase. d) Las marcas de clase o valores centrales de cada intervalo e) La frecuencia relativa f) Las frecuencias acumuladas y complementarias g) Los limites exactos.

INTERVALOS UNIFORMES, DESIGUALES O ABIERTOS

A pesar de que en la mayoría de los casos el ancho de la clase es uniforme. Como se ve a continuación

CLASE LIMITE INFERIOR LIMITE SUPERIOR FRECUENCIA

A 500 699 12

B 700 899 23

C 900 1099 15

D 1100 1299 21

E 1300 1499 19

Sin embargo el ancho de la clase debe ser desigual o incluso abierto

CLASE LIMITE INFERIOR (años)

LIMITE SUPERIOR ( años)

Bebe 0 1

Niños 2 12

Adolescentes 13 16

Jovenes 17 25

Adultos 26 60

Ancianos 60 --

CLASE LIMITE INFERIOR ( kg)

LIMITE SUPERIOR ( Kg)

Ligero -- 45

Medio 46 60

Pesado 61 80

Muy pesado 81 --

Page 13: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

El intervalo también conocido como RANGO, AMPLITUD o ANCHO DE CLASE, puede determinarse como:

AMPLITUD= LIMITE SUPERIOR-LIMITE INFERIOR DE LA CLASE

AMPLITUD= Xmax- Xmin

Una consideración importante es el número de clases o categorías en las que se va a dividir o agrupar a los datos.

Si se ha decidido que el ancho de cada clase sea uniforme entonces se calcula:

ANCHO= AMPLITUD / NUMERO DE INTERVALOS QUE SE DESEA TENER

Para la elaboración de una tabla de distribución de frecuencia es necesario: a) Recopilación de los datos b) Clasificación de los datos de menor a mayor c) Especificación del número de clases d) Calculo del tamaño exacto del ancho de clases e) Determinación del tamaño ajustado del ancho de clase f) Identificación de los limites de clase g) Conteo de los datos

La estructura de una tabla de distribución de frecuencia queda definida por los límites inferior y superior de cada clase. El primer límite inferior puede ser el valor más pequeño de los datos. El primer límite superior podría ser el valor más grande de los datos. El primer límite superior es el límite inferior mas el ancho de la clase menos una unidad de variación. Los límites inferior y superior de las siguientes clases se obtienen sumando el ancho de clase al valor de la clase anterior.

Límite Inferior Límite Superior

500 700 900 1100 1300

699 899 1099 1299 1499

En todos los casos debe comprobarse que la diferencia entre los límites superior e inferior de cada clase es igual al ancho de clase menos la unidad de variación. LS-LI = Ancho- UV

Page 14: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

El último paso de este proceso consiste en determinar la frecuencia de la clase, esto es, determinar mediante el conteo, el número de elementos incluidos en cada clase. La MARCA de CLASE es el punto medio entre los límites de una clase. Se calcula sumando el límite inferior y el superior de cada clase y dividiendo el resultado entre dos. MARCA DE CLASE (mc)= Limite superior + Limite inferior de cada clase 2 Una forma o método para determinar el número de clases es: Numero de clases = √ numero de datos

EJERCICIOS PARA PRACTICAR. 1.- Clasifique los siguientes valores en 4 clases de tamaño uniforme:

23.1 64.9 48.3 72.8 42.9

37.7 43.6 68.4 52.3 29.4

58.9 39.4 35.1 58.2 70.4

68.1 52.9 57.1 48.4 62.8

22.7 26.3 30.5 29.8 60.4

SOLUCION

a) Obtenemos el valor del rango de la población: Rango= Xmax – Xmin Rango= 72.8 – 22.7= 50.1

b) Obtenemos el valor de la amplitud de cada clase Amplitud= Rango / Num de intervalos que desees Amplitud = 50.1 / 4 = 12.52

c) El valor de los limites serian El primer límite inferior de la clase 1 es el valor mínimo de la población, Es decir Limite Inferior = Lim Inf= 22.7 A partir de este dato podemos conocer el valor del otro extremo al que conoceremos como Limite Superior de la clase Limite Sup de la clase 1 = Limite Inferior + Amplitud Lim Sup = 22.7 + 12.52 = 35.22 Límite superior de la clase 2 sera = 35.22 + 12.52 = 47.74

Page 15: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Límite superior de la clase 3 = 47.74 + 12.52 = 60.26

d) La tabla de distribución de frecuencia quedara de la siguiente manera:

Num Clase Frecuencia (f)

1 22.7 – 35.22 07

2 35.22 – 47.74 04

3 47.74 – 60.26 07

4 60.26 – 72.8 07

suma 25

2.- Clasifique los siguientes valores en 4 clases de tamaño uniforme:

145 90 175 140 80

105 135 160 155 110

190 110 150 175 134

155 120 165 125 126

75 185 120 170 110

3.- Determine los límites exactos, las marcas de clase y obtenga un grafico de las siguientes tablas de distribución de frecuencias

Límite inferior Límite superior frecuencia

37.7 50.3 62.9 75.5

50.2 62.8 75.4 88

23 19 22 21

4.-Determine los limites exactos, las marcas de clase y obtenga un grafico de las siguientes tablas de distribución de frecuencias

Límite inferior Límite superior frecuencia

504 596 688 780 872

595 687 779 871 963

21 19 22 23 20

5.-A continuación se presenta los valores de las estaturas (en cm) de un grupo de 5o Grado de Educación primaria

130 122 128 132 137 124 125

Page 16: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

152 124 134 134 138 140 131

118 152 130 140 150 112 110

134 115 120 146 145 125 148

120 125 132 135 142 130 152

a) Elaborar una tabla de frecuencias agrupando en intervalos de clase a tu

elección b) Obtén el Rango c) Construye un polígono de frecuencia d) Construye un grafico de pastel e) Construye una ojiva

SOLUCION

Obtenemos el valor del rango de la población: Rango= Xmax – Xmin Rango= 152 – 110= 42

El numero de clases a utilizar =√35 = 5.92 clases = 6

Obtenemos el valor de la amplitud de cada clase Amplitud= Rango / Num de intervalos que desees Amplitud = 42 / 6= 7

El valor de los limites serian El primer límite inferior de la clase 1 es el valor mínimo de la población, Es decir Limite Inferior = Lim Inf= 110 A partir de este dato podemos conocer el valor del otro extremo al que conoceremos como Limite Superior de la clase Limite Sup de la clase 1 = Limite Inferior + Amplitud Lim Sup = 110 + 7 = 117 Límite superior de la clase 2 sera = 117 + 7 = 124 Límite superior de la clase 3 = 124 + 7 = 131

La tabla de distribución de frecuencia quedara de la siguiente manera:

Num Clase Frecuencia (f) MC

1 110 - 117 03 113.5

2 117 – 124 06 120.5

3 124 – 131 08 127.5

Page 17: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

4 131 - 138 08 134.5

5 138 – 145 04 141.5

6 145 - 152 06 148.5

suma 35

Para calcular las marcas de clase de cada categoría realizamos el siguiente

cálculo. Marca de clase(MC)= Lim Superior + Lim Inferior de cada clase 2 MC = 110+117= 127 = 113.5

2 2 MC = 117+124= 141 = 120.5

2 2 Para obtener el grafico del pastel es necesario encontrar la frecuencia relativa (fr)

Num Clase Frecuencia (f)

MC Fr FA FAr Area o Sector

1 110 - 117 03 113.5 03/35= .085 00+03=03 03/35=0.085 0.085 x 360= 30.60°

2 117 – 124 06 120.5 06/35=0.171 03+06=9 06/35=0.256 0.171 x 360= 61.56”

3 124 – 131 08 127.5 08/35=0.228 09+08=17 17/35=0.486 0.228 x 360 = 82.08°

4 131 - 138 08 134.5 08/35=0.228 17+08=25 25/35= 0.714 0.228 x 360 = 82.08°

5 138 – 145 04 141.5 04/35=0.114 25+04=29 29/35=0.828 0.114 x 360 = 41.04°

6 145 - 152 06 148.5 06/35=0.171 29+06=35 35/35= 1 0.171 x 360 = 61.56°

suma 35 0.997= 1

Page 18: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

La ojiva se obtiene utilizando los valores de la frecuencia acumulada

6- A continuación se presenta los valores de las estaturas (en cm) de un grupo de

4 Grado de Educación primaria

133 122 128 132 137 127

151 124 134 134 138 146

119 152 130 140 150 114

133 115 120 146 145 123

121 125 132 135 142 132

a) Elaborar una tabla de frecuencias agrupando en intervalos de clase a tu elección

b) Obtén el Rango c) Construye un polígono de frecuencia d) Construye un grafico de pastel e) Construye una ojiva

SOLUCION

Obtenemos el valor del rango de la población: Rango= Xmax – Xmin Rango= 152 – 114= 38

Page 19: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

El numero de clases a utilizar =√30 = 5.47 clases = 5

Obtenemos el valor de la amplitud de cada clase Amplitud= Rango / Num de intervalos que desees Amplitud =38 / 5 = 7.6

El valor de los limites serian 114 + 7.6 = 121.6 121.6 + 7.6=129.2

La tabla de distribución de frecuencia se obtendrá de la siguiente manera:

Num Clase Frecuencia (f) MC

1 114-121.6 05 117.8

2 121.6-129.2 06 125.6

3 129.2. -136.8 09 132.4

4 136.8 -144.4 04 139

5 144.4- 152 06 147.6

suma 30

Para calcular las marcas de clase de cada categoría realizamos el siguiente cálculo.

Marca de clase(MC)= Lim Superior + Lim Inferior de cada clase 2 MC = 114+121.6= 235.6 = 117.8

2 2 MC = 121.6+129.2=250.8 = 125.6

2 2 El grafico de pastel se obtendrá utilizando las frecuencias relativas

La frecuencia relativa = frecuencia de cada clase/ Número total de datos

Page 20: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Num Clase Frecuencia (f) MC Fr Area o sector FA

1 114-121.6 05 117.8 05/30= 0.16 0.16 x 360=57.6 0+5=5

2 121.6-129.2 06 125.6 06/30=0.20 0.20 x 360= 72 5+6=11

3 129.2. -136.8 09 132.4 09/30=0.30 0.30 x 360 = 108 11+9=20

4 136.8 -144.4 04 139 04/30=0.13 0.13 x 360 = 46.8 20+4=24

5 144.4- 152 06 147.6 06/30=0.20 0.20 x 360= 72 24+6=30

suma 30

El grafico de líneas representa la que vamos a conocer como ojiva y tomaremos para ello los valores de las frecuencias acumuladas

PRESENTACIONES GRAFICAS

Page 21: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Una grafica vale más de mil palabras, dice el refrán. Esto es particularmente cierto

en el caso de los análisis estadísticos, donde los datos al natural e incluso

tabulados pueden ser abrumadores y difíciles de comprender.

Las graficas estadísticos más comunes son:

HISTOGRAMA.- Es un diagrama de barras que representa, a escala, el numero de

elementos que comprende cada una de las clases de una distribución de

frecuencias. La altura de las barras del histograma esta determinada por la

frecuencia de cada una de las clases, mientras que los limites horizontales son los

limites exactos de cada clase, aunque en ocasiones los limites horizontales son

los limites nominales, de esta manera las barras quedan separadas entre si.

EL POLIGONO DE FRECUENCIAS es una figura cerrada delimitada en su base

por el eje horizontal y cuyos vértices son los puntos centrales de la horizontal

superior de cada barra del histograma, incluyendo también la clase anterior a la

primera y la clase siguiente a la última.

Page 22: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

GRAFICO DE PASTEL

Las graficas de pastel o gráficos circulares son figuras que representan por medio

de segmentos de círculo, la frecuencia absoluta o relativa de una tabla de

distribución de frecuencias.

La presentación de datos en esta forma es impresionante, sobre todo cuando se

les añade efectos visuales tales como color y grosor a los segmentos o se separa

algunos de ellos del centro.

Esta graficas se prepara en base en el ángulo que resulta de multiplicar 360 por la

frecuencia relativa

ANGULO DE LA CLASE = 360 * (frecuencia de la clase/ total de frecuencias)

Aplicaciones graficas y numéricas

Las graficas de la frecuencia acumulada y complementaria ofrecen información no

visible originalmente; cualquiera de sus puntos indica la relación entre un valor del

Page 23: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

eje horizontal y su correspondiente valor en el eje vertical. De esta manera es

posible determinar en forma grafica , con la aproximación que permita el dibujo, la

frecuencia que corresponde a un cierto limite o el limite que corresponde a una

cierta frecuencia.

MEDIDAS DE TENDENCIA CENTRAL

La estadística descriptiva en su función básica de reducir datos, propone una serie

de indicadores que permiten tener una percepción rápida de lo que ocurre en un

fenómeno.

En otras palabras las Medidas de tendencia central: Son indicadores estadísticos

que muestran hacia qué valor (o valores) se agrupan los datos.

La primera gama de indicadores corresponde a las “Medidas de Tendencia

Central”. Existen varios procedimientos para expresar matemáticamente las

medidas de tendencia central, de los cuales, los más conocidos son: la media

aritmética, la moda y la mediana.

Media Aritmética

La media aritmética de n observaciones de la variable X se denotará por

el símbolo y se define como la suma de ellas dividida por n. Simbólicamente:

Ejemplo: La media aritmética de los números 3, 9, 12, 5 y 6 es:

Page 24: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Si se grafican estos puntos se obtiene:

En la figura es claro que la media aritmética corresponde geométricamente al punto de equilibrio de los datos.

El total de ventas de la empresa LA ESPERANZA S.A. de C.V. durante el año 2011 fue de $76229500. Determine e interprete el promedio de ventas por empleado considerando que la empresa tiene un total de 5214 empleados

El monto de ventas por empleados se obtiene:

Ventas por empleados= Total ventas Total empleados

Ventas por empleado= $76229500

• 5214

Ventas por empleado= $14260

Puede decirse que cada empleado contribuyo con $14,620.16 a los ingresos de la empresa.

En una tabla de frecuencias, la media aritmética se calcula suponiendo que todas las observaciones en una clase son iguales a su valor medio (mi), por lo que la contribución de la i-ésima clase a la suma es fimi. Por lo tanto, se calcula la media por la ecuación:

Page 25: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Esta ecuación también puede re-escribirse como:

Donde: fi = frecuencia de la clase i-ésima mi = Valor medio de la clase i-ésima fRi = Frecuencia relativa de la clase i-ésima Ejemplo: Calcular la media de la siguiente tabla de distribución de frecuencias:

intervalos Punto medio de clase (mi)

Conteo fi fAi FRi FRAi

(07.7 , 11.7] 9.7 ||||| ||||| ||||| ||| 18 18 18/90 18/90

(11.7 , 15.7] 13.7 ||||| ||||| ||| 13 31 13/90 31/90

(15.7 , 19.7] 17.7 ||||| ||||| ||||| ||||| ||||

24 55 24/90 55/90

(19.7 , 23.7] 21.7 ||||| ||||| ||||| || 17 72 17/90 72/90

(23.7 , 27.7] 25.7 ||||| ||||| ||| 13 85 13/90 85/90

(27.7 , 31.7] 29.7

0 85 0/90 85/90

(31.7 , 35.7] 33.7 |||| 4 89 4/90 89/90

(35.7 , 39.7] 37.7 | 1 90 1/90 90/90

TOTAL 90 90 90/90 90/90

Se tiene la siguiente fórmula:

Se van a tomar todos los valores de la tabla de la columna fi y mi ; se va a sustituir en la fórmula anterior y queda como:

Page 26: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

También la media se puede calcular con la formula:

Al tomar los datos de la Tabla de Frecuencias para fRi y mi y sustituirlos en la fórmula el resultado queda de la siguiente manera:

Note que los resultados son un poco diferentes por el número de decimales utilizados para los cálculos.

Si utilizamos los datos de la tabla anterior de distribución de frecuencias ( análisis de las estaturas de los niños de 5 grado de primaria tendríamos el siguiente valor)

La media = 4616.5 / 35 = 131.9

Mediana

Num Clase Frecuencia (f)

MC F (mc)

1 110 - 117 03 113.5 03 X 113.5= 340.5

2 117 – 124 06 120.5 06 X 120.5=723.0

3 124 – 131 08 127.5 08 X 127.5 =1020

4 131 - 138 08 134.5 08 X 134.5 =1076

5 138 – 145 04 141.5 04 X 141.5=566.0

6 145 – 152 06 148.5 06 X 148.5=891

suma 35 4616.5

Page 27: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

La mediana (Me) de un conjunto de n números ordenados de menor a mayor, es el número central en el arreglo. Si n es un número impar (non), sólo hay un valor central en el arreglo. Si n es un número par, hay dos valores centrales y la mediana debe tomarse como la media aritmética de estos dos valores.

Ejemplo: Calcular la mediana de los números 3, 9 , 12, 5 y 6

Primero hay que ordenar los números de menor a mayor:

3, 4, 6, 9, 12

Después se debe verificar si el valor de n es par o impar (non), en caso de ser par se toman los dos valores que estén en el centro.

Como en este caso n = 5 (número non), hay un solo valor central, el 6 y éste es el valor de la mediana, es decir:

Me = 6

Nótese que la mediana es un valor más típico del conjunto anterior que la media aritmética:

Ejemplo: Se tienen las siguientes edades tomadas de un grupo de 10 estudiantes del grupo del curso de Introducción a los Diseños Experimentales del Colegio de Postgraduados, se desea conocer cual sería su media y cuál sería su mediana.

25, 27, 35, 28, 30, 24, 25, 29, 32, 37

a. Cálculo de la media:

b. Cálculo de la mediana:

Primero se ordenan los datos de menor a mayor:

24, 25, 25, 27, 28, 29, 30, 32, 35, 37

Puesto que n = 10(número par), hay dos valores centrales, que son 28 y 29. La mediana es la media aritmética de estos dos valores. Es decir

Page 28: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Para localizar la mediana en una tabla de frecuencias sólo busque los valores que indiquen aproximadamente la mitad de la frecuencia relativa acumulada (aproximadamente el 50%), ya que la mediana es un valor que divide a los datos en mitades.

Como los datos son 90 (número par) la mediana esta localizada entre la observación cuadragésima quinta y cuadragésima sexta (45a y 46a) que corresponde al intervalo entre 15.7 y 19.7 como se muestra en la tabla:

intervalos Punto medio de clase (mi)

Conteo fi fAi FRi FRAi

(07.7 , 11.7] 9.7 ||||| ||||| ||||| ||| 18 18 18/90 18/90

(11.7 , 15.7] 13.7 ||||| ||||| ||| 13 31 13/90 31/90

(15.7 , 19.7] 17.7 ||||| ||||| ||||| ||||| ||||

24 55 24/90 55/90

(19.7 , 23.7] 21.7 ||||| ||||| ||||| || 17 72 17/90 72/90

(23.7 , 27.7] 25.7 ||||| ||||| ||| 13 85 13/90 85/90

(27.7 , 31.7] 29.7

0 85 0/90 85/90

(31.7 , 35.7] 33.7 |||| 4 89 4/90 89/90

(35.7 , 39.7] 37.7 | 1 90 1/90 90/90

TOTAL 90 90 90/90 90/90

Otra forma de cálculo sería utilizando la siguiente fórmula:

Donde:

Me es mediana. L es Límite inferior de la clase mediana. n es Tamaño de muestra. FA es Frecuencia Acumulada precedente a la clase mediana. f es Frecuencia absoluta de la clase mediana. c es amplitud del intervalo de clase.

De la tabla anterior se han tomando los valores necesarios para sustituir en la fórmula y obtener el valor de la Mediana:

L = 15.7

Page 29: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

n = 90 FA = 31 f = 24 c = 4

Al sustituir en la formula queda la siguiente expresión:

Si utilizamos los valores de la tabla del ejercicio 5 tendriamos que el valor de la mediana seria:

De la tabla obtenemos la información L = Limite Inferior de la clase en donde se ubica a la mediana= 131 FA= Frecuencia acumulada que le antecede a la frecuencia en donde se ubica la mediana= 17 C = Amplitud de la clase= 7 N= 35 F = Es la frecuencia de la clase que contiene a la mediana= 8

Num Clase Frecuencia (f)

MC F (mc) FA

1 110 - 117

03 113.5 03 X 113.5= 340.5

03

2 117 – 124

06 120.5 06 X 120.5=723.0

09

3 124 – 131

08 127.5 08 X 127.5 =1020

17

4 131 - 138

08 134.5 08 X 134.5 =1076

25

5 138 – 145

04 141.5 04 X 141.5=566.0

29

6 145 - 152

06 148.5 06 X 148.5=891 35

suma 35 4616.5

Page 30: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Me = 131 + [ (35)/2 - 17] (7) = 131 + [ 17.5 - 17] (7) 8 8

Me= 131 + (0.5)(7) = 131 + (3.5) = 131 + 0.4375= 131.4375 8 8

Moda

La moda (Mo) de un conjunto de datos es el valor (si existe) que ocurre con mayor

frecuencia. Si es un valor único decimos que la distribución de frecuencias es unimodal, si tiene dos o más valores con la misma frecuencia máxima, decimos que la distribución es bimodal, trimodal, entre otras.

La moda es una medida de tendencia central que es poco usada por las siguientes razones:

a) Puede ocurrir que no exista.

b) A menudo no es un valor único.

Retomando el ejemplo de las edades tomadas de un grupo de 10 estudiantes del grupo del curso de Introducción a los Diseños Experimentales, el cálculo de la moda sería:

25, 27, 35, 28, 30, 24, 25, 29, 32, 37

La moda de este conjunto de datos es 25 puesto que tiene una frecuencia de 2, mientras los demás valores tienen una frecuencia de 1.

Si se comparan los valores obtenidos por este conjunto de datos se tiene:

No siempre los datos obtenidos por la media, la mediana y la moda coinciden, este es un ejemplo en el cual se nota más este concepto.

Num Clase Frecuencia (f)

MC F (mc) FA

Page 31: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

En una tabla de frecuencias, la moda se define como el valor medio de la clase cuya frecuencia tiene el valor numérico mayor, la cual recibe el nombre de clase modal.

Intervalos Punto medio de clase (mi)

Conteo fi fAi FRi FRAi

(07.7 , 11.7] 9.7 ||||| ||||| ||||| ||| 18 18 18/90 18/90

(11.7 , 15.7] 13.7 ||||| ||||| ||| 13 31 13/90 31/90

(15.7 , 19.7] 17.7 ||||| ||||| ||||| ||||| ||||

24 55 24/90 55/90

(19.7 , 23.7] 21.7 ||||| ||||| ||||| || 17 72 17/90 72/90

(23.7 , 27.7] 25.7 ||||| ||||| ||| 13 85 13/90 85/90

(27.7 , 31.7] 29.7

0 85 0/90 85/90

(31.7 , 35.7] 33.7 |||| 4 89 4/90 89/90

(35.7 , 39.7] 37.7 | 1 90 1/90 90/90

TOTAL 90 90 90/90 90/90

Los valores obtenidos utilizando la tabla fueron:

Mo = 17.7 que es el punto medio del intervalo donde la frecuencia absoluta (24) es mayor que los demás, y es de tipo unimodal.

O bien podemos aplicar la siguiente expresión:

Moda = Li + [ ( D1 ) ] * C D1 + D2 donde Li = limite Inferior de la clase más abundante D1= frecuencia de la clase más abundante- frecuencia de la clase anterior D2= Frecuencia de la clase más abundante- frecuencia de la clase posterior C = Ancho del intervalo de la clase más abundante Si retomamos el ejercicio de la clase tendríamos Los valores serán para la clase 3 Li=124 D1=08-06= 02

1 110 - 117 03 113.5 03 X 113.5= 340.5 03

2 117 – 124 06 120.5 06 X 120.5=723.0 09

3 124 – 131 08 127.5 08 X 127.5 =1020 17

4 131 - 138 08 134.5 08 X 134.5 =1076 25

5 138 – 145 04 141.5 04 X 141.5=566.0 29

6 145 - 152 06 148.5 06 X 148.5=891 35

suma 35 4616.5

Page 32: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

D2=08-08=00 C= 07

Moda = Li + [ ( D1 ) ] * C D1 + D2 Moda = 124 + [ ( 2 ) ] ( 7) = 124 + (2/8)(7)= 124 +1.75= 125.75 8 + 0 Para la clase 4 Li= 131 D1=8-8= 0 D2=8-4=4 C= 7 Moda = 131 + [ ( 0 ) ] (7)= 131 + 0= 131 0 + 4

EJERCICIOS PARA PRACTICAR

1.- De un conjunto de 5 plantas se tomo el número de hojas que tiene cada una de ellas:

9, 7, 5, 8, 6 Dé clic junto al número que indica las hojas promedio tienen las plantas:

7

6

8

9 2.- Los siguientes son conteos del número de cromosomas en una herbácea (Claytonia virginica, L):

24, 28, 28, 27, 28, 29, 29, 29, 30, 26

Dé clic junto al número que indica la media de los cromosomas:

22.5

26.8

27.8

29.6 3.- Los siguientes datos expresan el Rendimiento (en Kilogramos) de plantas de maíz atacadas por el barrenador europeo:

Page 33: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

3.81 6.81 7.49 4.56 7.16 8.61 3.86

6.78 9.02 8.65 8.65 6.72 5.26 10.34

Dé clic junto al número que indica el promedio del rendimiento en Kg:

4.94

7.75

5.57

6.98 4.- La siguiente tabla tiene la calificación de estadística de 20 alumnos:

8.5 9 10 6.5 9 8 7 9.5 7 10

6.5 8 9 8.5 6 5 10 5.5 8 5

Dé clic junto al número que indica la media de los alumnos en estadística:

8.3

7.8

5.9

6.7 5.-Considere los siguientes datos sobre la concentración de globulina receptora, para una muestra de mujeres con pruebas de laboratorio de evidente anemia por deficiencia de hierro:

15.2 9.3 7.6 11.9 10.4 9.7

20.4 9.4 11.5 16.2 9.4 8.3

Dé clic junto al número que indica la media de los alumnos en estadística:

11.60

10.86

12.03

17.25 6.-Calcule la media de la siguiente tabla de distribución de Frecuencias utilizando las columnas fi y mi:

Clase o intervalo mi fi FRi

(3.8,4.6] 4.2 4 0.054

(4.6,5.4] 5.0 1 0.013

Page 34: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

(5.4,6.2] 5.8 7 0.095

(6.2,7.0] 6.6 19 0.260

(7.0,7.8] 7.4 20 0.273

(7.8,8.6] 8.2 9 0.123

(8.6,9.4] 9.0 10 0.136

(9.4,10.2] 9.8 1 0.013

(10.2,11.0] 10.6 2 0.027

n=73 De clic junto al número que indica la media calculada de la tabla:

7.268

8.314

6.668

7.987 7.-De la misma tabla calcule la media utilizando las columnas fRi y mi:

De clic junto al número que indica la media calculada de la tabla:

7.987

7.678

6.998

7.223

1.- De un conjunto de 5 plantas se tomo el número de hojas que tiene cada una de ellas:

9, 7, 5, 8, 6

Clase o intervalo mi fi FRi

(3.8,4.6] 4.2 4 0.054

(4.6,5.4] 5.0 1 0.013

(5.4,6.2] 5.8 7 0.095

(6.2,7.0] 6.6 19 0.260

(7.0,7.8] 7.4 20 0.273

(7.8,8.6] 8.2 9 0.123

(8.6,9.4] 9.0 10 0.136

(9.4,10.2] 9.8 1 0.013

(10.2,11.0] 10.6 2 0.027

Page 35: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Dé clic junto al número que indica las mediana del conjunto de datos:

6

8

7

9

2.- Los siguientes son conteos del número de cromosomas en una herbácea (Claytonia

virginica, L): 24, 28, 28, 27, 28, 29, 29, 29, 30, 26

Dé clic junto al número que indica la mediana de los cromosomas:

28

29

26

27

3.- Los siguientes datos expresan el Rendimiento (en Kilogramos) de plantas de maíz

atacadas por el barrenador europeo:

3.81 6.81 7.49 4.56 7.16 8.61 3.86

6.78 9.02 8.65 8.65 6.72 5.26 10.34

Dé clic junto al número que indica la mediana del rendimiento en Kg:

8.94

7.03

6.98

5.96

4.- La siguiente tabla tiene la calificación de estadística de 20 alumnos:

Page 36: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

8.5 9 10 6.5 9 8 7 9.5 7 10

6.5 8 9 8.5 6 5 10 5.5 8 5

Dé clic junto al número que indica la mediana de las calificaciones de los alumnos en

estadística:

8.6

7.9

9

8

5.-Considere los siguientes datos sobre la concentración de globulina receptora, para una

muestra de mujeres con pruebas de laboratorio de evidente anemia por deficiencia de

hierro:

15.2 9.3 7.6 11.9 10.4 9.7

20.4 9.4 11.5 16.2 9.4 8.3

Dé clic junto al número que indica la mediana de los alumnos en estadística:

10.05

11.03

9.89

10.75

6.-Calcule la mediana de la siguiente tabla de distribución de Frecuencias utilizando las

columnas fi y mi:

Clase o intervalo mi fi FAi FRi

(3.8,4.6] 4.2 4 4 0.054

Page 37: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

(4.6,5.4] 5.0 1 5 0.013

(5.4,6.2] 5.8 7 12 0.095

(6.2,7.0] 6.6 19 31 0.260

(7.0,7.8] 7.4 20 51 0.273

(7.8,8.6] 8.2 9 60 0.123

(8.6,9.4] 9.0 10 70 0.136

(9.4,10.2] 9.8 1 71 0.013

(10.2,11.0] 10.6 2 73 0.027

n=73

Dé clic junto al número que indica la media calculada de la tabla:

8.12

6.78

6.66

7.22

1.- De un conjunto de 8 plantas se tomo el número de hojas que tiene cada una de ellas:

9, 8, 7, 5, 8, 6, 8, 9

Dé clic junto al número que indica la moda de las hojas que tienen las plantas:

7

6

8

9 2.- Los siguientes son conteos del número de cromosomas en una herbácea (Claytonia virginica, L):

Page 38: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

29, 28, 28, 27, 28, 29, 29, 29, 30, 26, 24, 29

Dé clic junto al número que indica la moda de los cromosomas:

29

28

24

27 3.- Los siguientes datos expresan el Rendimiento (en Kilogramos) de plantas de maíz atacadas por el barrenador europeo:

3.81 6.81 7.49 4.56 7.16 8.61 3.86

6.78 9.02 8.65 8.65 6.72 5.26 10.34

Dé clic junto al número que indica la moda del rendimiento en Kg:

9.02

3.86

7.49

8.65 4.- La siguiente tabla tiene la calificación de estadística de 20 alumnos:

8.5 9 10 6.5 9 8 7 9.5 7 10

6.5 8 9 8.5 6 5 10 5.5 8 5

Dé clic junto al número que indica la moda o las modas de los alumnos en estadística:

Monomodal moda=8

Polimodal moda=8, moda=9, moda=10

Bimodal moda=9, moda=10

Bimodal moda=8, moda=9 5.-Considere los siguientes datos sobre la concentración de globulina receptora, para una muestra de mujeres con pruebas de laboratorio de evidente anemia por deficiencia de hierro:

15.2 9.3 7.6 11.9 10.4 9.7

20.4 9.4 11.5 16.2 9.4 8.3

Dé clic junto al número que indica la moda o las modas de los alumnos en estadística:

Page 39: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Bimodal moda=9.4 y moda=9.7

Monomodal moda=15.2

Polimodal moda=7.6, moda=9.7 y moda=11.5

Monomodal moda=9.4 6.-Calcule la moda de la siguiente tabla de distribución de Frecuencias utilizando las columnas fi y mi:

Clase o intervalo mi fi FRi

(3.8,4.6] 4.2 4 0.054

(4.6,5.4] 5.0 1 0.013

(5.4,6.2] 5.8 7 0.095

(6.2,7.0] 6.6 19 0.260

(7.0,7.8] 7.4 20 0.273

(7.8,8.6] 8.2 9 0.123

(8.6,9.4] 9.0 10 0.136

(9.4,10.2] 9.8 1 0.013

(10.2,11.0] 10.6 2 0.027

n=73 Dé clic junto al número que indica la media calculada de la tabla:

7.4

7.0

6.6

9.0 Tomado del Libro Said Infante, Guillermo Zarate (1990). Métodos Estadísticos. Trillas. pp25

PARA DATOS CUALITATIVOS

DISEÑO DE ENCUESTAS DE SATISFACCION El primer paso para desarrollar una encuesta sobre la satisfacción del cliente es determinar su finalidad. Las encuestas deben diseñarse para proporcionar con claridad la información a los usuarios de los resultados de la encuesta que

Page 40: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

necesitan para tomar decisiones. Una pregunta vital que se debe considerar es ¿Quién ES EL CLIENTE? los gerentes, los empleados de compras, los usuarios finales y otros pueden quedar afectados por los productos y servicios de una empresa. Por ejemplo XEROX, envía encuestas específicas compradores, gerentes y usuarios. Los compradores proporcionan información sobre facturación y otros procesos administrativos, y los usuarios aportan retroalimentación sobre el desempeño del producto y el apoyo técnico. Las encuestas no deben limitarse a los clientes externos; la información proveniente de los clientes internos también contribuye a la elevación de los puntos fuertes y débiles de la organización.

Algunas empresas también emplean encuestas de opinión de empleados o

instrumentos de tipo similar para buscar retroalimentación de los empleados

respecto al entorno de trabajo, los beneficios, la compensación, la administración,

las actividades en equipo, los premios y el reconocimiento, así como los planes y

valores de le empresa. Sin embargo otros indicadores son el absentismo, la

rotación de personal, las quejas y las huelgas, que frecuentemente pueden aportar

mejor información que las encuestas, mismas que muchos empleados pudieron no

tomar con seriedad.

La siguiente pregunta a encarar ES QUIEN DEBERIA DE LLEVAR A CABO

LA ENCUESTA. A menudo, organizaciones independientes de terceras personas

son más creíbles para quienes responden y pueden asegurar la obtención de

objetividad en los resultados.

Una vez cumplidos estos pasos preliminares, es necesario definir UN MARCO

DE MUESTRA; esto es un grupo seleccionado, a partir del cual se escogería una

muestra. Dependiendo de la finalidad de la encuesta pudiera tratarse de la

totalidad de la base de los clientes o algún segmento en especial.

El siguiente paso es seleccionar el INSTRUMENTO APROPIADO para la

encuesta. El medio más común para medir la satisfacción del cliente es mediante

encuestas formales por escrito, aunque también se emplean otras técnicas, como

son las entrevistas cara a cara, las entrevistas telefónicas y los grupos de

enfoque. Las encuestas por escrito tienen la ventaja de tener un bajo costo de

recolección de datos, autoadministración y facilidad de análisis; además, se puede

profundizar en los temas. Sin embargo, sufren de una alta proporción de

respuestas sin validez. Requieren muestran de gran tamaño y miden solo

percepciones predeterminadas de lo que es importante para el cliente. Las

Page 41: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

entrevistas telefónicas se clasifican en algún sitio entre dos extremos y parece

ser el procedimiento preferido para aquellas empresas que tienen una cantidad

limitada de clientes comerciales; se utilizan encuestas por correo para llevar a

cabo un control de transacciones rutinarias , donde los atributos calves son

estables en el transcurso del tiempo. Las entrevistas cara a cara y los grupos de

enfoque, por otra parte requieren una muestra de tamaño mucho menor y pueden

generar una cantidad significativa de información cualitativa, pero incurren en

costos elevados y comprometen mucho tiempo del participante.

La mayoría de las medidas de satisfacción del cliente evalúan

características de servicio; puede ser difícil desarrollar características medibles de

la calidad de los servicios. Por ejemplo una característica de calidad como

DISPONIBILIDAD tal y como se aprecia en los siguientes enunciados:

1.- El doctor está disponible para programarme en un buen momento

2.- Pude obtener una cita con el doctor a la hora que yo deseaba

3.- Mi cita se programó a una hora conveniente.

Se utiliza una escala LIKERT para medir las respuestas (Tabla No 1). Las

respuestas en el rango 5 indican a una organización que lo esta haciendo bien.

Respuesta el rango 4 sugieren que las expectativas del cliente se están

cumpliendo, pero la empresa pudiera ser vulnerable a la competencia. Las

respuestas en el rango 3 significan que el producto o servicio apenas si cumple

con las expectativas del cliente y que hay mucho que mejorar. Las respuestas en

el rango 1 y 2 indican problemas serios.

Muy pobre

1

Pobre

2

Regular

3

Buena

4

Muy buena

5

Muy en

desacuerdo

1

En

desacuerdo

2

Ni en acuerdo

Ni en

desacuerdo

3

De

acuerdo

4

Muy en

acuerdo

5

Muy insatisfecho

1

Insatisfecho

2

Ni satisfecho Ni insatisfecho

3

Satisfecho

4

Muy satisfecho

5

Page 42: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Tabla No 1 Ejemplos de Escala Likert utilizadas para medir la satisfacción del

cliente

La tarea final es diseñar el formato del informe y los métodos de entrada de

datos. La tecnología moderna como las bases de datos de una computadora, en

conjunto con diversas herramientas de análisis estadístico, ayudan a registrar la

satisfacción del cliente.

La encuesta esta formada por más de 30 pregunta de opción múltiple, con

espacio adicional para realizar los comentarios. La figura No 10 nos muestra

porciones seleccionada de una encuesta.

Como nota final, las encuestas deben probarse primero para determinar si las

instrucciones se han comprendido, identificar las preguntas que se pudieran mal

interpretar o estuvieran mal redactadas, determinar cuanto tiempo toma completar

la encuesta y determinar el nivel del interés del cliente.

La medición apropiada de la satisfacción del cliente permite distinguir entre

procesos con un elevado impacto en la satisfacción y bajo desempeño, y aquellos

que se están ejecutando bien. Una forma de asegurarse que la medición es

apropiada es recolectando información tanto de importancia como en el

desempeño de las características clave de calidad, por ejemplo en la encuesta

de la Fig. 1, la pegunta 8 cuestiona la eficiencia (desempeño) genera del personal

del hotel; parte de la pregunta 13 indaga lo que se percibe quien responde sobre

la importancia de la eficiencia general del personal. Se puede llevar a cabo la

evaluación de datos utilizando una rejilla como la que se muestra en la Fig. No 2.

En los cuadrantes diagonales (áreas sombreadas) los resultados son buenos. Los

resultados que se aparten de la diagonal indican que la firma esta desperdiciando

recursos para conseguir un elevado desempeño sobre los atributos no importantes

del cliente

Page 43: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Figura No 1 Partes seleccionadas de la encuesta para los huéspedes de Marriott

Importancia Desempeño

Reducida Elevada

Reducida ¿A QUIEN LE IMPORTA? En exceso

Elevada Vulnerable PUNTOS FUERTES

Page 44: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Figura No 2 Comparación desempeño-importancia

Cada uno de los atributos se desglosa en un grupo de preguntas .por ejemplo, las

interacciones de la fuerza de venta con los clientes incluirían las siguientes:

* Disponibilidad de los representantes de ventas

* Conocimiento técnico del representante de ventas

* Comprensión de las necesidades reales del cliente

* Habilidades de consultaría del representante de ventas

* Predicción de las necesidades futuras del cliente

Todas las preguntas se pueden medir en una escala de 1 a 5 o del 1 al 10. La

uniformidad de la medición es importante para permitir que se observen las

tendencias a lo largo de los años. Además de medir la satisfacción, cada pregunta

o grupo de preguntas se debe medir según su importancia.

Se debe alentar a los clientes que responden a la encuestas para que

proporcionen comentarios sobre cada aspecto, así como comentarios al azar. Se

recomienda hacer una encuesta al azar de una muestra representativa de

clientes selectos

Page 45: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

a

Page 46: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

POR ESTE MEDIO TE SOLICITO CONTESTE DE ACUERDO A TUS PRINCIPIOS Y CONOCIMIENTOS. TU RESPUESTA ES MUY FUNDAMENTAL PARA NUESTRO APRENDIZAJE 1.- ¿SABES QUE ES UNA ENCUESTA? A) SI B) NO C) EN EFECTO NO D) POSIBLEMENTE 2.- ¿CONOCES ALGUNA? A) SI B) NO C) NO RECUERDO 3.- ¿HAS CONTESTADO ALGUNA? A) SI B) NO C) NO RECUERDO 4.- ¿SABES QUE ES UNA ENCUESTA DE SATISFACCION DE CLIENTE? A) SI B) NO C) TALVES 5.- ¿SABES QUE METODOS PODEMOS EMPLEAR PARA DESARROLLAR UNA ENCUESTA DE SATISFACCION DE CLIENTE? A) SI B) NO C) TALVES 6.- ¿CONOCES COMO DARLE CONFIABILIDAD A UNA ENCUESTA O TEST? A) SI B) NO C) TALVES 7.- DE LAS SIGUIENTES ESCALAS ¿CUAL CONOCES? A) ORDINAL B) CUANTITATIVA C) CARDINAL D) LIKERT E) NINGUNA 8.- ¿LOS DATOS CUALITATIVOS EN ESTADISTICA PODEMOS MEDIRLO POR MEDIO DE LA? A) MEDIA B) CUANTH C) HOMOGENEA D) LIKERT E) NINGUNA

PROBABILIDAD

Orígenes en probabilidad

Los métodos estadístico-matemáticos emergieron desde la teoría de probabilidad, la cual data desde la correspondencia entre Pascal y Pierre de Fermat (1654). Christian Huygens (1657) da el primer tratamiento científico que se conoce a la materia. El Ars coniectandi (póstumo, 1713) de Jakob Bernoulli y la Doctrina de posibilidades (1718) de Abraham de Moivre estudiaron la materia como una rama de las matemáticas.1 En la era moderna, el trabajo de Kolmogórov ha sido un pilar en la formulación del modelo fundamental de la Teoría de Probabilidades, el cual es usado a través de la estadística.

Page 47: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

La teoría de errores se puede remontar a la Ópera miscellánea (póstuma, 1722) de Roger Cotes y al trabajo preparado por Thomas Simpson en 1755 (impreso en 1756) el cual aplica por primera vez la teoría de la discusión de errores de observación. La reimpresión (1757) de este trabajo incluye el axioma de que errores positivos y negativos son igualmente probables y que hay unos ciertos límites asignables dentro de los cuales se encuentran todos los errores; se describen errores continuos y una curva de probabilidad.

Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la combinación de observaciones desde los principios de la teoría de probabilidades. Laplace representó la Ley de probabilidades de errores mediante una curva y dedujo una fórmula para la media de tres observaciones. También, en 1871, obtiene la fórmula para la ley de facilidad del error (término introducido por Lagrange, 1744) pero con ecuaciones inmanejables. Daniel Bernoulli (1778) introduce el principio del máximo producto de las probabilidades de un sistema de errores concurrentes.

Hoy el uso de la estadística se ha extendido más allá de sus orígenes como un servicio al Estado o al gobierno. Personas y organizaciones usan la estadística para entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y otras áreas. La estadística es entendida generalmente no como un sub-área de las matemáticas sino como una ciencia diferente «aliada». Muchas universidades tienen departamentos académicos de matemáticas y estadística separadamente. La estadística se enseña en departamentos tan diversos como psicología, educación y salud pública.

Regresión lineal - Gráficos de dispersión en estadística.

Al aplicar la estadística a un problema científico, industrial o social, se comienza con un proceso o población a ser estudiado. Esta puede ser la población de un país, de granos cristalizados en una roca o de bienes manufacturados por una fábrica en particular durante un periodo dado. También podría ser un proceso observado en varios ascos instantes y los datos recogidos de esta manera constituyen una serie de tiempo.

Page 48: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Por razones prácticas, en lugar de compilar datos de una población entera, usualmente se estudia un subconjunto seleccionado de la población, llamado muestra. Datos acerca de la muestra son recogidos de manera observacional o experimental. Los datos son entonces analizados estadísticamente lo cual sigue dos propósitos: descripción e inferencia.

El concepto de correlación es particularmente valioso. Análisis estadísticos de un conjunto de datos puede revelar que dos variables (esto es, dos propiedades de la población bajo consideración) tienden a variar conjuntamente, como si hubiera una conexión entre ellas. Por ejemplo, un estudio del ingreso anual y la edad de muerte podrían resultar en que personas pobres tienden a tener vidas más cortas que personas de mayor ingreso. Las dos variables se dicen que están correlacionadas. Sin embargo, no se puede inferir inmediatamente la existencia de una relación de causalidad entre las dos variables. El fenómeno correlacionado podría ser la causa de una tercera, previamente no considerada, llamada variable confusora.

Si la muestra es representativa de la población, inferencias y conclusiones hechas en la muestra pueden ser extendidas a la población completa. Un problema mayor es el de determinar que tan representativa es la muestra extraída. La estadística ofrece medidas para estimar y corregir por aleatoriedad en la muestra y en el proceso de recolección de los datos, así como métodos para diseñar experimentos robustos como primera medida, ver diseño experimental.

El concepto matemático fundamental empleado para entender la aleatoriedad es el de probabilidad. La estadística matemática (también llamada teoría estadística) es la rama de las matemáticas aplicadas que usa la teoría de probabilidades y el análisis matemático para examinar las bases teóricas de la estadística.

El uso de cualquier método estadístico es válido solo cuando el sistema o población bajo consideración satisface los supuestos matemáticos del método. El mal uso de la estadística puede producir serios errores en la descripción e interpretación, afectando las políticas sociales, la práctica médica y la calidad de estructuras tales como puentes y plantas de reacción nuclear.

Incluso cuando la estadística es correctamente aplicada, los resultados pueden ser difícilmente interpretados por un inexperto. Por ejemplo, el significado estadístico de una tendencia en los datos, que mide el grado al cual la tendencia puede ser causada por una variación aleatoria en la muestra, puede no estar de acuerdo con el sentido intuitivo. El conjunto de habilidades estadísticas básicas (y el escepticismo) que una persona necesita para manejar información en el día a día se refiere como «cultura estadística».

La probabilidad constituye un importante parámetro en la determinación de las diversas casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico.

Page 49: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Las probabilidades constituyen una rama de las matemáticas que se ocupa de

medir o determinar cuantitativamente la posibilidad de que un suceso o

experimento produzca un determinado resultado. La probabilidad está basada en

el estudio de la combinatoria y es fundamento necesario de la estadística.

La creación de la probabilidad se atribuye a los matemáticos franceses del siglo

XVII Blaise Pascal y Pierre de Fermat, aunque algunos matemáticos anteriores,

como Gerolamo Cardano en el siglo XVI, habían aportado importantes

contribuciones a su desarrollo.

La PROBABILIDAD mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física, la matemática, la ciencia y la filosofía para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecánica subyacente discreta de sistemas complejos. El concepto intuitivo de la probabilidad, por medio del cual una persona toma decisiones sin la certeza de que ocurran todos sus supuestos, es la base de un estudio sistemático que permite incrementar el grado de confianza que se puede tener en una decisión. La probabilidad puede ser objetiva o subjetiva. La primera es el resultado de cálculos mientras que la subjetiva solo se ve reflejada por la percepción de quien la emite. La probabilidad objetiva bajo el enfoque clásico, supone que todos los eventos tienen la misma posibilidad de ocurrir. Esta es la relación entre el numero de eventos señalados como EXITOSOS, respecto al número total de eventos POSIBLES. Matemáticamente podemos expresarlos de la siguiente manera: P = NUMERO DE EVENTOS EXITOSOS= ( n ) NUMEROS DE EVENTOS (N) Donde P= Probabilidad expresada en porcentaje o en forma decimal N= Número total de eventos n = Numero de eventos que son exitosos La probabilidad muchas veces se expresa en porcentajes o bien en forma decimal.

Page 50: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

La probabilidad matemática comenzó como un intento de responder a varias

preguntas que surgían en los juegos de azar, por ejemplo saber cuántas veces se

han de lanzar un par de dados para que la probabilidad de que salga seis sea el

50 por ciento.

La probabilidad de un resultado se representa con un número entre 0 y 1, ambos

inclusive. La probabilidad 0 indica que el resultado no ocurrirá nunca, y la

probabilidad 1 que el resultado ocurrirá siempre. Los problemas más sencillos

estudian la probabilidad de un suceso favorable en un experimento o

acontecimiento con un número finito de resultados, todos ellos con igual

probabilidad de ocurrir.

Si un experimento tiene n posibles resultados, y f de ellos se consideran

favorables, la probabilidad de un suceso favorable es f/n. Por ejemplo, un dado no

trucado se puede lanzar de seis formas posibles, por tanto, la probabilidad de que

salga un 5 ó un 6 es 2/6.

Problemas más complicados estudian acontecimientos en que los distintos

resultados tienen distintas probabilidades de ocurrir. Por ejemplo, encontrar la

probabilidad de que salga 5 ó 6 al lanzar un par de dados: los distintos resultados

(2, 3,…12) tienen distintas probabilidades. Algunos experimentos pueden incluso

tener un número infinito de posibles resultados, como la probabilidad de que una

cuerda de circunferencia dibujada aleatoriamente sea de longitud mayor que el

radio.

Los problemas que estudian experimentos repetitivos relacionan la probabilidad y

la estadística. Algunos ejemplos: encontrar la probabilidad de obtener 5 veces un

3 y al menos 4 veces un 6 al lanzar un dado, sin hacer trampas, 50 veces; si una

persona lanza una moneda al aire y da un paso hacia delante si sale cara y un

paso hacia atrás si sale cruz, calcular la probabilidad de que, después de 50

pasos, la persona esté a menos de 10 pasos del origen.

El uso más generalizado de la probabilidad es su utilización en el análisis

estadístico. Por ejemplo, la probabilidad de sacar 7 al lanzar dos dados es 1/6, lo

que significa (se interpreta como) que al lanzar dos dados aleatoriamente y sin

hacer trampas, un gran número de veces, alrededor de un sexto de los

lanzamientos darán 7.

Page 51: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

La probabilidad matemática se utiliza mucho en las ciencias físicas, biológicas y

sociales, así como en el comercio y la industria. Se aplica a muchas áreas tan

dispares como la genética, la mecánica cuántica y los seguros. También estudia

problemas matemáticos teóricos de gran importancia y dificultad y está bastante

relacionada con la teoría del análisis matemático, que se desarrolló a partir del

cálculo.

Cálculo o medición de la Probabilidad

La PROBABILIDAD mide la mayor o menor posibilidad de que se dé un

determinado resultado (suceso o evento) cuando

se realiza un experimento aleatorio.

Para calcular la probabilidad de un evento se

toma en cuenta todos los casos posibles de

ocurrencia del mismo; es decir, de cuántas

formas puede ocurrir determinada situación.

Los casos favorables de ocurrencia de un evento

serán los que cumplan con la condición que

estamos buscando.

La probabilidad toma valores entre 0 y 1 (o

expresados en tanto por ciento, entre 0% y

100%):

El valor cero corresponde al suceso imposible; ejemplo: lanzamos un dado al aire

y la probabilidad de que salga el número 7 es cero.

El valor uno corresponde al suceso seguro, ejemplo: lanzamos un dado al aire y

la probabilidad de que salga cualquier número del 1 al 6 es igual a uno (100%).

El resto de sucesos tendrá probabilidades entre cero y uno: que será tanto mayor

cuanto más probable sea que dicho suceso tenga lugar.

Métodos de medición de Probabilidad

Uno de los métodos más utilizados es aplicando

la Regla de Laplace: define la probabilidad de un

suceso como el cociente entre casos favorables y

casos posibles.

Page 52: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Ejemplos:

a) Probabilidad de que al lanzar un dado salga el número 2: el caso favorable (f)

es tan sólo uno (que salga el dos), mientras que los casos posibles (n) son seis

(puede salir cualquier número del uno al seis).

Por lo tanto:

(o lo que es lo mismo,

16,6%)

b) Probabilidad de que al lanzar un dado salga un

número par: en este caso los casos favorables (f)

son tres (que salga el dos, el cuatro o el seis),

mientras que los casos posibles (n) siguen siendo

seis.

Por lo tanto:

(o lo que es lo mismo, 50%)

c) Probabilidad de que al lanzar un dado salga un número menor que 5: en este

caso tenemos cuatro casos favorables (f) (que salga el uno, el dos, el tres o el

cuatro), frente a los seis casos posibles.

Por lo tanto:

(o lo que es lo mismo, 66,6%)

d) Probabilidad de ganarse el premio mayor de una lotería en la que juegan

100.000 númerosnos: tan sólo un caso favorable (f), el número que jugamos,

frente a los 100.000 casos posibles (n).

Por lo tanto:

(o lo que es lo mismo, 0,001%)

d) Probabilidad al lanzar una moneda, con un águila

en una cara y un sol en la otra. Hay dos casos

posibles (n) de ocurrencia (o cae águila o cae sol) y

sólo un caso favorable (f) de que pueda caer águila

(pues sólo hay un águila en la moneda).

Por lo tanto:

Page 53: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

(o, lo que es lo mismo, 50 %)

Existe una probabilidad del 50% de obtener un águila al tirar una moneda.

e) Probabilidad de elegir tal o cual fruta. Si en una canasta hay 20 peras y 10

manzanas. ¿Qué fruta es más probable que saque al azar de la canasta?

Para este ejemplo tenemos que 30 es el total de frutas en la canasta; es decir los

casos posibles (n). Para calcular la probabilidad de sacar una manzana los casos

favorables (f) son 10 puesto que existen sólo 10 manzanas.

Por lo tanto:

(o, lo que es lo mismo, 33,3 %)

(o, lo que es lo mismo, 66,7 %)

Fíjate bien que 33,3% + 66,7% es igual al 100% porque siempre que saquemos

algo de la canasta es seguro que será una fruta.

Condiciones importantes

Para poder aplicar la Regla de Laplace el

experimento aleatorio tiene que cumplir dos

requisitos:

a) El número de resultados posibles (sucesoso

eventos) tiene que ser finito. Si hubiera infinitos

resultados, al aplicar la regla "casos favorables

dividido por casos posibles" el cociente siempre

sería cero.

b) Todos los sucesos o eventos tienen que tener la

misma probabilidad. Si al lanzar un dado, algunas

caras tuvieran mayor probabilidad de salir que otras,

no podríamos aplicar esta regla.

A la regla de Laplace también se le denomina "probabilidad a priori", ya que para

aplicarla hay que conocer antes de realizar el experimento cuales son los posibles

resultados y saber que todos tienen las mismas probabilidades.

Cuando se realiza un experimento aleatorio un número muy elevado de veces, las

probabilidades de los diversos posibles sucesos empiezan a converger hacia

valores determinados, que son sus respectivas probabilidades.

Page 54: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Ejemplo:

si lanzo una vez una moneda al aire y sale "cara", quiere decir que el suceso

"cara" ha aparecido el 100% de las veces y el suceso "cruz" el 0%.

Si lanzo diez veces la moneda al aire, es posible que el suceso "cara" salga 7

veces y el suceso "cruz" las 3 restantes. En este caso, la probabilidad del suceso

"cara" ya no sería del 100%, sino que se habría reducido al 70%.

Si repito este experimento un número elevado de veces, lo normal es que las

probabilidades de los sucesos "cara" y "cruz" se vayan aproximando al 50% cada

una. Este 50% será la probabilidad de estos sucesos según el modelo

frecuentista.

La probabilidad de un evento se denota con la letra p y se expresa en términos de una fracción y no en porcentajes, por lo que el valor de p cae entre 0 y 1. Por otra parte, la probabilidad de que un evento "no ocurra" equivale a 1 menos el valor de p y se denota con la letra q:

= 1-q

Donde P= Probabilidad q= Fracaso

ANALISIS COMBINATORIO

Orientado al estudio de las probabilidades, el análisis combinatorio o análisis del

numero de formas en las que se pueden presentarse los resultados de un

proceso, ayuda a cuantificar la probabilidad de que ocurra un resultado en

particular.

El análisis combinatorio tiene como elementos fundamentales a las permutaciones

y a las combinaciones.

Una PERMUTACIÓN es una forma en la que pueden presentarse los objetos o

eventos, y en la que el orden de aparición es muy importante.

La formula general de las permutaciones es:

Permutaciones = nPr = n! n objetos tomados de r en r (n-r)! Donde n = es el número total de objetos o eventos r = es el numero de objetos que se desean considerar

P= Permutación

Page 55: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Una COMBINACIÓN es una forma en las que pueden presentarse los

objetos o eventos y en las que el orden de aparición no importa.

La formula general de las combinaciones es la siguiente:

Combinaciones de nCr = n! n objetos tomados r! * (n-r)! de r en r donde n= Es el número total de objetos o eventos r = Es el numero de objetos que se desea considerar

TIPOS DE EVENTOS

Un evento es el resultado posible o un grupo de resultados, de un experimento o

proceso observado, y es la mínima unidad de análisis para el efecto de cálculo de

probabilidades.

Los eventos pueden clasificarse de la siguiente manera:

1).- Mutuamente excluyentes o disjuntos.- Son aquellos que no pueden ocurrir al

mismo tiempo. Ejemplo.- Que juan juegue futbol y tenga clases de esgrima al

mismo tiempo.

2).- Independiente.- Estos no se ven afectados por otros. Por ejemplo, el color de

mis zapatos y la probabilidad de que llueva hoy.

3).- Dependientes.- Cuando un evento afecta la probabilidad de que suceda otro.

Por ejemplo.- Si un trabajo se hace descuidadamente, es más probable que

resulte mal.

4).- No excluyentes.- Cuando la ocurrencia de uno de ellos no impide que suceda

también el otro. Por ejemplo: Que una persona sea doctor y que tenga mas de 35

años.

Los tres métodos para calcular las probabilidades son la regla de la adición, la regla de la multiplicación y la distribución binomial.

Regla de la adición

La regla de la adición o regla de la suma establece que la probabilidad de ocurrencia de cualquier evento en particular es igual a la suma de las

Page 56: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

probabilidades individuales, si es que los eventos son mutuamente excluyentes, es decir, que dos no pueden ocurrir al mismo tiempo.

P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente.

P(A o B) = P(A) + P(B) − P(A y B) si A y B son no excluyentes.

Siendo: P(A) = probabilidad de ocurrencia del evento A.

P(B) = probabilidad de ocurrencia del evento B.

P(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B.

Regla de la multiplicación

La regla de la multiplicación establece que la probabilidad de ocurrencia de dos o más eventos estadísticamente independientes es igual al producto de sus probabilidades individuales.

P(A y B) = P(A B) = P(A)P(B) si A y B son independientes.

P(A y B) = P(A B) = P(A)P(B|A) si A y B son dependientes

Distribución binomial

La probabilidad de ocurrencia de una combinación específica de eventos independientes y mutuamente excluyentes se determina con la distribución binomial, que es aquella donde hay solo dos posibilidades, tales como masculino/femenino o si/no.

1. Hay dos resultados posibles mutuamente excluyentes en cada ensayo u observación.

2. La serie de ensayos u observaciones constituyen eventos independientes. 3. La probabilidad de éxito permanece constante de ensayo a ensayo, es decir el

proceso es estacionario.

Para aplicar esta distribución al calculo de la probabilidad de obtener un número dado de éxitos en una serie de experimentos en un proceso de Bermnoulli, se requieren tres valores: el número designado de éxitos (m), el número de ensayos y observaciones (n); y la probabilidad de éxito en cada ensayo (p). Entonces la probabilidad de que ocurran m éxitos en un experimento de n ensayos es:

P (x = m) = (nCm)(Pm)(1−P)n−m

Siendo: nCm el número total de combinaciones posibles de m elementos en un conjunto de n elementos.

Page 57: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

En otras palabras P(x = m) = [n!/(m!(n−m)!)](pm)(1−p)n−m

Ejemplo. La probabilidad de que un alumno apruebe la asignatura Cálculo de Probabilidades es de 0,15. Si en un semestre intensivo se inscriben 15 alumnos ¿Cuál es la probabilidad de que aprueben 10 de ellos?

P(x = 10) = 15C10(0,15)10(0,85)5 = 10!/(10!(15−10)!)(0,15)10(0,85)5 = 7,68 * 10−6

Generalmente existe un interés en la probabilidad acumulada de "m o más " éxitos o "m o menos" éxitos en n ensayos. En tal caso debemos tomar en cuenta que: P(x < m) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) +....+ P(x = m − 1) P(x > m) = P(x = m+ 1) + P(x = m+ 2) + P(x = m+3) +....+ P(x = n) P(x ≤ m) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) +....+ P(x = m) P(x ≥ m) = P(x = m) + P(x = m+1) + P(x = m+2) +....+ P(x = n) Supongamos que del ejemplo anterior se desea saber la probabilidad de que aprueben: a.− al menos 5 b.− mas de 12 SOLUCION a.− la probabilidad de que aprueben al menos 5 es: P(x ≥ 5) es decir, que: 1 - P(x < 5) = 1 - [P(x = 0)+P(x = 1)+P(x = 2)+P(x = 3)+P(x = 4)] = 1 - [0,0874 + 0,2312 + 0,2856 + 0,2184 + 0,1156] = 0,0618

Nota: Al menos, a lo menos y por lo menos son locuciones adverbiales sinónimas. Ejemplo: La entrada al cine por lo menos tendrá un costo de 10 soles (como mínimo podría costar 10 soles o más).

b.− la probabilidad de que aprueben mas de 12 es P(x > 12) es decir, que: P(x > 12) = P(x = 13)+P(x = 14)+P(x = 15) P(x > 12) = 1,47 *10−9 +3,722 *10−11 +4,38 *10−13 = 1,507 *10−9

La esperanza matemática en una distribución binomial puede expresarse como: E(x) = np = 15(0,15)=2,25

Y la varianza del número esperado de éxitos se puede calcular directamente: Var(x) = np(1−p)= 15(0,15)(1-0,15)=1,9125

Aplicaciones

Dos aplicaciones principales de la teoría de la probabilidad en el día a día son en el análisis de riesgo y en el comercio de los mercados de materias primas. Los gobiernos normalmente aplican métodos probabilísticos en regulación ambiental donde se les llama "análisis de vías de dispersión", y a menudo miden el bienestar usando métodos que son estocásticos por naturaleza, y escogen qué proyectos emprender basándose en análisis estadísticos de su probable efecto en la

Page 58: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

población como un conjunto. No es correcto decir que la estadística está incluida en el propio modelado, ya que típicamente los análisis de riesgo son para una única vez y por lo tanto requieren más modelos de probabilidad fundamentales, por ej. "la probabilidad de otro 11-S". Una ley de números pequeños tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones, lo que hace de las medidas probabilísticas un tema político.

Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios del petróleo en Oriente Medio - que producen un efecto dominó en la economía en conjunto. Un cálculo por un mercado de materias primas en que la guerra es más probable en contra de menos probable probablemente envía los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opinión. Por consiguiente, las probabilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teoría de las finanzas conductuales surgió para describir el efecto de este pensamiento de grupo en el precio, en la política, y en la paz y en los conflictos.

Se puede decir razonablemente que el descubrimiento de métodos rigurosos para calcular y combinar los cálculos de probabilidad ha tenido un profundo efecto en la sociedad moderna. Por consiguiente, puede ser de alguna importancia para la mayoría de los ciudadanos entender cómo se calculan los pronósticos y las probabilidades, y cómo contribuyen a la reputación y a las decisiones, especialmente en una democracia.

Otra aplicación significativa de la teoría de la probabilidad en el día a día es en la fiabilidad. Muchos bienes de consumo, como los automóviles y la electrónica de consumo, utilizan la teoría de la fiabilidad en el diseño del producto para reducir la probabilidad de avería. La probabilidad de avería también está estrechamente relacionada con la garantía del producto.

Se puede decir que no existe una cosa llamada probabilidad. También se puede decir que la probabilidad es la medida de nuestro grado de incertidumbre, o esto es, el grado de nuestra ignorancia dada una situación. Por consiguiente, puede haber una probabilidad de 1 entre 52 de que la primera carta en un baraja sea la J de diamantes. Sin embargo, si uno mira la primera carta y la reemplaza, entonces la probabilidad es o bien 100% ó 0%, y la elección correcta puede ser hecha con precisión por el que ve la carta. La física moderna proporciona ejemplos importantes de situaciones determinísticas donde sólo la descripción probabilística es factible debido a información incompleta y la complejidad de un sistema así como ejemplos de fenómenos realmente aleatorios.

En un universo determinista, basado en los conceptos newtonianos, no hay probabilidad si se conocen todas las condiciones. En el caso de una ruleta, si la fuerza de la mano y el periodo de esta fuerza es conocido, entonces el número donde la bola parará será seguro. Naturalmente, esto también supone el conocimiento de la inercia y la fricción de la ruleta, el peso, lisura y redondez de la bola, las variaciones en la velocidad de la mano durante el movimiento y así

Page 59: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

sucesivamente. Una descripción probabilística puede entonces ser más práctica que la mecánica newtoniana para analizar el modelo de las salidas de lanzamientos repetidos de la ruleta. Los físicos se encuentran con la misma situación en la teoría cinética de los gases, donde el sistema determinístico en principio, es tan complejo (con el número de moléculas típicamente del orden de

magnitud de la constante de Avogadro ) que sólo la descripción estadística de sus propiedades es viable.

La mecánica cuántica, debido al principio de indeterminación de Heisenberg, sólo puede ser descrita actualmente a través de distribuciones de probabilidad, lo que le da una gran importancia a las descripciones probabilísticas. Algunos científicos hablan de la expulsión del paraíso.[cita requerida] Otros no se conforman con la pérdida del determinismo. Albert Einstein comentó estupendamente en una carta a Max Born: Jedenfalls bin ich überzeugt, daß der Alte nicht würfelt. (Estoy convencido de que Dios no tira el dado). No obstante hoy en día no existe un medio mejor para describir la física cuántica si no es a través de la teoría de la probabilidad. Mucha gente hoy en día confunde el hecho de que la mecánica cuántica se describe a través de distribuciones de probabilidad con la suposición de que es por ello un proceso aleatorio, cuando la mecánica cuántica es probabilística no por el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisión sus parámetros fundamentales, lo que imposibilita la creación de un sistema de ecuaciones determinista.

Investigación biomédica

La mayoría de las investigaciones biomédicas utilizan muestras de probabilidad, es decir, aquellas que el investigador pueda especificar la probabilidad de cualquier elemento en la población que investiga. Las muestras de probabilidad permiten usar estadísticas inferenciales, aquellas que permiten hacer inferencias a partir de datos. Por otra parte, las muestras no probabilísticas solo permiten usarse estadísticas descriptivas, aquellas que solo permiten describir, organizar y resumir datos. Se utilizan cuatro tipos de muestras probabilísticas: muestras aleatorias simples, muestras aleatorias estratificadas, muestra por conglomerados y muestras sistemáticas.

EJERCICIOS CON SOLUCION

1. Una experiencia aleatoria consiste en preguntar a tres personas distintas, elegidas al azar, si son partidarias o no de consumir un determinado producto. a) Escribe el espacio muestral asociado a dicho experimento, utilizando la letra "s" para las respuestas afirmativas y "n" para las negativas. b) ¿Qué elementos del espacio muestral anterior constituyen el suceso " al menos dos de las personas son partidarias de consumir el producto"? c) Describe el suceso contrario de "más de una persona es partidaria de consumir el producto"

Page 60: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

2.

Page 61: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

3. En un supermercado el 70% de las compras las realizan las mujeres; de las compras realizadas por estas, el 80% supera las 2000 PTA, mientras que de las compras realizadas por hombres sólo el 30% supera esa cantidad. a) Elegido un ticket de compra al azar, ¿cuál es la probabilidad de que supere las 2000 PTA?

Page 62: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

b) Si se sabe que el ticket de compra no supera las 2000 PTA ¿ cuál es la probabilidad de que la compra haya sido hecha por una mujer?

4. Se extrae una carta de una baraja española de 40 cartas. Si la carta extraída es un rey, nos dirigimos a la urna I; en caso contrario a la urna II. A continuación, extraemos una bola. El contenido de la urna I es de 7 bolas blancas y 5 negras y el de la urna II es de 6 bolas blancas y 4 negras. Halla: a) La probabilidad de que la bola extraída sea blanca y de la urna II b) La probabilidad de que la bola extraída sea negra.

Page 63: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

5. En una ciudad el 55% de los habitantes consume pan integral, el 30% consume pan de multicereales y el 20% consume ambos. Se pide: I) Sabiendo que un habitante consume pan integral, ¿ cuál es la probabilidad de que coma pan de multicereales?

II) Sabiendo que un habitante consume pan de multicereales, ¿cuál es la probabilidad de que no consume pan integral?

III) ¿Cuál es la probabilidad de que una persona de esa ciudad no consuma ninguno de los dos tipos de pan?

Para ver el gráfico seleccione la opción "Descargar" del menú superior

Page 64: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

SOLUCION:

6. Si A y B son dos sucesos tales que:

Enunciado

7. El equipo directivo de cierta empresa del sector de hostelería está constituido por 25 personas de las que un 60% son mujeres. El gerente tiene

Page 65: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

que seleccionar a una persona de dicho equipo para que represente a la empresa en un certamen internacional. Decide lanzar una moneda: si sale cara, selecciona a una mujer y si sale cruz, a un hombre. Sabiendo que 5 mujeres y 3 hombres del equipo directivo no hablan inglés, determina, justificando la respuesta, la probabilidad de que la persona seleccionada hable inglés.

Enunciado

Page 66: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

8. Dos personas piensan cada una de ellas un número del 0 al 9. Calcula la probabilidad de que las dos personas no piensen el mismo número.

9. En una Universidad existen tres facultades: A, B y C. En A hay matriculadas 150 chicas y 50 chicos; en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos.

a. Calcula la probabilidad de que un estudiante, elegido al azar, sea chico. b. Si un estudiante elegido al azar resultara ser chico, ¿cuál es su facultad

más probable

Page 67: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

Page 68: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

1.

2. Se escuchan tres discos y se vuelven a guardar al azar. ¿Cuál es la probabilidad de que al menos uno de los discos haya sido guardado en el envoltorio que le correspondía?

3. Se considera una célula en el instante t=0. En el intante t=1 la célula puede: bien reproducirse, dividiéndose en dos, con probabilidad 3/4, o bien morir con probabilidad 1/4. Si la célula se divide, entonces en el tiempo t=2 cada uno de sus dos descendientes puede también subdividirse o morir, con las mismas probabilidades que antes, independientemente uno de otro.

Page 69: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

a. ¿Cuántas células es posible que haya en el tiempo t=2? b. ¿Con qué probabilidad?

Page 70: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

1. Una caja contiene 10 bolas blancas, 5 negras y 5 rojas. Se extraen dos bolas consecutivamente de la caja. Calcula la probabilidad de que las dos sean blancas si:

Antes de extraer la segunda bola se vuelve a meter la primera en la caja. La segunda bola se extrae sin haber metido la primera en la caja.

Page 71: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

1.

2. Un monedero contiene 2 monedas de plata y 3 de cobre, y otro contiene 4 de plata y 3 de cobre. Si se elige un monedero al azar y se extrae una moneda ¿cuál es la probabilidad de que sea de plata?

3. En una oficina el 70% de los empleados son asturianos. De entre los asturianos, el 50% son hombres, mientras que de los no asturianos, sólo son hombres el 20%.

¿Qué porcentaje de empleados nos asturianos son mujeres? Calcula la probabilidad de que un empleado de la oficina sea mujer.

Para ver el gráfico seleccione la opción "Descargar" del menú superior

Fernando trabaja en dicha oficina.¿Cuál es la probabilidad de que sea asturiano?

1. El 12% de los habitantes de un país padece cierta enfermedad. Para el diagnóstico de esta, se dispone de un procedimiento que no es

Page 72: Antología de Probabilidad y Estadística I

MC FRANCISCO JAVIER RUIZ CRUZ AGOSTO DEL 2013 TUXTLA GUTIERREZ CHIAPAS COBACH 01

completamente fiable ya que da positivo en el 90% de los casos de personas realmente enfermas, pero también da positivo en el 5% de personas sanas. ¿Cuál es la probabilidad de que esté sana una persona a la que el procedimiento le ha dado positivo?.

2. Para ver el gráfico seleccione la opción "Descargar" del menú superior

Para ver el gráfico seleccione la opción "Descargar" del menú superior

3. En un ayuntamiento hay 5 concejales del partido A, 4 del B y 1 del C. Si se eligen al azar y sucesivamente tres concejales, ¡cuál es la probabilidad de que los tres sean del partido A? ¿ y la de que pertenezcan a partidos distintos?

4. Un dado ha sido trucado de manera que la probabilidad de sacar un número par es el doble que la de sacar un número impar. Se lanza el dado y se pide:

La probabilidad de obtener un número par Si, a la vez, se lanza un dado no trucado, la probabilidad de obtener un

número par y un número impar. Si, a la vez, se lanza un dado no trucado, la probabilidad de obtener, al

menos, un número impar.

Para ver el gráfico seleccione la opción "Descargar" del menú superior

1. Tengo dos urnas, dos bolas blancas y dos bolas negras. Se desea saber como debo distribuir las bolas en las urnas para que, al elegir una urna al azar, sea máxima la probabilidad de obtener una bola blanca. La única condición exigida es que cada una tenga al menos una bola.

Ver: Probabilidades

Ahora practica lo aprendido resolviendo los ejercicios que se te proponen

en:

http://www.conevyt.org.mx/actividades/probabilidad/evaluacion.html

Fuentes Internet:

http://www.aulafacil.org/CursoEstadistica/Lecc-16-est.htm

http://thales.cica.es/rd/Recursos/rd97/Biografias/52-4-b-

laplace.html#Laplace%20y%20la%20Teoría%20de%20la%20Probabilidad.

http://www.conevyt.org.mx/actividades/probabilidad/lectura3.html

Es propiedad: www.profesorenlinea.cl. Registro Nº 188.540