MANUAL DE MÉTODOS ESTADÍSTICOS

download MANUAL DE MÉTODOS ESTADÍSTICOS

of 156

Transcript of MANUAL DE MÉTODOS ESTADÍSTICOS

UNIVERSIDAD TECNOLGICA DE QUERTARO

MANUAL DE MTODOS ESTADSTICOS PARA TECNICO SUPERIOR UNIVERSITARIO TECNOLOGA AMBIENTAL

Compilador: Joaqun Antonio Quiroz Carranza1

CONTENIDO INTRODUCCIN .................................................................................................... 3 CONCEPTOS GENERALES ................................................................................... 4 DATO, INFORMACIN Y CONOCIMIENTO ....................................................... 4 RECOLECCIN, CLASIFICACIN Y ANLISIS DE DE DATOS ....................... 8 ESTADSTICA: CONCEPTOS GENERALES ......................................................... 9 TABLA DE FRECUENCIAS .................................................................................. 21 DIAGRAMA DE PARETO: HERRAMIENTA BSICA PARA LA MEJORA DE LA CALIDAD ........................................................................................................... 30 MEDIDAS DE TENDENCIA CENTRAL ................................................................. 39 TEORA DE CONJUNTOS .................................................................................... 58 TEORIA DE PROBABILIDAD................................................................................ 78 DISTRIBUCIN DE PROBABILIDAD ................................................................... 91 DISTRIBUCIN DE PROBABILIDAD BINOMIAL ................................................. 92 DISTRIBUCIN DE PROBABILIDAD CONTINUA .............................................. 104 ESTIMACIN DE INTERVALO DE CONFIANZA ............................................... 116 PRUEBA DE HIPOTESIS.................................................................................... 124 REGRESIN LINEAL SIMPLE .......................................................................... 133 GRFICOS DE CONTROL ................................................................................. 141

2

INTRODUCCIN

Todas las actividades cotidianas que realizan los seres humanos, implican la toma de decisiones. Estas, para asumirse, requieren de informacin y conocimiento, los cuales son resultado de la obtencin, organizacin, procesamiento y anlisis de datos. Por ello se puede afirmar que de forma emprica o sistemtica todos los seres humanos aplican mtodos estadsticos en su vida cotidiana, muchas de las veces sin reconocer esta habilidad. Este Manual de Mtodos Estadsticos tiene el objetivo de que el Tcnico Superior Universitario reflexione diversos conceptos y ejercite habilidades en el manejo y anlisis de datos mediante diversos mtodos estadsticos. Lo ms relevante de estos apuntes es su orientacin hacia el autoaprendizaje o el aprendizaje autnomo, por lo que cada apartado presenta una parte conceptual y otra con ejercicios y repasos Es necesario que como actividad transversal de la asignatura, los estudiantes conformen equipos de trabajo, elijan un tema de inters relacionado con el plan de estudios, busquen informacin bsica, elaboraren un cuestionario sobre el tema, lo apliquen en el lugar correspondiente a un mnimo de 30 personas y procesen los datos con las distintas tcnicas que se presentan a lo largo del curso como son tablas de frecuencia, elaboracin de histogramas, calculo de medidas de tendencia central y dispersin, entre otras. Lo anterior, es con el fin de tener una aplicacin de los mtodos estadsticos, sobre una porcin de la realidad de inters por parte de estudiantes, que conformen cada uno de los equipos. Este Manual de Mtodos estadsticos se complementa con procedimientos detallados para realizar las aplicaciones o clculos en Excell, Word o Power point.

3

CONCEPTOS GENERALESDATO, INFORMACIN Y CONOCIMIENTO

El dato es una representacin simblica (numrica, alfabtica, algortmica etc.), un atributo o una caracterstica de una entidad (fenmeno, organismo, organizacin, u objeto). El dato no tiene sentido en s mismo, pero s recibe un tratamiento o procesamiento apropiado, se puede utilizar en la realizacin de clculos o toma de decisiones o en la descripcin de sucesos y entidades. Los datos son comunicados por varios tipos de smbolos tales como las letras del alfabeto, nmeros, movimientos de labios, puntos y rayas, seales con la

mano, dibujos, etc. Estos smbolos se pueden ordenar y reordenar de forma utilizable para generar informacin. Los datos son smbolos que describen condiciones, hechos, situaciones o valores y se caracterizan por no contener ninguna informacin. Un dato puede significar un nmero, una letra, un signo ortogrfico o cualquier smbolo que represente una cantidad, una medida, una palabra o una descripcin. La importancia de los datos est en su capacidad de asociarse dentro de un contexto para convertirse en informacin. Por si mismos los datos no tienen capacidad de comunicar un significado y por tanto no pueden afectar el comportamiento de quien los recibe. Para ser tiles, los datos deben convertirse en informacin para ofrecer un significado, conocimiento, ideas o conclusiones. EL CONCEPTO DE INFORMACIN La informacin no es un conjunto cualquiera de datos. Es una coleccin de hechos significativos y pertinentes para el organismo u organizacin que los percibe ya que describen sucesos o entidades.

4

Para ser significativos, los datos deben constar de smbolos reconocibles, estar completos y expresar una idea no ambigua. Los smbolos de los datos son reconocibles cuando pueden ser correctamente interpretados. La integridad de los datos significa que todos los datos requeridos para responder a una pregunta especfica estn disponibles. Los datos son inequvocos cuando el contexto es claro. Tenemos que conocer el contexto de estos smbolos antes de poder conocer su significado. Los datos son pertinentes o relevantes cuando son utilizados para responder a preguntas propuestas. Como se dispone de un considerable nmero de hechos en nuestro entorno. Solo los hechos relacionados con las necesidades de informacin son pertinentes. DIFERENCIA ENTRE DATOS E INFORMACIN Los datos a diferencia de la informacin son utilizados con diversos mtodos para organizarlos y presentarlos a fin de permitir una transmisin o

almacenamiento ms eficaces. La cantidad de informacin de un mensaje puede ser entendida como el nmero de smbolos posibles que representan el mensaje, los smbolos que representan el mensaje no son ms que datos significativos. En su concepto ms elemental, la informacin es un mensaje con un contenido determinado emitido por una entidad hacia otra y, como tal, representa un papel primordial en el proceso de la comunicacin, a la vez que posee una evidente funcin social. A diferencia de los datos, la informacin tiene significado para quien la recibe, por eso, los seres humanos siempre han tenido la necesidad de cambiar entre s informacin que luego transforman en acciones. La informacin es un conjunto de datos procesados con significado, propsito y utilidad.

5

PRINCIPALES CARACTERSTICAS DE LA INFORMACIN En general la informacin tiene una estructura interna y puede ser calificada segn varios aspectos:

Significado: Qu quiere decir?, del significado de una informacin, cada individuo evala las consecuencias posibles y adeca sus actitudes y acciones de manera acorde a las consecuencias previsibles que se deducen del significado de la informacin.

Importancia relativa al receptor: Trata sobre alguna cuestin importante? se refiere al grado en que cambia la actitud o la conducta de los individuos.

Vigencia: Es actual o desfasada? En la prctica la vigencia de una informacin es difcil de evaluar, ya que en general acceder a una informacin no permite conocer de inmediato si dicha informacin tiene o no vigencia.

Validez: El emisor es fiable o puede proporcionar informacin falsa? Valor: Qu tan til resulta la informacin para el destinatario?

USOS DE LA INFORMACIN Se considera que la generacin y/o obtencin de informacin persigue estos objetivos:

Aumentar o mejorar el conocimiento del usuario. Reducir la incertidumbre existente sobre un conjunto de alternativas lgicamente posibles.

Facilitar la gestin y toma decisiones Proporcionar elementos parta la evaluacin y el control.

EL CONCEPTO DE CONOCIMIENTO El conocimiento puede definirse como:

6

1. Hechos, informacin e ideas adquiridas por una persona a travs de la experiencia o la educacin, la comprensin terica o prctica de un tema. 2. Lo que se conoce en un campo determinado o en su totalidad. 3. Conciencia o familiaridad adquirida por la experiencia de un hecho o situacin. La adquisicin de conocimiento implica procesos asociacin y

cognitivos complejos: percepcin, razonamiento.

aprendizaje, comunicacin,

Las ciencias constituyen uno de los principales tipos de conocimiento. Las ciencias son el resultado de esfuerzos sistemticos y metdicos de investigacin en busca de respuestas a problemas especficos, al funcionamiento y relacin de los fenmenos, y cuya elucidacin procura ofrecernos una representacin adecuada del universo. Hay tambin, muchos tipos de conocimiento que, sin ser cientficos, no dejan de estar perfectamente adaptados a sus propsitos: el saber hacer en la artesana, el saber nadar, entre otros; el conocimiento de la lengua, de las tradiciones, leyendas, costumbres o ideas de una cultura particular; el conocimiento que los individuos tienen de su propia historia: su propio nombre, la historia de sus padres, su pasado, etc., o an los conocimientos comunes a una sociedad dada, incluso a la humanidad: saber para qu sirve un martillo, saber que el agua extingue el fuego, etc. Los conocimientos se adquieren mediante experiencia, una pluralidad de procesos

cognitivos: percepcin, memoria,

razonamiento,

enseanza-

aprendizaje, testimonio de terceros, etc. Estos procesos son objeto de estudio de la ciencia cognitiva. Por su parte, la observacin controlada, la experimentacin, la modelizacin, la crtica de fuentes, las encuestas y otros procedimientos que son especficamente empleados por las ciencias, pueden considerarse como un refinamiento o una aplicacin sistemtica de los anteriores.

7

El conocimiento se deriva de la informacin, as como la informacin se deriva de los datos. Para que la informacin se convierta en conocimiento es necesario realizar acciones como: Comparacin con otros elementos. Prediccin de consecuencias. Bsqueda de conexiones. Conversacin con otros portadores de conocimiento.

RECOLECCIN, CLASIFICACIN Y ANLISIS DE DE DATOSLA RECOLECCIN DE DATOS La recoleccin de datos se refiere al uso de una gran diversidad

de tcnicas y herramientas que pueden ser utilizadas por el acopio de datos, que permitan desarrollar sistemas de informacin, los cuales pueden ser entrevistas, encuestas, cuestionario, observaciones, diagramas de flujo, censos, registros, entre otros. Todos estos instrumentos se aplican en un momento determinado, con la finalidad de buscar informacin que ser til a una investigacin particular. CLASIFICACIN DE DATOS Las caractersticas o propiedades de los organismos o entidades que son recolectados en forma de datos, son el producto de las observaciones o mediciones que se hace sobre ellos. 8

Los datos o caractersticas de fenmenos u objetos, los cuales una vez organizados y analizados dan informacin sobre su estado, pueden

ser clasificados en cualitativos, cuantitativos, cronolgicos y geogrficos Los datos cualitativos: representan caractersticas de clase o tipo y no de

cantidad. Ejemplo: Si se desea clasificar a los estudiantes que cursan una determinada asignatura por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos, en unin libre o concubinato. Los datos cuantitativos: son aquellos cuyo valor representa diferentes magnitudes. Ejemplo: Se clasifican los estudiantes por sus notas y se observa que los valores de los notas representan diferentes magnitudes, as mismo pueden clasificarse por su estatura, peso, velocidad, entre otros. Los datos cronolgicos: cuando los valores de los datos varan en diferentes instantes o perodos de tiempo, los datos son reconocidos como cronolgicos. Ejemplo: Al registrar los promedios de notas de los Alumnos en diferentes semestres. Los datos geogrficos: cuando los datos estn referidos a una localidad geogrfica se dicen que son datos geogrficos. Ejemplo: El nmero de estudiantes de educacin superior en las distintas regiones del pas.

ESTADSTICA: CONCEPTOS GENERALESLa estadstica es una disciplina utilizada para lograr el conocimiento o el estado de un hecho o fenmeno, as como para inferir el comportamiento futuro del mismo. Lo anterior permite la toma de decisiones. POBLACIN Una poblacin es un conjunto finito o infinito de individuos, hechos u objetos que presentan caractersticas comunes o comportamientos afines. El tamao que tiene una poblacin es un factor de suma importancia en 9

el proceso de investigacin estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se dificulta en cuanto a esfuerzo, tiempo y costos necesario para hacerlo. Para solucionar este

inconveniente se utiliza una muestra estadstica. MUESTRA Muestra a una parte de la poblacin que presenta las mismas caractersticas y que la representa. Las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia. Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin. A travs de la estadstica se analizan datos, previamente recolectados, de una muestra. La informacin generada se utiliza para describir el estado actual de las caractersticas de una poblacin (estadstica descriptiva) o para inferir y predecir su comportamiento futuro (estadstica inferencial) MUESTREO El muestreo es el procedimiento o tcnica para obtener una o ms muestras de una poblacin. Este se realiza una vez que se ha establecido un marco de muestreo representativo de la poblacin. As se procede a la seleccin de los elementos de la muestra. Al tomar varias muestras de una poblacin, los estadsticos que calculamos para cada muestra no necesariamente

sern iguales, y lo ms probable es que variaran de una muestra a otra. TIPOS DE MUESTREO El muestreo no aleatorio o de juicio se basa, para la eleccin de la muestra, en la experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir como tomar una muestra aleatoria 10

ms adelante. Las muestras de juicio evitan el anlisis estadstico para hacer muestras de probabilidad. En el muestreo aleatorio o de probabilidad, todos los elementos de la poblacin tienen la oportunidad de ser escogidos en la muestra. VARIABLES Y ATRIBUTOS Las variables, tambin suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante nmeros. Son caracteres susceptibles de medicin. Como por ejemplo, la estatura, el peso, el salario, la edad, etc. Una variable es un smbolo, tal como X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado de ellos. Si la variable puede tomar solamente un valor, se llama constante. Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero generalmente estos no suelen presentarse con la misma intensidad, por lo que las variables toman distintos valores. Los distintos nmeros o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable. Los atributos tambin llamados caracteres cualitativos, son aquellos que no son susceptibles de medicin, es decir que no se pueden expresar mediante un nmero, por ejemplo; profesin, estado civil, sexo, nacionalidad, etc. Las variables, tambin llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numricamente la magnitud de dichas variaciones. Por intuicin y por experiencia sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas Las variables continuas se caracterizan por el hecho de que para todo tipo de valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.) Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura. 11

Las variables discretas sern aquellas que pueden tomar solo un nmero limitado de valores separados y no continuos; son aquellas que solo toman un determinado nmeros de valores, porque entre dos valores consecutivos no pueden tomar ningn otro; por ejemplo el nmero de estudiantes de una clase es una variable discreta ya que solo tomar los valores 1, 2, 3, 4... no es posible encontrar valores como 1.5 estudiantes FORMAS DE OBSERVAR LA POBLACIN. Observacin directa: cuando se tiene un contacto directo con los elementos o caracteres en los cuales se presenta el fenmeno que se pretende investigar, y los resultados obtenidos se consideran datos estadsticos originales. Observacin Indirecta: cuando se hace uso de datos estadsticos ya conocidos en una investigacin anterior, o de datos observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenmenos. Observacin contina: cuando se lleva acabo de un modo permanente. Observacin peridica: cuando se lleva a cabo a travs de perodos de tiempo constantes (semanal, trimestral, semestral, anual, etc.). Observacin circunstancial: cuando se efecta en forma ocasional o espordica. Observacin Exhaustiva: cuando la observacin es efectuada sobre la totalidad de los elementos de la poblacin se habla de una observacin exhaustiva. Observacin Parcial: dados que las poblaciones en general son grandes, la observacin de todos sus elementos se ve imposibilitada. La solucin para superar este inconveniente es observar una parte de esta poblacin. Observacin Mixta: en este tipo de observacin se combinan adecuadamente la observacin exhaustiva con la observacin parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran

12

bsicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la poblacin es muy grande, parte de ella se observa parcialmente. CENSO Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los caracteres componentes de una poblacin. ENCUESTA Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. Esta se efecta a travs de cuestionarios verbales o escritos que son aplicados a un determinado nmero de personas. ESTADSTICA DESCRIPTIVA Tienen por objeto fundamental describir y analizar las caractersticas de un conjunto de datos, obtenindose de esa manera conclusiones sobre las caractersticas de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observacin de todos los elementos de una poblacin (observacin exhaustiva) sino tambin a la descripcin de los elementos de una muestra (observacin parcial). ESTADSTICA INDUCTIVA O INFERENCIAL Est fundamentada en los resultados obtenidos del anlisis de una muestra de poblacin, con el fin de inducir o inferir el comportamiento o caracterstica de la poblacin, de donde procede, por lo que recibe tambin el nombre de Inferencia estadstica. MEDICIN DE CARACTERES MEDICIN Existen diversas definiciones del trmino "medicin", pero estas dependen de los diferentes puntos de vista que se puedan tener al abordar el problema de la

13

cuantificacin

y

el

proceso

mismo

de

la

construccin de

una escala o instrumento de medicin. En general, se entiende por medicin la asignacin de nmeros a elementos u objetos para representar o cuantificar una propiedad. El problema bsico est dado por la asignacin de un numeral que represente la magnitud de la

caracterstica que queremos medir y que dicho nmeros pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la medicin, los atributos de nuestras percepciones se transforman en entidades conocidas y manejables llamadas "nmeros". Es evidente que el mundo resultara catico si no pudiramos medir nada. En este caso cabra preguntarse de que le servira al fsico saber que el hierro tiene una

alta temperatura de fusin. NIVELES O ESCALAS DE MEDICIONES Escala Nominal o de clase: consiste en la asignacin, puramente arbitraria de nmeros o smbolos a cada una de las diferentes categoras en las cuales podemos dividir el carcter que observamos, sin que puedan establecerse relaciones entre dichas categoras, a no ser el de que cada elemento pueda pertenecer a una y solo una de estas categoras. Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, despus de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan nmeros, puede ser una de las razones por las cuales se le conoce como "medidas nominales". Escala Ordinal: En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los nmeros asignndolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B.

14

La asignacin de nmeros a las distintas categoras no puede ser completamente arbitraria, debe hacerse atendiendo al orden existente entre stas. Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas sus categoras, el clculo de las medidas estadsticas de posicin, como por ejemplo la mediana. Escalas de intervalos iguales: est caracterizada por una unidad de medida comn y constante que asigna un nmero igual al nmero de unidades equivalentes a la de la magnitud que posea el elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningn momento ausencia de la magnitud que estamos midiendo. Esta escala, adems de poseer las caractersticas de la escala ordinal, encontramos que la asignacin de los nmeros a los elemento es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida pueden calculrsele todas las medidas estadsticas a excepcin del coeficiente de variacin. Ejemplo: El lapso transcurrido entre 1998-1999 es igual al que transcurri entre 2000-2001. Escala de coeficientes o Razones: El nivel de medida ms elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos iguales nicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los nmeros asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Adems, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B.

15

Ejemplo: En una encuesta realizada en un barrio de esta localidad se observ que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos. MTODO PARA LA RECOLECCIN DE DATOS: En estadstica se emplean una variedad de mtodos distintos para obtener informacin de los que se desea investigar. La entrevista personal: los datos estadsticos necesarios para una investigacin, se renen frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente, directamente a la persona investigada. El investigador efectuar a esta persona una serie de preguntas previamente escritas en un cuestionario o boleta, donde anotar las respuestas correspondientes. Este procedimiento que se conoce con el nombre de entrevista personal, permite obtener una informacin ms veraz y completa que la que proporcionan otros mtodos, debido a que al tener contacto directo con la persona entrevistada, el entrevistador podr aclarar cualquier duda que se presente sobre el cuestionario o investigacin. Desventajas: si el entrevistador no obra de buena fe o no tiene

un entrenamiento adecuado, puede alterar las respuestas por las personas entrevistadas. Alto costo, ya que resulta bastante oneroso el entrenamiento de los agentes y los supervisores de estos, sobre todo si se trata de una investigacin extensa. Cuestionarios por correo: consiste en enviar por correo el cuestionario acompaado por el instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de las preguntas, sino tambin una breve explicacin del objeto de la encuesta con el fin de evitar interpretaciones errneas. Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto que no hay que incluir gastos de entrenamiento de personal, el nico gasto sera el de franqueo postal. 16

Dentro de las desventajas de este procedimiento podemos sealar que solo un porcentaje bastante bajo de estos es devuelto, en algunos casos no estamos seguros de que los formularios hayan sido recibidos por sus destinatarios y que hayan sido respondido por ellos mismos. Lo que trae como consecuencia que la informacin se obtenga con una serie de errores difciles de precisar por el investigador. Entrevista por telfono: como lo indica su nombre, este mtodo consiste en telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este mtodo es bastante simple y econmico, ya que el entrenamiento y supervisin de las personas encargadas de efectuar las preguntas es siempre fcil. Entre las limitaciones que presenta este mtodo podemos sealar el nmero de preguntas que pueden formularse es relativamente limitado; adems las investigaciones efectuadas por este mtodo tienen un carcter selectivo, debido a que muchas de las personas que potencialmente podran ser investigadas no posee servicio telefnico, por lo que quedan sin la posibilidad de ser entrevistados. INSTRUMENTOS PARA LA RECOLECCIN DE DATOS: Cuestionarios: Cualquiera que sea el mtodo por el que se decida el investigador para recabar informacin, es necesario elaborar un estudio de preguntas. Los cuestionarios en general, constan de las siguientes partes: a. La identificacin del cuestionario: nombre del patrocinador de la encuesta, (oficial o privada), nombre de la encuesta, nmero del cuestionario, nombre del encuestador, lugar y fecha de la entrevista. b. Datos de identificacin y de carcter social del encuestado: apellidos, nombres, cdula de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado de instruccin, ocupacin actual, ingresos, etc. c. Datos propios de la investigacin, son los datos que interesa conocer para construir el propsito de la investigacin.

17

Como es natural, estas partes, as como las preguntas, varan de acuerdo a la finalidad de la encuesta. En algunos tipos de investigacin, la parte referente a los datos personales es eliminada por no tener ningn tipo de inters para el estudio. Consideraciones que debemos tomar en cuenta:

El cuestionario debe ser conciso; tratar en lo posible de que con el menor nmero de preguntas, se obtenga la mejor informacin.

Claridad de la redaccin; evitar preguntas ambiguas o que sugieran respuestas incorrectas, por lo que deben estar formuladas las preguntas de la forma ms sencilla.

Discrecin: un cuestionario hecho a conciencia, no debe tener preguntas indiscretas o curiosas, sobre datos personales que puedan ofender al entrevistado.

Facilidad de contestacin: se deben evitar, en lo posible, las preguntas de respuestas libres o abiertas y tambin la formulacin de preguntas que requieran clculos numricos por parte del entrevistado.

Orden de las preguntas: estas deben tener una secuencia y un orden lgico, agruparlas procurando que se relacionen unas con otras.

TIPOS DE MUESTREO

Muestreo probabilstico: consiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos de muestreo: Muestreo aleatorio simple Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al azar los n elementos que contiene la muestra. Muestreo aleatorio sistemtico Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta completar la muestra.

Por ejemplo si tenemos una poblacin formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el 18

intervalo de seleccin que ser igual a 100/25 = 4. A continuacin elegimos el elemento de arranque, tomando aleatoriamente un nmero entre el 1 y el 4, y a partir de l obtenemos los restantes elementos de la muestra. 2, 6, 10, 14,..., 98 Muestreo aleatorio estratificado Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero de componentes de cada estrato. En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la D.

La operacin sealada es: 200 x 20 / 600= 6.6 7 150 x 20 / 150= 5 150 x 20 /150= 5 100 x 20 /100= 3.3 3 Un muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo con reposicin. 19

Si consideremos todas las posibles muestras de tamao n en una poblacin, para cada muestra podemos calcular un estadstico (media, desviacin tpica, proporcin) que variar de una a otra. As obtenemos una distribucin del estadstico que se llama distribucin muestral.TABLA DE NMEROS ALEATORIOS

4251 5149 4751 4847 4249 4648 5047 4847 5156 8789 4849 5051 5046 4756 4738 5350 4746 4847 4846 2346 5692 9870 3583 8997 1533 6466 8830 7271 3809 4256 2080 3828 7880 0586 8482 7811 6807 3309 2729 2235 1039 3382 7600 1077 4455 8806 1822 1669 7501 8330 6477 5289 4092 4223 6454 7632 7577 2816 9002 2365 4554 6146 4846 4647 5034 4646 5139 5355 5249 2224 0772 2160 7236 0812 4195 5589 0830 8261 9232 0902 0092 1629 0377 3590 2209 4839 6332 1490 3092 2390 7315 3365 7203 1231 0546 6612 1038 1425 2709 3092 5775 7517 8974 3961 2183 5295 3096 8536 9442 2392 5500 2276 6307 2346 1285 7000 5306 0414 3383 2303 3251 8902 8843 2112 8567 8131 8116 5270 5994 9092 4675 1435 2192 0874 2897 0262 5092 5541 4014 2113 3543 6130 4247 4859 2660 7852 9096 0578 0097 1324 3521 8772 6612 0721 3899 2999 1263 7017 8057 3443 5573 9396 3464 1702 9204 3389 5678 2589 0288 6343 7478 7569 7551 3380 2152 5411 2647 7242 2800 3432 3339 2854 9691 9562 3252 9848 6030 8472 2266 3255 5505 8474 3167 8552 5409 1556 4247 4652 2953 9854 6381 2086 5457 7703 2758 2963 8167 6712 9820 5324 0935 5565 2315 8030 7651 5189 0075 9353 1921 0222 2605 3973 8204 4143 2677 0034 8601 3340 8383 3243 7277 9889 0390 5579 4620 5650 0210 2082 4664 5643 5484 3900 3485 0741 9069 5920 4326 7704 6525 1249

7227 0104 4141 1521 9104 5563 1392 8238 4882 2324 8506 6348 4612 8252 1062 1757 0964 2983 2244 7654 5086 0303 7423 3298 3979 2831 2257 1508 7642 1245 3690 2492 7171 7720 6509 7549 2330 5733 4730 4534 0813 6790 6858 1489 2669 3743 1901 4971 8280 0835 6905 7127 5933 1137 7583 6450 5658 7678 3444 3754 8387 5323 3753 1859 6043 0294 5110 6340 9137 6323 4094 4957 0163 9717 4118 4276 9465 8820 4127 0202 4951 3781 5101 1815 7068 6379 7252 1086 8919 2093 9047 0199 5068 7447 1664 9278 1708 3625 2864 0204 7274 9512 0074 6677 8676 0222 3335 1976 1645 3203 9192 4011 0255 5458 6942 8043 6201 1587 0972 0243 0554 1690 6333 1931 9433 2661 8690 2313 6999 3094 9231 5627 1815 7171 8036 1832 2031 6298 6073 9044 3995 9677 7765 3194 3222 4191 2734 4469 8617 3233 2402 6250 9362 7373 4757 1716 1942 0417 5921 5345 5295 7385 5474 2123 7035 9983 5192 1840 6176 5756 5177 1191 2106 3351 5057 0967 4538 1246 3374 0304 4344 4044 4549 4443 4249 4948 4151 5152 4240 4737 7343 4706 4440 4646 4548 4742 4746 5253 4749 4689

20

TABLA DE FRECUENCIASDefinicin Las tablas de frecuencias o tabla de relaciones es una herramienta estadstica que se usa para ordenar o tabular datos o valores, que previamente fueron obtenidos de una o ms variables de una muestra. Con ellas, un conjunto de datos desordenados pasa a ser una coleccin ordenada e inteligible. Para construir cualquier tipo de histograma o representacin grfica se necesita primero agrupar los datos en una tabla la cual se conoce como tabla de frecuencias. En el caso de datos numricos continuos (ejemplo: 9.5, 6.7, 8.4) los datos se agrupan en intervalos. Un intervalo es un conjunto de nmeros que se corresponden con los puntos de una recta o segmento, en el que se encuentra un ordenamiento interno entre ellos. El intervalo es el espacio que se da de un punto a otro en el cual se toman en cuenta todos los puntos intermedios. Ejemplo: en una recta tenemos un intervalo: [-2,2] entre este espacio se encuentran los nmeros (-2-1,0,1,2), esto es un intervalo.....ya que el espacio abarca una serie de nmeros consecutivos que se corresponden entre s.

Los intervalos deben poseer las siguientes caractersticas: 1. Todos deben ser del mismo ancho. 2. No se deben solapar. 3. Todos los datos deben caer en uno de los intervalos. 4. Deben haber un total de entre 5 y 15 intervalos (en dependencia del fenmeno de estudio)

21

La frecuencia indica el nmero de repeticiones de cualquier hecho, fenmeno o suceso, la frecuencia de un intervalo es el nmero de datos que se encuentran en l. Construccin de una tabla de frecuencias Las tablas de frecuencia sirven para preparar representaciones grficas como el histograma de frecuencias: Un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En este grfico en su eje vertical (Y) se representan las frecuencias y en el eje horizontal (X) los valores de las variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los datos. Las representaciones grficas se usan para resaltar la diferencia entre las clases en que se han agrupado los datos. El histograma se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que en ciencias naturales y exactas. Y permite la comparacin de los resultados de un proceso. Para preparar la tabla de frecuencia para un histograma se procede con los siguientes pasos: Primero, se establece el nmero de intervalos que se desea tener. Segundo, se debe determinar el ancho comn de los intervalos. Para esto, se calcula la diferencia del dato mayor y el dato menor, y se divide entre el nmero de intervalos deseados. Este resultado se redondea al entero mayor ms cercano. Por ejemplo, si se desea tener 10 intervalos y encontramos que el dato mayor es 35 y el menor es 12. El ancho comn se determina: 35-12= 23/10= 2.3 o 2 22

Tercero, se determina el lmite superior de cada intervalo. Este valor sirve como demarcador y corresponde al valor mayor que se encontrar en el intervalo. Para determinar el lmite superior de cada intervalo procedemos de la manera siguiente: Ejemplo 1: Al preparar una tabla de frecuencia de cinco intervalos para el conjunto de los siguientes 20 datos: 5, 7, 8, 3, 7, 7, 1, 9, 6, 8 5, 6, 7, 8, 7, 9, 6, 8, 6, 6 1. Definicin de ancho de intervalo: Dato mayor- dato menor / nmero de intervalos deseados 9-1=8 / 5= 1.6 = 2 Como el dato menor es 1, seleccionaremos a 2 como lmite superior del primer intervalo. Entonces, el lmite superior del segundo intervalo ser 2 + 2 = 4; el del segundo ser 4+ 2 = 6 y as sucesivamente, obtenemos que los lmites superiores para los restantes intervalos son: 8, 10, 12. Por tanto, la tabla de frecuencia es:Frecuencia absoluta1/20= 0.05 1/20 = 0.05 7/20= 0.35 9/20= 0.45 2/20= 0.1

Datos1 3 5 5 6 6 6 6 6 7 7 7 7 7 8 8 8 8 9 9

Intervalo0-2 2-4 4-6 6-8 8-10

Frecuencia1 1 7 9 2

Frecuencia relativa %5 5 35 45 10

100

23

Determinacin de la frecuencia en Excell En Excel se puede calcular de manera automtica la tabla de frecuencia de un conjunto de datos. Paso 1: Ingresar los nmeros en la columna A, empezando en A1. Presione la tecla "ENTER" despus de cada uno de los datos. Paso 2: Calcule el ancho comn de los cinco intervalos y las lmites superiores de cada uno: Dato mayor = 9, Dato menor = 1, por tanto Los lmites superiores son: 2, 4, 6, 8, 10. Paso 3: En la columna B, empezando en B1 ingrese 2, 4, 6, 8. No es necesario ingresar el lmite superior del ltimo intervalo 10. Esto se debe a que en Excel, se entiende que el ltimo intervalo contendr a todos los valores mayores que el lmite superior del intervalo anterior. De la misma forma Excel sobre entiende que el primer intervalo incluye todos los valores menores que su lmite inferior. Paso 4: Como el histograma tendr 5 intervalos, contiguas: c3:c7. Paso 5: En la barra men seleccione la opcin frmulas, seleccione el submen ms funciones, posteriormente estadsticas y el botn de frecuencia: =frequencia(a1:a20, b1:b4) Observe que la primera parte contiene la lista de datos entre la a1 y la a20. Despus se coloca una coma y un espacio. La segunda parte contiene la lista de lmites superiores de cada intervalo b1:b4. se seleccionan 5 celdas

24

En la barra de datos se ingresan los valores de la columna a (a1:a20) y en la de grupos los valores de la columna b (b1:b4), se presiona aceptar. Paso 6: Presione simultneamente las teclas Control-Shift-Enter. Ver que se desplegarn una lista de cinco nmeros. Estos corresponden a la frecuencia de cada intervalo. Ejercicios: 1. Para cada uno de los siguientes, se indica el nmero de intervalos deseados, el dato mayor y el dato menor. Determine el ancho comn de los intervalos. 1. Nmero de intervalos deseados es 5; dato mayor = 20; dato menor = 4. 2. Nmero de intervalos deseados es 5; dato mayor = 30; dato menor = 8. 3. Nmero de intervalos deseados es 8; dato mayor = 20; dato menor = 4. 4. Nmero de intervalos deseados es 10; dato mayor = 100; dato menor = 8. 5. Nmero de intervalos deseados es 10; dato mayor = 50; dato menor = 20.

Histograma de frecuencias En estadstica un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables. Tipos de histograma Diagramas de barras simples. Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categora que representa.

25

Polgono de frecuencias. Es un grfico de lneas que se usa para presentar las frecuencias absolutas de los valores de una distribucin en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.

Construccin de un histograma Paso 1 Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor. Ejemplo: 9-1= 8 Paso 2 Obtener los nmeros de clases, existen varios criterios para determinar el nmero de clases (o barras), sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cmo estn los datos y cuntos sean. Un criterio usado frecuentemente es que el nmero de clases debe ser aproximadamente a la raz cuadrada del nmero de datos. Por ejemplo, la raz cuadrada de 30 (nmero de datos) es mayor que cinco, por lo que se seleccionan seis clases. Ejemplo: 20 datos, raz de 20= 4.47 = 5 clases Paso 3 Establecer la longitud de clase: es igual al rango dividido por el nmero de clases. Ejemplo: 8/5= 1.6 =2 Paso 4 Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relacin al resultado del PASO 2 en intervalos iguales. 2 Paso 5 Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un grfico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectngulos se obtiene el polgono de frecuencias. 26

Elaboracin de un histograma de frecuencias en Excell

Una vez que est disponible la tabla de frecuencias en el programa Excell, se hace click en datos, opcin del men superior. En datos se busca la opcin anlisis de datos, si no se encuentra disponible, se carga siguiendo las indicaciones de ayuda. Una vez instalado la opcin anlisis de datos, se hace click y se selecciona la opcin histograma, colocando en la celda Rango de entrada el total de los datos de la columna A1 y en la celda Rango de clases los datos de la columna B, damos click en crear grfico y nos despliega una representacin como la siguiente:

Histograma10 Frecuencia 8 6 4 2 0 2 4 6 Clase 8 y mayor... Frecuencia

Polgono de frecuencias

Un polgono de frecuencias es un grfico que se realiza a travs de la unin de los puntos ms altos de las columnas de un histograma de frecuencia. Un polgono de frecuencias permite representar, por ejemplo, las temperaturas mximas promedio de un pas en un periodo de tiempo. En el eje X (horizontal), pueden sealarse los meses del ao (enero, febrero, marzo, abril, etc.) En el eje Y (vertical), se indican 27

las temperaturas mximas promedio de cada mes (24, 25, 27, etc.). El polgono de frecuencias se crea al unir, con una lnea, todas las temperaturas mximas promedio.

Elaboracin de un Polgono de frecuencias en Excell

Una vez que disponemos del histograma de frecuencias, se coloca en cursor sobre el grfico y se presiona el botn derecho del mouse. En el men que se despliega se puede observar la opcin cambiar tipo de grfico, se hace click y se selecciona el grfico deseado, el cual puede quedar como la siguiente imagen.

Polgono de FrecuenciaFrecuencia 10 5 0 2 4 6 Clase 8 10 Frecuencia

28

Tabla de frecuencia e histograma en ExcellA B

C

D

29

DIAGRAMA DE PARETO: HERRAMIENTA BSICA PARA LA MEJORA DE LA CALIDADConcepto de Diagrama de Pareto El diagrama de Pareto es una herramienta que se utiliza para priorizar los problemas o las causas que los generan. El nombre de Pareto fue dado por el Dr. Juran en honor del economista italiano WILFREDO PARETO (1848-1923) quien realiz un estudio sobre la distribucin de la riqueza, en el cual descubri que la minora de la poblacin posea la mayor parte de la riqueza y la mayora de la poblacin posea la menor parte de la riqueza.

El Dr. Juran aplic este concepto a la calidad, obtenindose lo que hoy se conoce como la regla 80/20. Segn este concepto, si se tiene un problema con muchas causas, podemos decir que el 20% de las causas resuelven el 80 % del problema y el 80 % de las causas solo resuelven el 20 % del problema. Se recomienda el uso del diagrama de Pareto para: Identificar oportunidades para mejorar Identificar un producto o servicio para el anlisis de mejora de la calidad. Si se requiere llamar la atencin a los problemas o causas de una forma sistemtica. Analizar las diferentes agrupaciones de datos. Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones Evaluar los resultados de los cambios efectuados a un proceso comparando sucesivos diagramas obtenidos en momentos diferentes, (antes y despus) Cuando los datos puedan clasificarse en categoras Cuando el rango de cada categora es importante Para comunicar fcilmente a otros miembros de la organizacin las conclusiones sobre causas, efectos y costes de los errores. 30

Los propsitos generales del diagrama de Pareto son: Analizar las causas Estudiar los resultados Planear una mejora continua La Grfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar visualmente en una sola revisin las minoras de caractersticas vitales a las que es importante prestar atencin y de esta manera utilizar todos los recursos necesarios para llevar a cabo una accin de mejora sin malgastar esfuerzos en problemas triviales. Algunos ejemplos de tales minoras de caractersticas vitales seran:

La minora de clientes que representen la mayora de las ventas. La minora de productos, procesos, o caractersticas de la calidad causantes del grueso de desperdicio de los costos de re-trabajo. La minora de rechazos que representa la mayora de quejas de los clientes. La minora de vendedores que est vinculada a la mayora de partes rechazadas. La minora de problemas causantes del grueso del retraso de un proceso. La minora de productos que representan la mayora de las ganancias obtenidas. La minora de elementos que representan la mayor parte del costo de un inventario etc.

Ejemplo de aplicacin del diagrama de Pareto:

Un fabricante de accesorios plsticos desea analizar cules son los defectos ms frecuentes que aparecen en las unidades al salir de la lnea de produccin. Para esto, empez por clasificar todos los defectos posibles en sus diversos tipos:

31

Tipo de defecto Mal color Fuera de medida Mal terminacin Rotura Desbalanceo Aplastamiento Incompleto Mal alabeo Otros

Detalle del problema El color no se ajusta a lo requerido por el cliente Ovalizacin mayor a la admitida Aparicin de rebabas El accesorio se quiebra durante la instalacin El accesorio requiere contrapesos adicionales El accesorio se aplasta durante la instalacin Falta alguno de los insertos metlicos Nivel de alabeo no aceptable Otros defectos

Posteriormente, un inspector revisa cada accesorio a medida que sale de la produccin registrando sus defectos de acuerdo con dichos tipos. Al finalizar la jornada, se obtuvo una tabla como esta. Tipo defecto de Detalle del problema Frec Frec. rel % 42.6 Acum % 42.6

Aplastamiento

El accesorio se aplasta durante la 40 instalacin El accesorio se quiebra durante la 35 instalacin

Rotura

37.2

79.8

Fuera medida Mal color Mal alabeo Mal terminacin

de Ovalizacin mayor a la admitida

8

8.5

88.3

El color no se ajusta a lo requerido Nivel de alabeo no aceptable Aparicin de rebabas

3 3 2

3.2 3.2 2.1

91.5 94.7 96.8

32

Incompleto Desbalanceo

Falta alguno de los insertos metlicos El accesorio adicionales Otros defectos requiere

2

2.1 1.1

98.9 100

contrapesos 1

Otros TOTAL

0 94

0

100

La tercera columna muestra el nmero de accesorios que presenta cada tipo de defecto, es decir, la frecuencia con que se presenta cada defecto. En lugar de la frecuencia numrica podemos utilizar la frecuencia porcentual, es decir, el porcentaje de accesorios en cada tipo de defecto, lo cual se indica en la cuarta columna. En la ltima columna vamos acumulando los porcentajes

Para hacer ms evidente los defectos que aparecen con mayor frecuencia hemos ordenado los datos de la tabla en orden decreciente de frecuencia. Vemos que la categora otros siempre debe ir al final, sin importar su valor. De esta manera, si hubiese tenido un valor ms alto, igual debera haberse ubicado en la ltima fila.

Podemos ahora representar los datos en un histograma como el siguiente:

33

Ahora resulta evidente cuales son los tipos de defectos ms frecuentes. Podemos observar que los 2 primeros tipos de defectos se presentan en el 79,8 % de los accesorios con fallas. Por el Principio de Pareto, concluimos que: La mayor parte de los defectos encontrados en el lote pertenece slo a 2 tipos de defectos (los pocos vitales), de manera que si se eliminan las causas que los provocan desaparecera la mayor parte de los defectos.

Otro anlisis complementario y sumamente til e interesante, es calcular los costos de cada problema, con lo cual podramos construir un diagrama similar a partir de ordenar las causas por sus costos.

Este anlisis combinado de causas y costos permite obtener la mayor efectividad en la solucin de problemas, aplicando recursos en aquellos temas que son relevantes y alcanzando una mejora significativa.

REPASO No. 1Concepto 1 Dato Breve descripcin Representacin simblica de un atributo o caracterstica de un objeto (ser o fenmeno) Conjunto de datos significativos y relevantes que describen hechos, sucesos (eventos o fenmenos) Conjunto de informaciones e ideas adquiridas y ejercidas por cada persona Caracterstica o atributo de clase no numrica, ejemplos: estado civil, color de piel, idioma, religin. Caracterstica o atributo descrito en magnitudes ejemplos: altura, velocidad, temperatura, luminosidad, distancia, peso, nmero de integrantes Disciplina que describe el estado (conjunto de datos) sobre un hecho o fenmeno Disciplina que infiere, predice o estima el comportamiento futuro de un

2

Informacin

3

Conocimiento

4

Variable cualitativa Variable cuantitativa

5

6

Estadstica descriptiva Estadstica

7

34

inferencial 8 Poblacin

hecho o fenmeno Conjunto finito o infinito de individuos (objetos o seres) que presentan caractersticas o comportamientos similares: arboles, piedras, artculos, etc. Parte de una poblacin con caractersticas similares Indagatoria sobre las caractersticas de todos los individuos de una poblacin Registro de observaciones sobre una muestra de personas

9 10

Muestra Censo

11

Encuesta

12

Escala nominal

Nivel que agrupar, nombrar o categoriza objetos o fenmenos similares ejemplo: grupo de tornillos, clavos, hojas, escritorios, etc. Sin definir magnitudes Nivel que ordena objetos o fenmenos de acuerdo a sus caractersticas o atributos, usa magnitudes Nivel que organiza objetos o fenmenos en rangos o lapsos (aos, edades, ingresos) Nivel que organiza datos a partir de un punto cero (ausencia de caracterstica), ejemplo: cantidad de hijos 0, 3, 6 Herramienta estadstica para organizar (agrupar) o tabular datos de hechos o fenmenos Espacio que existe entre un punto y otro, tomando en cuenta los puntos intermedios Caracterstica o atributo que muestra valores intermedios (medidas, velocidades, temperatura, etc) Caracterstica o atributo que no muestra valores intermedios (nmero de personas o cosas, etc) Representacin esquemtica de un conjunto de datos para facilitar su observacin

13

Escala ordinal

14

Escala de intervalo Escala de razn

15

16

Tabla de frecuencias Intervalo

17

18

Variable continua Variable discreta Grafico

19

20

35

TAREA No. 1

Nombre:_______________________________________________________ 1. Seala con una X si la variable mencionada es cualitativa o cuantitativa. Si es cuantitativa, indica con una X si es variable discreta o continua. VariablePresencia de brigadas de emergencia en empresas Peso en kg de plstico recuperado Nmero de trabajadores afiliados al IMSS Nmero de empresas certificadas como empresas limpias Vida til en horas de focos ahorradores Estado civil de los integrantes de una poblacin Registros de la precipitacin en mm en Quertaro Dimetro del tallo de una poblacin de rboles Categora de preferencia sexual de una poblacin humana Defunciones por accidentes automovilsticos en Quertaro

Cualitativa

Cuantitativa Discreta

Continua

2. Un funcionario pblico de la Junta de Agua Potable est interesado en conocer el nivel de cuidado del agua que tienen los habitantes que poseen cisterna o aljibe en sus casas. Est planeando entrevistar a 300 de esos habitantes: Define la poblacin de estudio y menciona cual es la muestra:

Elabora tres preguntas cuantitativas y tres cualitativas para responder a la inquietud planteada. 36

MTODOS ESTADSTICOS PRIMER EXAMEN

N0MBRE_________________________________________________________ Uno. Coloca el nmero del concepto que corresponda a la definicin apropiada 1 Estadstica descriptiva 8 Estado civil, preferencia sexual, opinin, religin, idioma. Mtodos y herramientas que permiten estimar la situacin o comportamiento futuro de hechos, poblaciones o fenmenos. Atributo, caracterstica de un individuo, muestra o poblacin que no es constante. Conjunto de valores entre dos puntos de una recta. Mtodos y herramientas que permiten indagar y describir el comportamiento de hechos, poblaciones o fenmenos. Porcin de una poblacin. Temperatura, luminosidad. velocidad, longitud, altura,

2

Poblacin

10

3

Ejemplos de variables 6 cuantitativas Ejemplos discreta Intervalo de variable 5

4

5

1

6 7

Variable Ejemplos continua de

9 variable 3

8

Ejemplos de variables 7 cualitativas Muestra 2

Grados centgrados, metros, coordenadas geogrficas. Conjunto de individuos con caractersticas similares que ocupan un espacio y tiempo determinado. Automviles, seres humanos, cabezas de ganado.

9

10

Estadstica inferencial

4

Dos. Un centro de acopio de residuos generados por actividades humanas recibi durante 50 das diversas cantidades de materiales residuales, los valores 37

fluctuaron entre 57 y 132 kg por da, el responsable desea saber cul es la cantidad ms frecuente. Define el ancho del intervalo si: Se desean 5 intervalos de clase. = 15 Se desean 6 intervalos de clase. = 12 Se desean 7 intervalos de clase. = 11 Se desean 8 intervalos de clase. = 9 Se desean 9 intervalos de clase. = 8

Tres. En la tabla siguiente se presentan las cantidades en kilogramos de basura que depositan cotidianamente en un tiradero a cielo abierto: 687 834 862 896 925 942 975 1019 700 838 863 902 927 946 980 1044 723 851 871 908 929 949 987 1055 776 855 873 912 929 957 1008 1083 824 855 879 914 941 974 1017 1096

El histograma resultante es:

Histograma35 30 25 Frecuencia 20 15 Frecuencia 10 5 0 800 1000 Clase 1100 y mayor...

Interpreta brevemente el grfico:

38

MEDIDAS DE TENDENCIA CENTRALLa tendencia central se refiere al punto medio de una distribucin de datos, las medidas de tendencia central tambin se conocen como medidas de posicin. Con ellas localizamos el centro de una base de datos. La media o promedio, la moda y la mediana son las tres principales medidas de tendencia central utilizadas en la estadstica descriptiva, sirven para describir una poblacin o una muestra.

La media aritmtica o promedio La media es el valor obtenido sumando todas las observaciones y dividiendo el total por el nmero de observaciones que hay en el grupo. La media resume en un valor las caractersticas de una variable teniendo en cuenta todos los valores o datos. Esta medida se simboliza con (x con raya superior) cuando representa la media muestral (estadstico muestral) y para representar la media poblacional (parmetro poblacional). La media o es la suma de todos los valores de la muestra o poblacin, divididos por el nmero de casos. Por ejemplo, los resultados de 5 alumnos en una evaluacin fueron: 39

Alumno 1 2 3 4 5

Resultado 6.0 5.4 3.1 7.0 6.1

Primero: se suman las notas: 6.0+5.4+3.1+7.0+6.1 = 27.6 Segundo: el total se divide entre la cantidad de alumnos: 27.6/5=5.52 Tercero: La media aritmtica en este ejemplo es 5.52 Definicin formal Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica como

Esta definicin vara, aunque no sustancialmente, cuando se trata de variables continuas, esto es, tambin puede calcularse para variables agrupadas en intervalos.

40

Propiedades Las principales propiedades de la media aritmtica son:

Su clculo es muy sencillo y en l intervienen todos los datos. Su valor es nico para una serie de datos. Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado acompaarla de una medida de dispersin.

Inconvenientes de su uso Este parmetro, an teniendo mltiples propiedades que aconsejan su uso en situaciones muy diversas, tiene tambin algunos inconvenientes, como son:

Para datos agrupados en intervalos (variables continuas) su valor oscila en funcin de la cantidad y amplitud de los intervalos que se consideren.

Es una medida a cuyo significado afecta sobremanera la dispersin, de modo que cuanto menos homogneos sean los datos, menos informacin proporciona. Dicho de otro modo, poblaciones muy distintas en su composicin pueden tener la misma media. Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente, tendra una estatura media de 1,95 m, valor que representa fielmente a esta poblacin homognea. Sin embargo, un equipo de jugadores de estaturas ms heterogneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendra tambin, como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi ninguno de sus componentes.

En el clculo de la media no todos los valores contribuyen de la misma manera. Los valores altos tienen ms peso que los valores cercanos a cero. Por ejemplo, en el clculo del salario medio de un empresa, el salario de un alto directivo que gane 1.000.000 tiene tanto peso como el de diez empleados "normales" que ganen 1.000 . En otras palabras, se ve muy afectada por valores extremos.

41

Una debilidad de la media aritmtica es que es sensible a valores extremos de la distribucin y que carece de sentido para variables medidas con un nivel nominal u ordinal.

Moda La moda es el dato ms repetido, el valor de la variable con mayor frecuencia absoluta. En cierto sentido la definicin matemtica corresponde con la locucin "estar de moda", esto es, siempre que sea lo ms usado. La moda es la medida de tendencia central ms fcil de calcular y tambin es la ms sujeta a fluctuaciones cuando cambian unos pocos valores de la distribucin. Por esta razn la moda se suele usar para una evaluacin rpida de la tendencia central. La moda se define como el valor ms frecuente de una distribucin. En una tabla de frecuencias, la frecuencia mayor es la que contiene la moda. Su clculo es sencillo, pues slo necesita un recuento. Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-46-9-5-6-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5. Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Cuando en una distribucin de datos se encuentran tres o ms modas, entonces es multimodal. Por ltimo, si todas las variables tienen la misma frecuencia diremos que no hay moda.

Propiedades Sus principales propiedades son:

42

Clculo sencillo. Interpretacin muy clara. Al depender slo de las frecuencias, puede calcularse para variables cualitativas. Este es el parmetro ms utilizado cuando al resumir una poblacin no es posible realizar otros clculos, por ejemplo, cuando se enumeran en medios periodsticos las caractersticas ms frecuentes de determinado sector social.

Esta medida se usa ms y tiene ms sentido cuando se describen datos nominales, de hecho es la nica medida de tendencia central que funciona con este tipo de escala. Inconvenientes

Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del nmero de intervalos y de su amplitud.

Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor.

No siempre se sita hacia el centro de la distribucin. Puede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales).

La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. Por ejemplo: Hallar la moda de la distribucin: Datos: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

43

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas. Datos: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. Datos: 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes. Datos: 0, 1, 3, 3, 5, 5, 7, 8 3+5=8/2=4 Mo = 4

Clculo de la moda para datos agrupados, si todos los intervalos tienen la misma amplitud.

Li es el lmite inferior de la clase modal. fi es la frecuencia absoluta de la clase modal. fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal. fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal. ai es la amplitud de la clase. Ejemplo Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:

44

66= Limite inferior de la clase modal (Li) 18= frecuencia absoluta inmediatamente inferior a la clase modal (fi-1) 42= Frecuencia absoluta de la clase modal (fi) 27= frecuencia absoluta inmediatamente posterior a la clase modal (fi+1) 3= amplitud de la clase (ai)

Mediana En el mbito de la estadstica, una mediana es el valor de la variable que deja el mismo nmero de datos antes y despus que l, una vez ordenados estos. De acuerdo con esta definicin el conjunto de datos menores o iguales que la

45

mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra. La mediana Me de un conjunto de mediciones x1, x2, x3,..xn es el valor de x que se encuentra en el punto medio o centro cuando se ordenan los valores de menor a mayor. Por ejemplo, la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:

Me

= (n+1) / 2

Me = (13+1) / 2 Me = 14 / 2=7 En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:

Se toma como mediana

46

Existen dos estrategias para calcular la mediana: considerando los datos en forma individual, sin agruparlos, o bien utilizando los datos agrupados en intervalos de clase. A continuacin se describe un ejemplo con datos sin agrupar. Datos sin agrupar Sean los datos de una muestra ordenada en orden creciente y

designando la mediana como Me, distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posicin

una vez que

los datos han sido ordenados (en orden creciente o decreciente), porque ste es el valor central. Es decir: .

Por ejemplo, si tenemos 5 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9 => El valor central es el tercero: por encima de l (x4, x5). b) Si n es par, la mediana es la media aritmtica de las dos observaciones centrales. Cuando n es par, los dos datos que estn en el centro de la muestra ocupan las posiciones y . Es decir: . . Este valor, que es la

mediana de ese conjunto de datos, deja dos datos por debajo (x1, x2) y otros dos

Por ejemplo, si tenemos 6 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9, x6 = 10 => Hay dos valores que estn por debajo del dos que quedan por encima del siguiente dato y otros . Por tanto, la

mediana de este grupo de datos es la media aritmtica de estos dos datos: .

47

Propiedades e inconvenientes Las principales propiedades de la mediana son: Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripcin en la serie del ejemplo anterior en, pongamos por caso, el ltimo nmero, deja a la mediana inalterada. No se ve afectada por la dispersin. De hecho, es ms representativa que la media aritmtica cuando la poblacin es bastante heterognea. Suele darse esta circunstancia cuando se resume la informacin sobre los salarios de un pas o una empresa. Hay unos pocos salarios muy altos que elevan la media aritmtica haciendo que pierda representatividad respecto al grueso de la poblacin. Sin embargo, alguien con el salario "mediano" sabra que hay tanta gente que gana ms dinero que l, como que gana menos. Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor vara en funcin de la amplitud de estos. Por otra parte, no se presta a clculos algebraicos tan bien como la media aritmtica. Comparacin entre las diferentes medidas de tendencia central Las tres medidas de tendencia central: media, mediana y moda, no son igualmente tiles para obtener la tendencia central de una distribucin o conjunto de valores (datos). Cada una de las medidas tiene caractersticas que hacen que su empleo sea una ventaja en ciertas condiciones y en otras no.

48

Medida de tendencia central Media

Ventajas y desventajas

Incorpora todos los datos de la variable y su valor suele ser ms estable. Su valor es nico para una serie de datos. Se usa con frecuencia para comparar poblaciones, es ms apropiada acompaarla de una medida de dispersin. La afecta sobremanera la dispersin, cuanto menos homogneos son los datos, menos informacin proporciona. Es sensible a valores extremos de la distribucin y carece de sentido para variables medidas con un nivel nominal u ordinal.

Moda

Mediana

Clculo sencillo. Recomendada para variables cualitativas. Se usa ms y tiene ms sentido para datos nominales. Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. No siempre se sita hacia el centro de la distribucin. Preferida cuando se emplea una escala ordinal (situacin donde el valor asignado slo indica el orden entre los casos). Es menos sensible que la media a oscilaciones de los valores de la variable. No se ve afectada por la dispersin. No se presta a clculos algebraicos tan bien como la media aritmtica.

Para calcular la media, moda y mediana a travs de excell, se realizan los siguientes pasos: 1. Se puede utilizar la va de establecer la formula en la barra de funcin de la siguiente manera: =PROMEDIO(----------) dentro del parntesis se colocan los valores,

seleccionndolos con el cursor. =MODA(-----------) dentro del parntesis se colocan los valores,

seleccionndolos con el cursor. =MEDIANA(-----------) dentro del parntesis se colocan los valores,

seleccionndolos con el cursor. =DESVEST(----------) dentro del parntesis se colocan los valores,

seleccionndolos con el cursor.

49

=VAR(------------)dentro del parntesis se colocan los valores, seleccionndolos con el cursor. La otra ruta es presionar el botn FORMULAS, posteriormente el de MAS FUNCIONES y all seleccionar la funcin deseada: media, moda o mediana, etc. En cada una de ellas aparece un cuadro denominado ARGUMENTO DE FUNCIN, en cuya barra inicial se seleccionan todos los valores a procesar, se da clik en aceptar y el resultado aparece en la casilla seleccionada para tal efecto. Otra va es utilizar insertar funcin fx, se despliega un men como el siguiente, donde se selecciona la funcin deseada:

50

MEDIDAS DE DISPERSIN O VARIABILIDAD Las medidas de variabilidad indican la dispersin de los datos de una distribucin. Las medidas de dispersin son intervalos, distancias o un nmero de unidades en la escala de medicin. Este tipo de medida se complementa con las medidas de tendencia central o centralidad y ambas permiten describir a la mayora de las distribuciones. Las medidas de dispersin describen la distribucin de los valores de la serie, analizando si estos se encuentran ms o menos concentrados, o ms o menos dispersos. Las ms comunes son: el rango, la desviacin estndar y la varianza. El rango El rango, recorrido o amplitud de un conjunto de mediciones, es la diferencia entre el valor mayor y el valor menor, indica el nmero necesario y mnimo de unidades, en la escala de medicin, para incluir los valores mnimo y mximo. Cuanto ms grande es el rango, mayor ser la dispersin de los datos de una distribucin. El rango es adecuado para medir la variacin de pequeos conjuntos de datos. La desviacin estndar La desviacin estndar es la medida de dispersin ms ampliamente usada y es la ms estable ya que depende de todos los valores de la distribucin. La raz cuadrada de la suma de las desviaciones alrededor de la media, elevadas al cuadrado y divididas entre el nmero de casos menos uno. Cuando se trabaja con muestras la desviacin estndar se simboliza con una S y con la letra sigma minscula cuando se usan datos de una poblacin. Se calcula como la raz cuadrada de la varianza:

= n1 (xi-)2 / N

S= n1 (xi -)2 / n-1

51

en mayscula se utiliza para indicar sumatoria: 1n xi = x1 + x2 + x3 + x4+xn Donde x es el valor de cada medicin de la variable de estudio e i un ndice que vara de 1 a n. El nmero de datos de la muestra se identifica con la letra n y de la poblacin con N. La desviacin estndar se interpreta como la cantidad o el cunto se desva de la media un conjunto de valores. Este valor se grafica como un intervalo, solo se utiliza con variables continuas u ordinales. Ejemplo de clculo de desviacin estndar S, datos no agrupados:

S=((55-76.1)2+(62-76.1)2+(67-76.1)2+(68-76.1)2+69-76.1)2+(79-76.1)2+(8876.1)2+(89-76.1)2+(92-76.1)2+(92-76.1)2) /9 S= 13.6 La varianza La varianza mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamao de la muestra. La varianza es la desviacin estndar elevada al cuadrado y se simboliza como S2 cuando es muestral y 2 cuando es poblacional. Esta es una medida que se usa en muchas pruebas de hiptesis estadsticas inferenciales. Para fines descriptivos de prefiere usar la desviacin estndar. S2= (x-)2 / n-1 La varianza siempre ser mayor que cero. Mientras ms se aproxima al cero, ms concentrados estn los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms dispersos estn.

52

Para calcular la la desviacin estndar y la varianza a travs de excell, se realizan los siguientes pasos: 1. Se puede utilizar la va de establecer la formula en la barra de funcin de la siguiente manera: =DESVEST(----------) dentro del parntesis se colocan los valores,

seleccionndolos con el cursor. =VAR(------------)dentro del parntesis se colocan los valores, seleccionndolos con el cursor. La va rpida para el clculo de los estadsticos de tendencia central y dispersin es el uso de botn DATOS, posteriormente el de ANLISIS DE DATOS, que se ubica en la parte superior derecha. Si no est disponible se carga de la siguiente manera: Se presiona el cono de Microsoft, ubicado en la parte superior izquierda y se despliega el men. Se elige el botn de opciones de excell ubicado en la parte inferior de la pantalla anterior. En el men de opciones de excell se elige complementos. En ver y administrar complementos de excell se presiona ir ubicado en la parte inferior y se da aceptar. En complemento, colocar el curso en la casilla de anlisis de datos dar clik y aceptar. Posteriormente se carga el complemento y podemos usarlo. Ya ubicados en anlisis de datos elegimos estadstica descriptiva damos aceptar, colocamos los datos en la casilla de rango de entrada, se marca resumen de estadsticas, finalmente presionamos aceptar 53

El resultado es el siguiente:Columna1 Media Mediana Moda Desviacin estndar Varianza de la muestra Rango Mnimo Mximo Suma Cuenta o nmero de datos de la distribucin 76.5 74 92 13.19301162 174.0555556 37 55 92 765 10

Coeficiente de variacin de Pearson El coeficiente de variacin o CV, es un cociente entre la desviacin estndar y la media de los datos, expresado en porcentaje. CV= (S/ ) 100 Este coeficiente permite comparar la variabilidad de diferentes muestras en una misma variable o la variabilidad existente entre variables diferentes. Interpretacin de las medidas de tendencia central y de dispersin o variabilidad Al describir los datos de una distribucin deben interpretarse de manera conjunta las medidas de tendencia central y de dispersin. Con la media y la desviacin estndar se pueden construir intervalos donde supuestamente estn l mayora de los datos. La moda, la mediana y el rango pueden completar la informacin sobre los datos y as comprender lo que sucede con la variable de estudio. En una variable continua: La media, la mediana y la moda son puntos en una recta La desviacin estndar y el rango son intervalos.

54

REPASO No. 2

Identifiquen y nombren los siguientes signos o formulas:

Media de la muestra

Media de la poblacin

Formula de la media

Formula de la mediana par

Formula de la mediana impar

S

Desviacin estndar de la muestra

Desviacin estndar de la poblacin

Formula de la Moda

=

n 1

(xi-) / N

2

Formula de la desviacin estndar de la poblacin

S=

n 1

(xi -) / n-1

2

Formula de la desviacin estndar de la muestra

Signo de sumatoria

55

S

2

Varianza muestral

2

Varianza poblacional

S = (x-) / n-1

2

2

Formula de la varianza muestral

Identifica los valores de los siguientes conceptos en la tabla:Li es el lmite inferior de la clase modal= fi es la frecuencia absoluta de la clase modal= fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal= fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal= ai es la amplitud de la clase=

Amplitud de clase (60,63) (63.66) (66.69) (69.72) (72,75)

Frecuencia absoluta 5 18 42 27 8

Explica el cuadro siguiente:

Estadstica descriptiva Media Mediana Moda Desviacin estndar Rango Mnimo Mximo Suma Cuenta 76.5 74 92 13.1 37 55 92 765 10

56

TAREA No. 2 Nombre:_______________________________________________________

Medidas de tendencia central a) Un fabricante de filtros para chimeneas debe decidir cul de dos modelos diferentes de filtros tiene una mayor eficiencia. El fabricante basar su decisin en los resultados de cinco pruebas para ambos modelos bajo las mismas condiciones de operacin donde el mejor filtro ser aquel que presente un menor porcentaje de luz filtrada. Los resultados son los siguientes: Prueba Filtros A B 1 13.2 13.4 2 13.1 13.5 3 13.1 13.5 4 18.2 13.6 5 13.2 13.5

Con base en los datos anteriores cul de los dos filtros debe elegir el fabricante? por qu? Debera ser diferente la seleccin si el fabricante supiera que hubo un cambio en la intensidad de la energa luminosa durante la cuarta medicin del modelo A? por qu?

b) Suponga que, por un error, se registra un conjunto de datos que contiene la DQO para una muestra de agua de 713, 715, 714, 713, 716, 716 y 176 mg/L, donde el ltimo valor debi haber sido 716 en vez de 176. Muestre que tanto se ven afectadas la media y la mediana por el error cometido. c) Un fabricante de focos ahorradores de energa tom una muestra de 13 piezas de la produccin de un da y las utiliz en forma continua hasta que comenzaron a fallar. El resultado en das de funcionamiento fue: 1142, 1226, 1117, 1345, 1064, 1251, 1349, 1431, 1312, 1066, 1292, 1362, 1098. Calcule la media y la mediana. Qu medida descriptiva parece ser la mejor? Por qu? De qu forma le puede ser til esta informacin al fabricante?

d) Examinando los registros del nmero de extintores sujetos a mantenimiento a la semana por un prestador de este servicio, un auditor toma una muestra de 20 de estos registros: 8, 27, 19, 12, 34, 19, 5, 4, 12, 22, 11, 28, 12, 11, 10, 11, 8, 6, 7, 16 Calcule la media y la mediana. 57

TEORA DE CONJUNTOSDEFINICIONES DE CONJUNTOS Algunas definiciones de conjunto son: Un conjunto es la reunin en un todo de objetos bien definidos y diferenciables entre s, que se llaman elementos del mismo. Un conjunto es una coleccin de elementos que se agrupan mediante algunas caractersticas en comn y que solo aparecen una sola vez en el grupo respectivo. Es una coleccin bien definida de objetos o cosas, donde, bien definida significa distinguir con claridad los elementos que forman parte del conjunto. Son colecciones, agrupaciones o reuniones de elementos a los cuales identificamos por tener propiedades en comn. Es una coleccin de objetos; en los que a cada uno de los objetos que componen ese conjunto se le denomina elemento del mismo. De lo dicho anteriormente, se introduce la relacin de pertenencia. El smbolo usual para representar esta relacin es el smbolo , una versin de la letra son llamados griega (psilon). Los segundos argumentos de la relacin

conjuntos, y los primeros argumentos son llamados elementos. As, si la frmula

Para representar que un elemento "a" pertenece al conjunto "A" se aplica el smbolo de pertenencia (). De esta forma a A y se lee: "a" pertenece a "A". Esta relacin se conoce como relacin de pertenencia, seala la relacin entre elementos y conjuntos exclusivamente.

58

Si un elemento no pertenece a un conjunto se denota por (), por ejemplo si b no pertenece a A se expresara como b A, que se lee: b no pertenece a A. Algunos ejemplos de pertenencia son: Conjuntos D = Un da de la semana m = mayo M = Un mes del ao l = lunes Z = Un nmero entero n=2 NZ mM Elementos Pertenencia lD

Entonces se puede decir que el smbolo se utiliza para comparar o relacionar un conjunto respecto de un elemento y nos permite relacionar la pertenencia o no, de un elemento en un conjunto. No es correcto utilizar este smbolo para comparar dos conjuntos si no que exclusivamente para relacionar elementos respecto de un conjunto.

59

Formas de describir un conjunto

1).- Enumerando todos los elementos del conjunto (solo se puede hacer si el conjunto es finito) 2).- Por medio de una propiedad caracterstica de los elementos que forman a ese conjunto, esta propiedad puede expresarse de forma ordinaria o utilizando alguna simbologa lgica. Nota: Los conjuntos se nombran con letras maysculas latinas, los elementos se colocan entre llaves, por ejemplo:

A ={0,1,2,3,4,5,6,7,8,9} B = {a,v,e,s} C = {Las soluciones de la ecuacin N = {1,2,3,4,5,6,...} = {los nmeros naturales} L={ donde n=1,2,3,4,...} }

Sin embargo, existen formas ms formales para describir el contenido de un conjunto como son las formas tabular o extensiva y la constructiva o por comprensin. DETERMINACIN DE UN CONJUNTO Para determinar la forma de describir cmo han de agruparse los conjuntos comnmente se utilizan dos formas: la tabular o extensiva y la constructiva o por comprensin.

60

La forma tabular o extensiva. Es cuando el

conjunto es determinado por

extensin (o enumeracin), cuando se da una lista que comprende a todos los elementos del conjunto y slo a esos elementos. Ejemplos: A = { a, e, i, o, u } B = { 0, 2, 4, 6, 8 } C = { c, o ,n , j, u, t, s } D = {A, B, E, C, D, R, I, O}

La forma constructiva o por comprensin. Es cuando un conjunto de elementos poseen una caracterstica o propiedad, la cumplen para todos los elementos del conjunto. Ejemplos: A = { x l x es nmero entero} B = { x I x es un nmero par menor que 10} C = { x I x es una letra de la palabra conjuntos} D = {x I x es una mujer de nacionalidad mexicana} E = {x I x es color bsico}

Cuadro comparativo de cmo describir dos conjuntos mediante la forma tabular o extensin y la forma constructiva o por comprensin.

POR EXTENSIN A = { a, e, i, o, u } POR COMPRENSIN A = { x I x es una vocal}

61

B = { 0, 2, 4, 6, 8 } C = {1, 3, 5, 7, 9 } D = { c, o, n, j, u, t, s} E = { b, c, d, f, g, h, j, .. . } F = { Laura, Javier } G = {mercurio}

B = { x I x es un nmero par menor que 10 } C = { x I x es un nmero impar menor que 10 } D = { x I x es una letra de la palabra conjuntos } E = { x I x es una consonante } F = {x I x es mdico y est en la clase} G = {x I x es un metal lquido }

Los axiomas de Zermelo-Fraenkel

La teora de conjuntos de Zermelo-Fraenkel toma como primitivos los conceptos de conjunto y de pertenencia y consiste de los diez axiomas siguientes:

Axioma de extensionalidad. Dos conjuntos X e Y son iguales (lo que se representa por X = Y) si contienen los mismos elementos. Ms formalmente, y en la simbologa usual,

Conjunto vaco. Existe un conjunto (representado por ) sin elementos. Esto es,

Axioma de pares. Dados cualesquiera conjuntos x e y, existe otro conjunto, representado por {x,y}, cuyos elementos son nicamente x e y. Esto es,

62

Axioma de la unin. Dada cualquier coleccin (conjunto) de conjuntos C, existe un conjunto, representado por y llamado unin de C, que

contiene todos los elementos de cada conjunto de C. Esto es,

Axioma del conjunto potencia Para cualquier conjunto x existe otro conjunto, representado por x. En smbolos, , que contiene todos los subconjuntos de

Esquema axiomtico de especificacin. Sea (v) una frmula de un lenguaje de primer orden que contenga una variable libre v. Entonces, para cualquier conjunto x existe un conjunto y cuyos elementos son aquellos elementos a de x que cumplen (a). Formalmente,

Esquema axiomtico de reemplazo. Si (a,b) es una sentencia tal que para cualquier elemento a de un conjunto x el conjunto existe, entonces existe una funcin

tal que f(a) = y. Formalmente, si

entonces

63

Axioma de infinitud. Existe un conjunto x tal que , entonces . En smbolos, .

y tal que si

Axioma de regularidad. Para todo conjunto no vaco x existe un conjunto tal que . Esto es, en trminos formales,

Axioma de eleccin. El producto cartesiano de cualquier familia no vaca de conjuntos no vacos es no vaco. Este axioma puede expresarse en trminos formales al igual que los otros, aunque resulta ms extenso.

Los axiomas anteriores, excepto el ltimo, constituyen la teora de ZermeloFraenkel, que se representa por ZF. Existen otros axiomas consistentes con los de ZF, como el axioma de constructibilidad y el axioma de eleccin. Una vez incorporado el axioma de eleccin a la teora ZF, la teora de conjuntos resultante se denota por ZFC. Resumen de los axiomas Dos conjuntos son iguales, s y solamente s tienen los mismos elementos. Existe un conjunto sin elementos llamado vaco. Si A y B son dos conjuntos, existe un conjunto cuyos nicos elementos son A y B. La reunin de un conjunto de conjuntos es un conjunto. Para todo conjunto A existe un conjunto que tiene por elementos las partes de A. El producto de una familia de conjuntos no vacos es un conjunto no vaco (axioma de eleccin). Ningn conjunto es elemento de s mismo. 64

CONJUNTOS FINITOS E INFINITOS Un conjunto es finito si consta de un cierto nmero de elementos distintos, es decir si al contar los diferentes elementos del conjunto el proceso de contar puede acabar. En caso contrario, el conjunto es infinito. Ejemplos: M = { x / x es un ro de la tierra } Conjunto finito N = { 0, 1, 2, 3, 4, 5, 6, 7, 8, ... } Conjunto infinito P = { x / x es un pas de la tierra } Conjunto finito V = { 3, 6, 9, 12, 15, 18, 21, 24, 27, ... } Conjunto infinito

DIAGRAMA DE VENN-EULEREl matemtico y lgico britnico, John Venn (1834 1923) es especialmente conocido por su mtodo de representacin grfica de proposiciones (segn su cualidad y cantidad) y silogismos. Los diagramas de Venn permiten, adems, una comprobacin de verdad o falsedad de un silogismo. Entre sus obras destaca Lgica Simblica y los principios de la lgica emprica o inductiva. Sin embargo, tambin fue importante la participacin de Euler en la esquematizacin de las representaciones de algunas operaciones. Cada conjunto de elementos se encuentra encerrado dentro de un circulo, o figura geomtrica, y estos a su vez estn encerrados dentro de otra figura, por lo general est es un rectngulo, se pueden dibujar cada elemento del conjunto o bien solo se puede indicar su existencia. Los diagramas de Venn son una buena herramienta, que nos permite realizar las operaciones entre los diversos conjuntos del universo de una forma ms sencilla.

65

OPERACIONES ENTRE CONJUNTOS UNIN DE CONJUNTOS. La unin de los conjuntos A y B es el conjunto formado por todos los elementos que pertenecen a A o a B o a ambos. Se denota: A U B. La unin de conjuntos se define como: A U B = {x I x A o x B} El grfico es la representacin de la unin A B

INTERSECCIN ENTRE CONJUNTOS. Se define la interseccin de dos conjuntos A y B al conjunto de elementos que son comunes a A y B. Se denota por A B, que se lee: A interseccin B. La interseccin de A y B tambin se puede B={x/x Ayx B } y mediante un diagrama de Venn-Euler:

definir: A

El grfico es la representacin de la interseccin

66

DIFERENCIA ENTRE CONJUNTOS. Se denomina diferencia de dos conjuntos A y B al conjunto formado por todos los elementos de A pero que no pertenecen a B. La diferencia se denota por: A - B que se lee: A diferencia B o A menos B. Se define la diferencia de dos conjuntos tambin como: A - B = {x / x Ayx B}

El grfico representa la diferencia entre conjuntos:

INCLUSIN ENTRE CONJUNTOS: Sean A y B dos conjuntos. El conjunto A est incluido en el conjunto B si se verifica que cada elemento de A pertenece a B. Se lee A es un subconjunto de B. No confundir pertenencia con inclusin: La pertenencia vincula un elemento con un conjunto. La inclusin vincula dos conjuntos. El conjunto A est incluido en el conjunto B. El conjunto A es un subconjunto del conjunto B.

67

Cuando dos conjuntos no tienen ningn elemento en comn se dice que son disjuntos.

Cuando los conjuntos tienen algunos elementos en comn:

68

Cuando todos los elementos de un conjunto estn contenidos en el otro, no es necesario que los conjuntos sean iguales:

TEOREMAS BSICOS DE UNIN E INTERSECCIN: Los conjuntos cuentan con algunas operaciones que son anlogas al lgebra y que pueden ser demostradas. Sean A,B,C cualquier conjunto entonces:

OPERACIN

Propiedad

a) A A = A ; A A =A

IGUALATIVA

b) A B = A B; A B = B A

CONMUTATIVA

c) (A B) C = A (B C) ; (A B) C = A (B C)

ASOCIATIVA

d) A ( B C) = (A B) (A C) ; A ( B C) = (A B) (A C)

DISTRIBUTIVA

69

Elaboracin de diagramas de Venn con Word, Excell o Power point Un diagrama de Venn emplea crculos cuyas intersecciones ilustrar similitudes, diferencias y relaciones entre grupos o conjuntos. Las similitudes se representan en las partes de interseccin de los crculos, mientras que las diferencias se representan en las partes que no lo hacen. Para realizar los grficos se pueden crear usando SmartArt de Word (botn de insertar en el men superior). Al usar un elemento grfico SmartArt, puede crear un diagrama de Venn e incluirlo en una hoja de clculo, un mensaje de correo electrnico, una presentacin o un documento.

Crear un diagrama de Venn 1. En el boton Insertar en el grupo Ilustraciones, haga clic en SmartArt.

2. En la galera Elegir un grfico SmartArt, haga clic en Relacin, haga clic en un diseo de diagrama de Venn (por ejemplo Venn bsico) y, a continuacin, en Aceptar. 3. Para escribir texto para definir un crculo, siga uno de estos procedimientos:

Haga clic en [Texto] en el panel de texto y, a continuacin, escriba el texto. Copie texto desde otra ubicacin o programa, haga clic en [Texto] en el panel de texto y, a continuacin, pegue el texto. 70

NOTA Si el panel de texto no est visible, haga clic en el control.

Haga clic en un crculo en el elemento grfico SmartArt y, a continuacin, escriba el texto

Agregar o eliminar crculos en el diagrama de Venn 1. Haga clic en el elemento grfico SmartArt al que desea agregar otro crculo. 2. Haga clic en el crculo existente que se encuentre ms cerca del lugar donde desea agregar el nuevo crculo. 3. En Herramientas de SmartArt, en la ficha Diseo del grupo Crear grfico, haga clic en Panel de texto.

Si no ve las fichas Herramientas de SmartArt o Diseo, asegrese de que ha seleccionado un elemento grfico SmartArt. 4. Siga uno de estos pasos:

Para insertar un crculo detrs del crculo seleccionado, que se superpondr al mismo, haga clic en Agregar forma detrs.

71

Para insertar un crculo delante del crculo seleccionado, que s