diagrama de cajas.docx

4

Click here to load reader

description

diagrama de cajas

Transcript of diagrama de cajas.docx

ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZOFACULTAD DE INFORMATICA Y ELECTRONICAINGENOERIA EN ELECTRONICA TELECOMUNICACIONES Y REDES

Nombre: Herick PacaCdigo: 655Semestre. Cuarto BDiagrama de Cajas

El diagrama de caja es una presentacin visual que describe al mismo tiempo varias caractersticas importantes de un conjunto de datos, tales como el centro, la dispersin, la simetra o asimetra y la identificacin de observaciones atpicas.El diagrama de caja representa los tres cuartiles, y los valores mnimo y mximo de los datos sobre un rectngulo (caja), alineado horizontal o verticalmente.Construccin:Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos muestran el recorrido intercuartlico. Este rectngulo est dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los cuartiles primero y tercero (recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y mximo de la variable. Las lneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un lmite de prolongacin, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente.

MedianaPrimer cuartil Tercer cuartilValor mnimo de la variable Valor mximo de la variableLos bigotes tienen un lmite de prolongacin, de modo que aquellos valores atpicos que se separan del cuerpo principal de datos se indican individualmente. A diferencia de otros mtodos de presentacin de datos, los grficos de caja muestran los valores atpicos de la variable. Llamaremos valores atpicos de la variable a aquellos que estn tan apartados del cuerpo principal de los datos que bien pueden representar los efectos de causas extraas, como algn error de medicin o registro. Su eliminacin no se justifica, ya que el propsito del grfico de caja consiste en brindarnos un mayor conocimiento de la forma en que se distribuyen los datos.Tukey ( citado por Hildebrand, 1997) introduce un criterio para fijar los extremos de los bigotes. Para esto calcula 4 barreras, dos interiores y dos exteriores:Barrera interior inferior=Primer cuartil 1,5 . RICBarrera interior superior=Tercer cuartil + 1,5 . RICBarrera exterior inferior=Primer cuartil 3 . RICBarrera exterior superior=Tercer cuartil + 3 . RICRecordemos que RIC (Recorrido Intercuartlico) es igual a la diferencia entre el Tercer cuartil y el Primero.Si se consideran los valores de la variable comprendidos entre las dos barreras interiores, el valor mnimo de la variable y el valor mximo son los extremos de los bigotes.Si existen valores de la variable comprendidos entre las barreras interiores y exteriores se consideran valores atpicos y se indican con *. Si existieren valores fuera de las barreras exteriores se consideran valores todava ms atpicos y se indican con .Por otra parte, este tipo de grfico nos proporciona informacin con respecto a la simetra o asimetra de la distribucin. Se utilizan los siguientes criterios: si la mediana est en el centro de la caja o cerca de l, constituye un indicio de simetra de los datos, si la mediana est considerablemente ms cerca del primer cuartil indica que los datos son positivamente asimtricos y si est ms cerca del tercer cuartil, seala que los datos son negativamente asimtricos. Asimismo, la longitud relativa de los bigotes se puede emplear como un indicio de su asimetra.EJEMPLO DISTRIBUCIN DE EDADESUtilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas.36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

ORDENAR LOS DATOSPara calcular los parmetros estadstico, lo primero es ordenar la distribucin20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

CALCULO DE CUARTILESQ1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el siguiente:Q1=(24 + 25) / 2 = 24,5Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmtica de dicho valor y el siguiente:me= Q2= (33 + 34)/ 2 =33,5Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En nuestro caso, como 3N / 4 = 15, resultaQ2=(39 + 39) / 2 = 39DIBUJAR LA CAJA Y LOS BIGOTES

Elbigotede la izquierda representa al colectivo de edades( Xmn, Q1)La primera parte de la caja a(Q1, Q2),La segunda parte de la caja a(Q2, Q3)Elbigotede la derecha viene dado por(Q3, Xmx).INFORMACIN DEL DIAGRAMAPodemos obtener abundante informacin de una distribucin a partir de estas representaciones. Veamos alguna: La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que entre el 50% y el 75%.El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25% de los ms jvenes estn ms concentrados que el 25% de los mayores.El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est comprendido en 14,5 aos.