Análisis Exploratorio Valores Referenciales

8
ANALÍSIS EXPLORATORIO El análisis exploratorio proporciona un conjunto de métodos, los cuales de una manera fácil y rápida permite obtener información respecto a la distribución de los datos o comportamiento de la variable, la tendencia central, la dispersión y la asimetría de un conjunto de datos, previo al análisis definitivo. Los métodos de análisis explorato rio (A. E. .! se caracteri "a n por ser más reveladores y resistentes a la presencia de datos discordantes. Dato Discordante #n dato se conoce como aberrante o discordante si es notablemente diferente de los demás. Estos datos discordantes pueden tener su ori$en en un error de re$istro, caso en el cual $eneralmente se pueden corre$ir antes de anali"ar los datos, o suceder en efecto %ue esa unidad estadística ten$a un comportamiento realmente diferente a los demás, en este caso tendrá %ue usarse métodos %ue no resulten muy afectados por la existencia de ese dato(s!. GRAFICA DE TA LLO Y HOJAS &')*+#&&- a! &a da d at o se se pa ra e n dos p arte s, d e e sto tene mo s %u e ca da d at o co mo m ínimo debe tener dos cifras, una de ellas será la oja y estará constituido por una sola cifra y la otra(s! constituirán el tallo. Ejemplo/ *allo Hoa  01 2 )e entenderá %ue este es el/  3mero 0.12 si la unidad de oja es 4.45  3mero 01.2 si la unidad de oja es 4.5  3mero 012 si la u nidad de oja e s 5  3mero 0124 si la unidad de o ja es 54  b! )e tra"a una línea vertical escribiendo a la i"%uierda los tallos y a la dereca las ojas correspondiente a cada tallo. 6ara determinar de manera rápida los tallos, es conveniente anotar el recorrido de la variable y determinar la unidad de oja. Ejemplo/ )upon$amos %ue las notas de los alumnos oscilan entre/ 78.9: y 5:.:;. )i la unidad de oja es 4.5 entonces los tallos serán/ 1 Lic. María A. Zacarías Díaz

Transcript of Análisis Exploratorio Valores Referenciales

8/16/2019 Análisis Exploratorio Valores Referenciales

http://slidepdf.com/reader/full/analisis-exploratorio-valores-referenciales 1/8

ANALÍSIS EXPLORATORIO

El análisis exploratorio proporciona un conjunto de métodos, los cuales de unamanera fácil y rápida permite obtener información respecto a la distribución de los datos

o comportamiento de la variable, la tendencia central, la dispersión y la asimetría de unconjunto de datos, previo al análisis definitivo.

Los métodos de análisis exploratorio (A. E. .! se caracteri"an por ser másreveladores yresistentesa la presencia de datos discordantes.

Dato Discordante

#n dato se conoce como aberrante o discordante si es notablemente diferente delos demás. Estos datos discordantes pueden tener su ori$en en un error de re$istro, casoen el cual $eneralmente se pueden corre$ir antes de anali"ar los datos, o suceder enefecto %ue esa unidad estadística ten$a un comportamiento realmente diferente a losdemás, en este caso tendrá %ue usarse métodos %ue no resulten muy afectados por laexistencia de ese dato(s!.

GRAFICA DE TALLO Y HOJAS

&' )*+#&& -

a! &ada dato se separa en dos partes, de esto tenemos %ue cada dato como mínimodebe tener dos cifras, una de ellas será la oja y estará constituido por una solacifra y la otra(s! constituirán el tallo. Ejemplo/

*allo Ho a

01 2

)e entenderá %ue este es el/• 3mero 0.12 si la unidad de oja es 4.45• 3mero 01.2 si la unidad de oja es 4.5• 3mero 012 si la unidad de oja es 5• 3mero 0124 si la unidad de oja es 54

b! )e tra"a una línea vertical escribiendo a la i"%uierda los tallos y a la derec a lasojas correspondiente a cada tallo. 6ara determinar de manera rápida los tallos,

es conveniente anotar el recorrido de la variable y determinar la unidad de oja.

Ejemplo/)upon$amos %ue las notas de los alumnos oscilan entre/ 78.9: y 5:.:;. )i launidad de oja es 4.5 entonces los tallos serán/

1 Lic. María A. Zacarías Díaz

8/16/2019 Análisis Exploratorio Valores Referenciales

http://slidepdf.com/reader/full/analisis-exploratorio-valores-referenciales 2/8

Tallo Ho a !" # $%&'

8 <

1

= 5455

59 50

525:

)i la unidad de oja es 5, entonces Los tallos serán/

Tallo Ho a !( # &'

4 5

La (nidad a (tili)ar de*ende del conte+to en el ,(e se est- tra.a ando%

c! )i observamos %ue el n3mero de tallos es pe%ue>o o el n3mero de ojas es muy$rande y deseamos acer una presentación más detallada podemos abrir la líneacorrespondiente a cada tallo en dos o cinco líneas. Ejemplo

?ráfica @ 5Pro/edio Ponderado 0ra1ica Tallo 2 Ho as

Al(/nos Tallo Ho as

11 Extremos (=<5.0) 5 : 1 9 8 :: 8 < 444922 0 < ::< 0 1 459 9 1 :: 54 = 4459990022 = = ::8<<<<11 5< 54 44559999002222222 54 54 ::::888811 50 55 5555590000222 = 55 ::88811== 52 59 44444555599002 2 59 ::<1 0 50 400 5 50 8 0 52 999 5 52 1 1 Extremos (>=17.6)

Anc o tallo/ 5.444 &ada oja/ 5 caso

?ráfica @ 9Pro/edio Ponderado Gra1ica Tallo 2 Ho as

Al(/nos Tallo Ho as

11 Extremos (=<5.0) 5 : 1 9 8 :: = < 444922::< : 1 459:: 5= = 4459990022::8<<<<11 9< 54 44559999002222222::::888811 99 55 5555590000222::88811== 51 59 44444555599002::<1 2 50 4008 2 52 9991 1 Extremos (>=17.6)

Anc o tallo/ 5.444 &ada oja/ 5 caso

En las $ráficas @ 5 y @ 9, la expresión Anc o de tallo indica %ue los datos %ue ansido resumidos en esta $rafica, son n3meros con 0 cifras decimales.

2 Lic. María A. Zacarías Díaz

8/16/2019 Análisis Exploratorio Valores Referenciales

http://slidepdf.com/reader/full/analisis-exploratorio-valores-referenciales 3/8

d! En caso de %ue existan uno o dos datos muy pe%ue>os o muy $randes conrelación al resto, esos pueden consi$narse al principio o al final de la tablarespectivamente.

)i el dato es pe%ue>o se le antepone la palabra3AJO%)i el dato es $rande se le antepone la palabraALTO%

Estos datos no intervienen en la construcción de la tabla.

Ejemplo/Densidad *o.lacional del Per4 *or

De*arta/entos(&enso 5==0!

De*arta/entosDensidadPo.lacional

Ama"onas =Ancas 9<.:Apurimac 5=Are%uipa 52.1Ayacuc o 55.<&ajamarca 0=&allao 224:.1&usco 52.1

uancavelica 51.5uanuco 51.2ca 9<.5

Bunín 92.5La Libertad :4.0

Lambaye%ue 88.1Lima 518.9Loreto 9Cadre de ios 4.1Co%ue$ua 1.06asco =.26iura 0=.06uno 5:.0)an Cartín 55.9*acna 50.=*umbes 02#cayali 0.9

5aria.le6 ensidad 6oblacional del 6er3 por epartamentos.efinición &onceptual/ Es el n3mero de personas por Dm. &uadrado.

Recorrido6 74.1 , 224:.0;

Tallo Ho a !( # &'

! Lic. María A. Zacarías Díaz

8/16/2019 Análisis Exploratorio Valores Referenciales

http://slidepdf.com/reader/full/analisis-exploratorio-valores-referenciales 4/8

4 4 9 0 1 = =5 5 5 0 2 2 : 1 1 =9 2 < <0 2 = =

78 48 8

Alto !&9:%;' Li/a Alto (224:.1! callao

Inter*retaci<n6

En cuanto a la tendencia central, podemos decir %ue en la mayoría de Losdepartamentos el n3mero de abitantes por Dm 9 oscila entre 55 a 5= personas.La variabilidad es $rande ya %ue oscila entre casi un abitante asta 88 ab Dm 9

por departamento.La distribución de los datos es asimétrico con cola acia la derec a, es decir en lamayoría de los departamentos ay pocos abitantes por Fm9 y ay pocosdepartamentos en los %ue ay muc os abitantes por Dm 9 .

=edidas de Posici<n% C(antiles%

Además de las medidas de *endencia &entral, ispersión, también ay al$unas medidas3tiles de posición G no centralH %ue suelen utili"arse al resumir o describir propiedadesde un conjunto de datos, sobre todo si éste es numeroso. A estas medidas se lesdenominac(antiles%Al$unos de los cuantiles más utili"ados son los eciles, %uedividen los datos ordenados en décimos y los 6ercentiles %ue dividen los datosordenados en centésimos.

Percentiles% 6ara introducir la definición de percentil, ordenemos el conjunto de datos5 9, ,..., t

x x x ,de tal manera %ue(5!

x sea el menor, (9 ! x sea el %ue le si$ue y así sucesivamente asta

tener el mayor valor ( !t x . Así se tiene %ue (5!

x IJ (9 ! x IJ K..IJ ( !t

x . &ada n3merodentro del paréntesis indica la posición del dato. (donde GtH indica el total de datos, esdecir, puede ser i$ual al total de datos poblacionales, , o al total de datos muestrales,n!

De1inici<n%El percentil 6F , es un valor en el recorrido de la variable, cuya posición se alla con lasi$uiente expresión (tF 544! 4.:. &uando el valor de la posición no es un n3meroentero, el percentil se alla como el promedio de los datos cuyas posiciones están próximas a la posición allada.Ejemplo.

Los si$uientes datos corresponden a las notas del curso de &álculo de 59 Alumnos/59, 1, 55, 50, =, 1, 59, 54, 52, 50, 5:, =.M&uál es el valor del percentil 04N

" Lic. María A. Zacarías Díaz

8/16/2019 Análisis Exploratorio Valores Referenciales

http://slidepdf.com/reader/full/analisis-exploratorio-valores-referenciales 5/8

8/16/2019 Análisis Exploratorio Valores Referenciales

http://slidepdf.com/reader/full/analisis-exploratorio-valores-referenciales 6/8

denominamos A*') A6A+*A ') o RAL'+E) EX*+EC') del conjunto al cual pertenecen. En ocasiones se ace distinción entre los datos apartados A* 6 &') WA 'CAL'). Los datos atípicos son los %ue %uedan comprendidos entre la +ET5 yla +ET9, y los %ue %uedan comprendidos entre la +ET0 y la +ET2. Los datosanómalos son los %ue %uedan por debajo de la +ET5 y también los %ue %uedan por

encima de la +ET2, para diferenciarlos se utili"an marcas diferentes, por ejemplo, uncuadradito para los atípicos y una cru" para los anómalos.

Ejemplo/&onsiderando los datos asociados a la variable densidad poblacional por departamentos,tenemos/

5. Los datos ordenados. xmin J 4.1 xmax J 224:.1

De*arta/entos Posici<n

Densidad

Po.lacional%Cadre de ios 5 4.1Loreto 9 9#cayali 0 0.9Co%ue$ua 2 1.0Ama"onas : =6asco 8 =.2)an Cartín < 55.9Ayacuc o 1 55.<*acna = 50.=Are%uipa 54 52.1

&usco 55 52.16uno 59 5:.0

uancavelica 50 51.5uanuco 52 51.2

Apurimac 5: 5=Bunín 58 92.5

ca 5< 9<.5Ancas 51 9<.:*umbes 5= 02&ajamarca 94 0=6iura 95 0=.0

La Libertad 99 :4.0Lambaye%ue 90 88.1Lima 92 518.9&allao 9: 224:.1

9. Ced J ( )50 x J 51.5

0. (8! (<! 54.09

c

x x P

+= = y (5=! (94! 08.:

9c

x xT

+= =

2. e J 08.: V54.0 J 98.9

6 Lic. María A. Zacarías Díaz

8/16/2019 Análisis Exploratorio Valores Referenciales

http://slidepdf.com/reader/full/analisis-exploratorio-valores-referenciales 7/8

:. +ET5 J 54.0 V 0(98.9! J U81.0 +ET9 J 54.0 V 5.:(98.9! J U9= +ET0 J 08.: 5.:(98.9! J <:.1 +ET2 J 08.: 0(98.9! J 55:.5

4 94 24 84 14 544 594 524 5:4

La densidad poblacional del Lima es un dato atípico y la densidad poblacional del&allao es un dato anómalo.

Ejemplo.6ara los si$uientes datos correspondientes al nivel de acide" de diferentes muestras delluvia/

4.57 5.62 4.12 5.29 4.64 4.31 4.39 4.3 4.45 5.67

4.39 4.52 4.26 4.4 5.78 4.73 4.56 5.08 4.41 4.12

5.51 4.82 4.63 4.29 4.6 4.26

&onstruya. El dia$rama de tallo y ojas con amplitud ( unidad de oja! 4.5 y otro dia$rama conamplitud de oja 4.45( 6 es una medida de alcalinidad acide". 6 i$ual a <si$nifica neutro y valores menores de < indican acide"!. La $ráfica de cajas.

)olución.

X/ ivel de Acide"/ X

R (2.59, :.<9!#.E. Cuestra de lluvia.)e cuenta con 98 muestras de lluvia, por lo tanto se tiene datos muestrales.

.a. #nidad J 4.5

*allo oja 2 55999000222:::888<1 : 49:88<

.b. #nidad J 4.45

7 Lic. María A. Zacarías Díaz

8/16/2019 Análisis Exploratorio Valores Referenciales

http://slidepdf.com/reader/full/analisis-exploratorio-valores-referenciales 8/8

*allo oja

25 9929 88=

20 45==22 45:2: 98<28 4022< 021 92=:4 1:5:9 =:0:2:: 5:8 9<:< 1

. ?rafica de &ajas. xminJ 2.59 xmax J :.<9 # x J 2.:2

5Q = 2.050Q = 2.19 J 4.:5

+ET5 J 9.<1+ET9 J 0,:2:+ET0 J :,:1:+ET2 J 8,0:

0: 08 0< 01 0= 24 25 29 20 22 2: 28 2< 21 2= :4 :5 :9 :0 :2 :: :8 :< :1

$ Lic. María A. Zacarías Díaz