Estadística y Prob - Semana 3

download Estadística y Prob - Semana 3

of 16

Transcript of Estadística y Prob - Semana 3

  • 8/19/2019 Estadística y Prob - Semana 3

    1/42

    ESTADÍSTICA IIng. Miguel Angel SevillanosDominguez

    1

  • 8/19/2019 Estadística y Prob - Semana 3

    2/42

    MEDIDAS DE TENDENCIACENTRAL

    Análisis estadísticos sencillos que se usanpara descriir características! o elementostípicos! de las in"ormaci#n que recogemoscon el $n de resumir los datos e indicarsimilitudes  entre ellos que nos permitacomparar dos grupos de datos.

    Son puntos en una distriuci#n otenida!los valores medios o centrales de ésta!% nos a%udan a uicarla dentro de la escalade medici#n.

    2

  • 8/19/2019 Estadística y Prob - Semana 3

    3/42

    Medidas de Posición

    Son aquellos valores numéricos que nos

     permiten o bien dar alguna medida de

    tendencia central, dividiendo el recorridode la variable en dos, o bien fragmentar la

    cantidad de datos en partes iguales. Las

    más usuales son la media, la mediana, lamoda, los cuartiles, quintiles, deciles y

     percentiles. Pueden ser de dos tipos: de

    tendencia central  o de tipismo

  • 8/19/2019 Estadística y Prob - Semana 3

    4/42

    Este tipo de medidas nospermiten identi$car % uicar el

    punto &valor' alrededor del cual setienden (a reunir los datos&)*unto central+'.

     ,-TA en las polaciones sedenominan parámetros % en las

    muestras se les denomina

    Medidas de Posición!

  • 8/19/2019 Estadística y Prob - Semana 3

    5/42

    Par"metros #estad$sticos

    *arámetro Es una cantidad num/ricacalculada sore una polaci#n  0a altura media de los individuos de un país  0a idea es resumir toda la in"ormaci#n que (a% en

    la polaci#n en unos pocos n1meros&parámetros'.

    Estadístico Es una cantidad num/ricacalculada sore una muestra  0a altura media de los que estamos en este aula.

    Somos una muestra &2representativa3' de la

    polaci#n.  Si un estadístico se usa para apro4imar un

    parámetro tami/n se le suele llamar estimador.

    ,ormalmente nos interesa conocer un parámetro! peropor la di$cultad que conlleva estudiar a %T&DA%  lapolaci#n! calculamos un estimador sore una muestra

    )con$amos+ en ue sean r#4imos. Más adelante

    '

  • 8/19/2019 Estadística y Prob - Semana 3

    6/42

    Medidas de TendenciaCentral

    0as principales medidas detendencia central son tres

    moda, mediana y media.   El nivel de medici#n de lavariale determina cual es la

    medida de tendencia centralapropiada para interpretar.

    (

  • 8/19/2019 Estadística y Prob - Semana 3

    7/42

    Media

    La idea de media o promedio (también llamada media aritmética)

    formalia el concepto intuitivo de punto de equilibrio de lasobservaciones. !s decir, es el puntomedio del recorrido de la variable

    seg"n la cantidad de valoresobtenidos.

    )

  • 8/19/2019 Estadística y Prob - Semana 3

    8/42

    El c"lculo de la Media

    Dado un conjunto de observaciones

    la media se representa mediante y se obtiene dividiendola suma de todos los datos por el número de ellos, es decir:

    La interpretación de la media como centro (o punto deequilibrio) de los datos se apoya en una propiedad queafirma que la suma de las desviaciones

    de un conjunto de observaciones a su media es igual a cero;es decir, puede probarse que

    *

  • 8/19/2019 Estadística y Prob - Semana 3

    9/42

  • 8/19/2019 Estadística y Prob - Semana 3

    10/42

    Pro+iedades de la Media

    Minimiza las desviaciones cuadráticas delos datos respecto de cualquier valorpre$7ado! esto es! el valor de

    es mínimo cuando 89 . Este resultado seconoce como Teorema de :;nig. Estapropiedad permite interpretar uno de losparámetros de dispersi#n más

    importantes la varianza. Se ve a"ectada por trans"ormaciones

    a$nes &camios de origen % escala'! estoes! si

    1-

  • 8/19/2019 Estadística y Prob - Semana 3

    11/42

    Pro+iedades de la Media

    Es poco sensile a >uctuacionesmuestrales! por lo que es un parámetromu% 1til en in"erencia estadística.

    11

  • 8/19/2019 Estadística y Prob - Semana 3

    12/42

  • 8/19/2019 Estadística y Prob - Semana 3

    13/42

    Inconvenientes de su ?so

    Es una medida a cu%o signi$cado a"ectasoremanera la dispersi#n! de modo que cuantomenos (omog/neos sean los datos! menosin"ormaci#n proporciona. Dic(o de otro modo!polaciones mu% distintas en su composici#npueden tener la misma media. *or e7emplo! unequipo de aloncesto con cinco 7ugadores de igualestatura!

    estatura media de

    1

  • 8/19/2019 Estadística y Prob - Semana 3

    14/42

    Inconvenientes de su ?so

    En el cálculo de la media no todos losvalores contriu%en de la misma manera.0os valores altos tienen más peso que los

    valores cercanos a cero. *or e7emplo! en elcálculo del salario medio de un empresa!el salario de un alto directivo que gane

  • 8/19/2019 Estadística y Prob - Semana 3

    15/42

  • 8/19/2019 Estadística y Prob - Semana 3

    16/42

    La media aritmética de un con#unto de datos es el cociente entre la suma

    de todos los datos y el n"mero de estos. 

    Ejemplo: las notas de $uan el a%o pasado fueron:

    &, ', , , *, , '

    La nota media de $uan es: 

     +ota media  

    que suman -

    ay datos

    1(

    ),&)

    (-

    )

    '(*)('&==

    ++++++

  • 8/19/2019 Estadística y Prob - Semana 3

    17/42

    = G FH

    = = FG F

    G F F B =H G@ H FH =

    B G G F FH G

    FH F G@ H

    F G GF F FG B F FG F F

    G B = F F FH

    F = B

    E7emplo en una serie simple

    0a tala muestran las edades de FBpersonas

    9

    1)

  • 8/19/2019 Estadística y Prob - Semana 3

    18/42

    Datos -rganizados en TalasSi está en intervalos usar como 4i  lasmarcas de clase. Si no ignorar lacolumna de intervalosariable fr! fr! ac!

    L" # L$ %$ n$ &$

    L$ # L' %' n' &'

    !!!

    L$ # L % n &

      n

    1*

    n

    n x x

      i   ii∑=

  • 8/19/2019 Estadística y Prob - Semana 3

    19/42

    E7emplo para una serie dedatos % "recuencias

    ./edad

    0

    /0

    GF < GF

    G < GG@ = @B G =BB= HFGH H

  • 8/19/2019 Estadística y Prob - Semana 3

    20/42

    /álculo de la media aritmética cuando los datos se repiten. 

    !#emplo. Las notas de un grupo de alumnos fueron:

    0atos por frecuencias

    1otal de datos

    23. Se multiplican los datos por sus frecuencias absolutas respectivas, y

    se suman.

    43. !l resultado se divide por el total de datos.

    2-

    2,&4&

    245 6edia   ==

  • 8/19/2019 Estadística y Prob - Semana 3

    21/42

    0a media en una serie declases % "recuencias

    Pm PmG B G G!

  • 8/19/2019 Estadística y Prob - Semana 3

    22/42

    Mediana

    0a mediana! a di"erencia de la media nousca el valor central del recorrido de lavariale seg1n la cantidad de

    oservaciones! sino que usca determinarel valor que tiene aquella oservaci#n quedivide la cantidad de oservaciones en dosmitades iguales. *or lo tanto es necesario

    atender a la ordenaci#n de los datos! %deido a ello! este cálculo depende de laposici#n relativa de los valores otenidos.Es necesario! antes que nada! ordenar los

    datos de menor a ma%or &o viceversa'.

    22

  • 8/19/2019 Estadística y Prob - Semana 3

    23/42

    Mediana

    En un con7unto de datos num/ricosordenados en "orma creciente odecreciente! es el valor de la serie de

    datos que se sit1a 7ustamente en elcentro de la muestra &un BL devalores son in"eriores % otro BL sonsuperiores'.

    Si la muestra esta compuesta por unnumero impar de datos la mediana esel dato centralSi la muestra esta compuesta por un

    numero par de datos la mediana es el

    2

  • 8/19/2019 Estadística y Prob - Semana 3

    24/42

    Mediana +ara datos noA3ru+ados

    *A

    0a mediana está entre H % G.

    IM*A

    2!

    di d

  • 8/19/2019 Estadística y Prob - Semana 3

    25/42

    Mediana +ara datosA3ru+ados

    0a mediana se encuentra en el intervalodonde la "recuencia acumulada llega (astala mitad de la suma de las "recuencias

    asolutas.Es decir tenemos que uscar el intervaloen el que se encuentre. N 4 2 

    Lue3o calculamos se35n la si3uienteórmula6

     

    2'

  • 8/19/2019 Estadística y Prob - Semana 3

    26/42

    Donde

    Li71 es el límite in"erior de la clasedonde se encuentra la mediana

    N 4 2 es la semisuma de las"recuencias asolutas. 8i71 es la "recuencia acumulada

    anterior a la clase mediana. $ es la "recuencia asoluta delintervalo mediano.

    ti es la amplitud de los intervalos.

    2(

  • 8/19/2019 Estadística y Prob - Semana 3

    27/42

    E7emplo

    En la siguiente tala se muestran lasedades de un grupo de personas

    Se calcula la Media =F!@G

    Edad

    Marca

    clase.i

    8recuencia

    9

    8recuencia

    acumulada8iNBO

  • 8/19/2019 Estadística y Prob - Semana 3

    28/42

    0o primero que deemos (acer parapoder calcular la mediana esidenti$car la clase mediana. *ara

    esto tenemos que uscar el intervaloen el que se encuentre. N 4 2en este caso N 4 2 : 1 4 2 < 1'='

    2*

  • 8/19/2019 Estadística y Prob - Semana 3

    29/42

    A(ora deemos uscar el intervalo dondela "recuencia acumulada &Pi  ' contenga elvalor otenido &

  • 8/19/2019 Estadística y Prob - Semana 3

    30/42

    A(ora reemplazamos los datos en laPormula

     

    -

    P i d d d l

  • 8/19/2019 Estadística y Prob - Semana 3

    31/42

    Pro+iedades de lamediana

    Es menos sensile que la media aoscilaciones de los valores de lavariale. ?n error de transcripci#n en

    la serie del e7emplo anterior en!pongamos por caso! el 1ltimo n1mero!de7a a la mediana inalterada.

    Como se (a comentado! puedecalcularse para datos agrupados enintervalos! incluso cuando alguno de

    ellos no está acotado.

    1

    P i d d d l

  • 8/19/2019 Estadística y Prob - Semana 3

    32/42

    Pro+iedades de lamediana

    ,o se ve a"ectada por la dispersi#n. De(ec(o! es más representativa que lamedia aritm/tica cuando la polaci#n es

    astante (eterog/nea. Suele darse estacircunstancia cuando se resume lain"ormaci#n sore los salarios de un país ouna empresa. Ra% unos pocos salarios

    mu% altos que elevan la media aritm/tica(aciendo que pierda representatividadrespecto al grueso de la polaci#n. Sin

    emargo! alguien con el salario 6mediano6

    2

    I i t d l

  • 8/19/2019 Estadística y Prob - Semana 3

    33/42

    Inconvenientes de lamediana

    Sus principales inconvenientes son que enel caso de datos agrupados en intervalos!su valor varía en "unci#n de la amplitud de

    estos. *or otra parte! no se presta acálculos algeraicos tan ien como lamedia aritm/tica.

  • 8/19/2019 Estadística y Prob - Semana 3

    34/42

    Moda

    0a moda es el dato más repetido! el valorde la variale con ma%or "recuenciaasoluta. En cierto sentido la de$nici#n

    matemática corresponde con la locuci#n6estar de moda6! esto es! ser lo que másse lleva. Su cálculo es e4tremadamentesencillo! pues s#lo necesita un recuento.

    En variales continuas! e4presadas enintervalos! e4iste el denominado intervalomodal o! en su de"ecto! si es necesario

    otener un valor concreto de la variale!

    !

  • 8/19/2019 Estadística y Prob - Semana 3

    35/42

    *or e7emplo! el n1mero de personas endistintos ve(ículos en una carretera OOGOFO@OOFO

  • 8/19/2019 Estadística y Prob - Semana 3

    36/42

  • 8/19/2019 Estadística y Prob - Semana 3

    37/42

    7na apater8a 9a vendido en una

    semana los apatos que se refle#an en

    la tabla:!#emplo.

    La moda es

    41. 

    !l n"mero de apato más

    vendido, el dato con

    mayor frecuencia

    absoluta, es el 2.

    Lo compran & personas

    N? decal@ado * , !- !1 !2 ! !! !'

    N? de+ersonas

  • 8/19/2019 Estadística y Prob - Semana 3

    38/42

    Moda +ara datosA3ru+ados

    Se identi$ca el intervalo modal

    EdadMarcaclase

    /.i0

    8recuen

    cia /90

    8recuencia

    acumulada /80NBO

  • 8/19/2019 Estadística y Prob - Semana 3

    39/42

    Se reemplazan los datos de la "ormula 

    ,

  • 8/19/2019 Estadística y Prob - Semana 3

    40/42

  • 8/19/2019 Estadística y Prob - Semana 3

    41/42

    Inconvenientes

    Su valor es independiente de lama%or parte de los datos! lo que la(ace mu% sensile a variaciones

    muestrales. *or otra parte! envariales agrupadas en intervalos! suvalor depende e4cesivamente del

    n1mero de intervalos % de suamplitud. ?sa mu% pocas oservaciones! de tal

    modo que grandes variaciones en los

    !1

  • 8/19/2019 Estadística y Prob - Semana 3

    42/42

    Inconvenientes

    ,o siempre se sit1a (acia el centrode la distriuci#n.

    *uede (aer más de una moda en elcaso en que dos o más valores de lavariale presenten la misma"recuencia &distriuciones imodales

    o multimodales'.

    !2