Resumen ESTADISTICA.pdf

6
Estadística Resumen 1 Parcial | Página 1 de 6 Estadística Conceptos Distribución de Frecuencias Extracción de una muestra al azar Medidas de Tendencia Central Moda Mediana Media Medidas de Dispersión Varianza Desvío Estándar Coeficiente de Variación Entropía Población es un conjunto de individuos que es de interés considerar una totalidad que comparte algo en común: espacio y tiempo, los individuos puedes ser seres humanos, familias, escuelas, animales o tiempo de reacción a un estimulo de un sujeto, una unidad. Se debe definir claramente la población de nuestro interés al momento de hacer un estudio estadístico, y tener en cuenta que las conclusiones que se obtengan estarán referidas a esa población. No es válido extender las conclusiones más allá de los límites de la población definida ni trasladarlas a otra. Muestra es una parte de la población, para que podamos hacer inferencias sobre la población es necesario que la muestra sea representativa, es decir si reproduce con una cantidad menor de unidades a la población. Un individuo es un elemento de esta población. Variable es una característica de los individuos de una población que puede tomar distintos valores. Variabilidad es la posibilidad de que una variable tome distintos valores una definición operacional indica detalladamente los procedimientos a usar para obtener el valor de la variable que le corresponde a cada individuo la necesidad de objetivar y trata el concepto hace necesario definir operacionalmente una variable. Una definición operacional debe permitir que distintas personas obtengan para el mismo individuo igual valor de la variable; para obtener ese valor de la variable es necesario medir. Medir es el proceso de asignar elementos de un conjunto a cosas con un sentido determinado. El conjunto cuyos elementos son asignados a las cosas a medir es una escala, este conjunto generalmente numérico y tiene una determinada estructura. Escala Nominal es un conjunto de nombres que designan a las distintas clases de cosas que se miden, los elementos que componen una escala nominal tienen la única propiedad de ser símbolos diferente, puede ser conveniente designar con números pero carecen de sentido operar con ellos, son simples códigos o etiquetas.

Transcript of Resumen ESTADISTICA.pdf

  • Estadstica Resumen 1 Parcial | Pgina 1 de 6

    Estadstica

    Conceptos

    Distribucin de Frecuencias

    Extraccin de una muestra al azar

    Medidas de Tendencia Central

    Moda

    Mediana

    Media

    Medidas de Dispersin

    Varianza

    Desvo Estndar

    Coeficiente de Variacin

    Entropa

    Poblacin es un conjunto de individuos que es de inters considerar una totalidad que comparte algo en

    comn: espacio y tiempo, los individuos puedes ser seres humanos, familias, escuelas, animales o tiempo de

    reaccin a un estimulo de un sujeto, una unidad. Se debe definir claramente la poblacin de nuestro inters al

    momento de hacer un estudio estadstico, y tener en cuenta que las conclusiones que se obtengan estarn

    referidas a esa poblacin. No es vlido extender las conclusiones ms all de los lmites de la poblacin definida

    ni trasladarlas a otra.

    Muestra es una parte de la poblacin, para que podamos hacer inferencias sobre la poblacin es necesario que

    la muestra sea representativa, es decir si reproduce con una cantidad menor de unidades a la poblacin. Un

    individuo es un elemento de esta poblacin.

    Variable es una caracterstica de los individuos de una poblacin que puede tomar distintos valores.

    Variabilidad es la posibilidad de que una variable tome distintos valores una definicin operacional indica

    detalladamente los procedimientos a usar para obtener el valor de la variable que le corresponde a cada

    individuo la necesidad de objetivar y trata el concepto hace necesario definir operacionalmente una variable.

    Una definicin operacional debe permitir que distintas personas obtengan para el mismo individuo igual valor

    de la variable; para obtener ese valor de la variable es necesario medir. Medir es el proceso de asignar

    elementos de un conjunto a cosas con un sentido determinado. El conjunto cuyos elementos son asignados a las

    cosas a medir es una escala, este conjunto generalmente numrico y tiene una determinada estructura.

    Escala Nominal es un conjunto de nombres que designan a las distintas clases de cosas que se miden, los

    elementos que componen una escala nominal tienen la nica propiedad de ser smbolos diferente, puede ser

    conveniente designar con nmeros pero carecen de sentido operar con ellos, son simples cdigos o etiquetas.

  • Estadstica Resumen 1 Parcial | Pgina 2 de 6

    Escala Ordinal es un conjunto entre cuyos elementos hay establecido un orden. Los elementos que componen

    una escala ordinal adems de ser diferentes estn ordenados. En una escala ordinal se puede definir el intervalo

    entre dos elementos A y B como el conjunto de todos los elementos de la escala ubicados entre ellos. Si adems

    es posible definir la longitud de los intervalos la escala pasa a ser intervalar.

    Una escala intervalar es un conjunto munido de relacin y operaciones que permiten definir el intervalo entre

    dos elementos y su longitud. Los elementos que componen la escala intervalar estn ordenados, son smbolos

    diferentes y tiene sentido comparar las longitudes de los intervalos determinados por pares de ellos. El cero de

    la escala es arbitrario y carece de significado la razn entre dos temperaturas.

    Una escala de razones es una escala intervalar que contiene un cero absoluto esto es un punto de escala que

    se pone en correspondencia con la cantidad nula de aquello que quiere medirse. La razn entre dos elementos

    tiene un significado preciso que expresa la relacin entre las cosas a las que se les asignan, tiene las mismas

    propiedades que la escala intervalar y adquiere sentido la razn entre dos de ellos.

    Variable Cualitativa: Atributos, condiciones o cualidades que poseen.

    Variable Cuantitativa: El conjunto de sus valores es numrico.

    La misma poblacin tendr asociada tantas poblaciones de observacin como variables consideremos. Las

    variaciones de las conductas son previsibles cuando se conoce la situacin o el momento de la persona. Estas

    variaciones son imprevisibles a partir de las informaciones que dispone el observador. Las variaciones

    imprevisibles se atribuyen as a un conjunto de fuentes fortuitas de variacin para el experimentador; no estn

    asociadas a ninguna fuente de variacin sistemtica. Las variaciones previsibles estn asociadas a fuentes

    sistemticas de variacin.

    La frecuencia de un valor de la variable es el nmero de veces que se repite en la muestra.

    La frecuencia relativa de un valor de la variable a su frecuencia dividida por el tamao de la muestra.

    La frecuencia porcentual de un valor de la variable a su frecuencia relativa multiplicada por cien.

    Intervalos:

    1. Encontrar Max. y Min.

    2. Calcular amplitud MAX MIN

    3. Establecer longitud provisoria Amplitud/ N de Intervalos

    4. Redondear hacia arriba

    Diagrama de tallos: Distribucin de frecuencia. Diagrama circular: Variable cualitativa Fr. * 360. Diagrama de barras: Variable cualitativa, til para comparar dos distribuciones. Cada barra es una categora, su altura es proporcional a la frecuencia muestra del mismo tamao que las frecuencias representadas por las alturas de las barras sean relativas o porcentuales. Diagrama de bastones: Distribucin de frecuencias de una variable discreta. Diagrama de puntos: Distribucin de frecuencia agrupadas en intervalos de clase.

  • Estadstica Resumen 1 Parcial | Pgina 3 de 6

    Histograma: Distribucin de frecuencias agrupadas en intervalos de clase, no precisa igualdad de longitud los

    intervalos de clase. Distribucin de frecuencia es la organizacin de las observaciones que asocia a cada valor de

    la variable su correspondiente frecuencia.

    MEDIDAS DE TENDENCIA CENTRAL

    La MODA es un conjunto de puntuaciones que se repite con mayor frecuencia:

    1. Cuando todas las puntuaciones tienen misma frecuencia no hay moda.

    2. Cuando dos puntuaciones adyacentes tienen la misma frecuencia y esta frecuencia comn es mayor que

    cualquier otra puntuacin, la moda es el promedio de las dos puntuaciones adyacentes.

    3. Dos modas no adyacentes son bimodales.

    La MEDIANA MD es el perceptil cincuenta en un grupo de puntuaciones. Es la puntuacin que divide las

    posiciones en partes iguales, de tal forma que la mitad de las puntuaciones son mayores que la mediana y la

    otra mitad menor que ella. La mediana ocupa una posicin central determinando dos subconjuntos de

    valores de la variable; el de los valores que son mayores que ella y el de los valores que son menores, cada uno

    con una frecuencia que no supera a N/2. La variable debe medirse en escala ordinal.

    1. Todo elemento de B precede a cualquier elemento A

    2. La frecuencia, tanto de A como de B, es menor o igual que N/2.

    3. A lo sumo un elemento queda fuera de A u B precediendo a todos los elementos de A y sucediendo a los

    de B.

    _ La MEDIA X es el promedio, cuando el 0 tiene verdadero valor es utilizable, no se puede usar cuando no hay valores extremos compensados. MEDIDAS DE VARIABILIDAD/DISPERSIN

    RANGO es la medida de la distancia total en la escala numrica a lo largo de la cual varan los puntajes.

    Rango excluyente es la diferencia entre la mayor y la menor puntuacin de un grupo.

    Rango incluyente es la diferencia entre el lmite superior real del intervalo que abarca la mayor puntuacin, y el

    lmite inferior real del intervalo que abarca la puntuacin menor.

    En el rango semi-intercuartil Q es la distancia entre el primer y tercer cuartil Q= Q3-Q1/ 2. Se usa cuando la

    distribucin es aproximadamente simtrica respecto de la media o mediana. Las desviaciones del tipo X-

    (promedio) indican que a mayor heterogeneidad en el grupo, mayor desviacin respecto de la media.

  • Estadstica Resumen 1 Parcial | Pgina 4 de 6

    Son caractersticas de los cuartiles y de los intercuartiles:

    1. Todo elemento de un intercuatilo es menor que cualquier elemento de un intercuartilo designado con

    un subndice mayor.

    2. La frecuencia de un intercuartilo es menor o igual que N/4.

    3. Quedan fuera de la unin de los intercuartilos a lo sumo 3 elementos.

    4. El cuartil Q1 sucede a cualquier elemento de un intercuartil con ndice menor o igual que 1 y precede a

    cualquier elemento de un intercuatilo con ndice mayor.

    5. El segundo cuartil coincide con la mediana de la distribucin mientras que el primero es la mediana de

    los valores menores que ella y el tercero lo es de los mayores.

    VARIANZA permite comparar dos N diferentes con la misma media.

    Usos, propiedades, ventajas y desventajas de las medidas tratada

    Para las variables cualitativas el concepto de dispersin es el opuesto de concentracin.

    La medida de dispersin para estas variables es la Entropa.

    Dadas dos distribuciones de frecuencias se admite que la dispersin es mayor cuanto mayor es el nmero de

    clases, o bien con mismo nmero de clases cuando las observaciones se reparten por igual entre las clases en

    lugar de concentrarse en alguna/s de ellas.

    Cuando hay mayor dispersin se dice que hay mayor entropa. En este caso la incertidumbre sobre la clase a la

    que pertenece una extraccin hecha al azar es mayor.

    La entropa informa sobre la incertidumbre acerca de la clase a la que pertenece una extraccin hecha al azar y

    se calcula mediante la siguiente expresin:

  • Estadstica Resumen 1 Parcial | Pgina 5 de 6

    Usos de la media

    El conocimiento de la media de una muestra permite:

    Situar una observacin dentro de la distribucin, pudiendo indicar si est por arriba o por debajo de la

    media.

    Comparar grupos en cuanto a una misma variable de inters, comparando las respectivas medias.

    Analizar la importancia relativa de las fuentes sistemticas de variacin, a travs de la comparacin de

    las medias correspondientes a las distintas categoras de la variable que se considera como tal.

    Estimar la media de la poblacin. La media de una muestra es una estimacin de la media poblacional.

    Propiedades de la media:

    1) La media es sensible a las puntuaciones. En su clculo intervienen todas las puntuaciones. La modificacin de cualquier valor modifica la media.

    Dados los valores 2, 3, 5 y 70, la media es 20. sta no representa adecuadamente a tal conjunto. La medida adecuada en este caso es la mediana, que es 4. Este valor representa adecuadamente a tres de las cuatro puntuaciones.

    Comentario: La mediana es sensible slo a la modificacin de la/s puntuacin/es central/es.

    Consecuencia: la media no es recomendable cuando hay valores extremos no compensados. En esos casos se

    prefiere la mediana.

    2) La media es estable porque cambia poco de muestra en muestra. Por esta razn tiene propiedades

    importantes en la estadstica inferencial.

    Ejemplo. _

    Dados los puntajes 5, 8, 8 la media es X = 7 x Efectivamente, (5-7) + (8-7) + (8-7) = (-2) + (1) + (1) = 0

    Consecuencia: la media es como un centro de gravedad de la distribucin. Si representramos a los valores de

    la variable sobre una barra rgida con un peso sobre ellos igual a su frecuencia, la media resulta ubicada en el

    centro de gravedad de la dicha barra.

    Coeficiente de variacin: Propiedades

    1. Es un valor abstracto, como cociente de dos nmeros concretos (es decir dados en ciertas unidades

    concretas de medida) del mismo tipo. Recurdese que la media y la desviacin tpica vienen dadas en las

    mismas unidades en la que vienen dadas las puntuaciones a partir de las cuales aquellas don calculadas.

  • Estadstica Resumen 1 Parcial | Pgina 6 de 6

    2. Si a unas puntuaciones dadas les sumamos una cantidad positiva, el coeficiente de variacin disminuira,

    ya que Sx se mantendr constante, pero el promedio aumentara en esa cantidad. Por tanto, el cociente

    Sx/ Promedio disminuir despus de dicha suma. Si por el contrario, les restamos una cantidad positiva,

    el coeficiente de variacin aumentar, por anloga razn.

    3. Si multiplicamos unas puntuaciones dadas por cualquier constante positiva, el coeficiente de variacin

    se mantendr constante, pues el numerador, Sx y el denominador, promedio, quedarn multiplicados

    por la misma cantidad. Es recomendable que junto al coeficiente de variacin, se ofrezcan las

    correspondientes Sx, y promedio a partir de las cuales ha sido calculado.

    Una DISTRIBUCIN DE FRECUENCIA muestra para cada valor de la variable la frecuencia que le corresponde.

    Hay ocasiones en que es til exhibir la frecuencia correspondiente a cierto conjunto de valores de la

    variable.

    Muchas veces la informacin se presenta como una distribucin de frecuencias agrupadas en intervalos de

    clase. Esto generalmente ocurre cuando los valores observados son muchos y se supone que la variable es

    continua. La TABLA nos indica la cantidad de observaciones que corresponde a cada intervalo. El carcter

    continuo de la variable permite que estas observaciones estn situadas en cualquier punto del intervalo.

    Modelo respuestas de prctica:

    La medida ms adecuada es la mediana por tratarse de la distribucin de frecuencias de una variable cualitativa

    con valores jerarquizados. Se prefiere la mediana, pues se observa un valor no compensado extremadamente

    diferente del resto.

    Se prefiere la media porque en este caso no hay valores distorsionantes y ella tiene mejores propiedades

    estadsticas.

    Tales categoras son las ms probables para una observacin realizada al azar en cada grupo.

    La incertidumbre en la distribucin de la variable es mayor para porque la concentracin de las frecuencias

    para el valor modal es menor. Por lo tanto, la distribucin correspondiente a tiene mayor entropa.

    Observando el valor de la Entropa (H) correspondiente a cada una de las distribuciones se confirma esta

    afirmacin: Observando el grfico, puede decirse que la distribucin para presenta asimetra negativa,

    mientras que para el Grupo 2, la distribucin es asimtrica positiva. Ntese que esto puede verificarse

    calculando el coeficiente de asimetra para cada grupo:

    El intervalo de la mediana es 25,5 31,5. Para encontrar el intervalo donde est la mediana se usa la tabla de

    frecuencias y se calculan las frecuencias acumuladas fa y ga tal como se indica a continuacin: Cuando los datos

    se presentan agrupados en intervalos de clase no se conocen los valores observados de la variable sino slo

    cuntos de ellos (frecuencia) se cuentan en cada intervalo. En estos casos, el clculo de los resmenes

    estadstico es aproximado.