Resumen ESTADISTICA.pdf
Transcript of Resumen ESTADISTICA.pdf
-
Estadstica Resumen 1 Parcial | Pgina 1 de 6
Estadstica
Conceptos
Distribucin de Frecuencias
Extraccin de una muestra al azar
Medidas de Tendencia Central
Moda
Mediana
Media
Medidas de Dispersin
Varianza
Desvo Estndar
Coeficiente de Variacin
Entropa
Poblacin es un conjunto de individuos que es de inters considerar una totalidad que comparte algo en
comn: espacio y tiempo, los individuos puedes ser seres humanos, familias, escuelas, animales o tiempo de
reaccin a un estimulo de un sujeto, una unidad. Se debe definir claramente la poblacin de nuestro inters al
momento de hacer un estudio estadstico, y tener en cuenta que las conclusiones que se obtengan estarn
referidas a esa poblacin. No es vlido extender las conclusiones ms all de los lmites de la poblacin definida
ni trasladarlas a otra.
Muestra es una parte de la poblacin, para que podamos hacer inferencias sobre la poblacin es necesario que
la muestra sea representativa, es decir si reproduce con una cantidad menor de unidades a la poblacin. Un
individuo es un elemento de esta poblacin.
Variable es una caracterstica de los individuos de una poblacin que puede tomar distintos valores.
Variabilidad es la posibilidad de que una variable tome distintos valores una definicin operacional indica
detalladamente los procedimientos a usar para obtener el valor de la variable que le corresponde a cada
individuo la necesidad de objetivar y trata el concepto hace necesario definir operacionalmente una variable.
Una definicin operacional debe permitir que distintas personas obtengan para el mismo individuo igual valor
de la variable; para obtener ese valor de la variable es necesario medir. Medir es el proceso de asignar
elementos de un conjunto a cosas con un sentido determinado. El conjunto cuyos elementos son asignados a las
cosas a medir es una escala, este conjunto generalmente numrico y tiene una determinada estructura.
Escala Nominal es un conjunto de nombres que designan a las distintas clases de cosas que se miden, los
elementos que componen una escala nominal tienen la nica propiedad de ser smbolos diferente, puede ser
conveniente designar con nmeros pero carecen de sentido operar con ellos, son simples cdigos o etiquetas.
-
Estadstica Resumen 1 Parcial | Pgina 2 de 6
Escala Ordinal es un conjunto entre cuyos elementos hay establecido un orden. Los elementos que componen
una escala ordinal adems de ser diferentes estn ordenados. En una escala ordinal se puede definir el intervalo
entre dos elementos A y B como el conjunto de todos los elementos de la escala ubicados entre ellos. Si adems
es posible definir la longitud de los intervalos la escala pasa a ser intervalar.
Una escala intervalar es un conjunto munido de relacin y operaciones que permiten definir el intervalo entre
dos elementos y su longitud. Los elementos que componen la escala intervalar estn ordenados, son smbolos
diferentes y tiene sentido comparar las longitudes de los intervalos determinados por pares de ellos. El cero de
la escala es arbitrario y carece de significado la razn entre dos temperaturas.
Una escala de razones es una escala intervalar que contiene un cero absoluto esto es un punto de escala que
se pone en correspondencia con la cantidad nula de aquello que quiere medirse. La razn entre dos elementos
tiene un significado preciso que expresa la relacin entre las cosas a las que se les asignan, tiene las mismas
propiedades que la escala intervalar y adquiere sentido la razn entre dos de ellos.
Variable Cualitativa: Atributos, condiciones o cualidades que poseen.
Variable Cuantitativa: El conjunto de sus valores es numrico.
La misma poblacin tendr asociada tantas poblaciones de observacin como variables consideremos. Las
variaciones de las conductas son previsibles cuando se conoce la situacin o el momento de la persona. Estas
variaciones son imprevisibles a partir de las informaciones que dispone el observador. Las variaciones
imprevisibles se atribuyen as a un conjunto de fuentes fortuitas de variacin para el experimentador; no estn
asociadas a ninguna fuente de variacin sistemtica. Las variaciones previsibles estn asociadas a fuentes
sistemticas de variacin.
La frecuencia de un valor de la variable es el nmero de veces que se repite en la muestra.
La frecuencia relativa de un valor de la variable a su frecuencia dividida por el tamao de la muestra.
La frecuencia porcentual de un valor de la variable a su frecuencia relativa multiplicada por cien.
Intervalos:
1. Encontrar Max. y Min.
2. Calcular amplitud MAX MIN
3. Establecer longitud provisoria Amplitud/ N de Intervalos
4. Redondear hacia arriba
Diagrama de tallos: Distribucin de frecuencia. Diagrama circular: Variable cualitativa Fr. * 360. Diagrama de barras: Variable cualitativa, til para comparar dos distribuciones. Cada barra es una categora, su altura es proporcional a la frecuencia muestra del mismo tamao que las frecuencias representadas por las alturas de las barras sean relativas o porcentuales. Diagrama de bastones: Distribucin de frecuencias de una variable discreta. Diagrama de puntos: Distribucin de frecuencia agrupadas en intervalos de clase.
-
Estadstica Resumen 1 Parcial | Pgina 3 de 6
Histograma: Distribucin de frecuencias agrupadas en intervalos de clase, no precisa igualdad de longitud los
intervalos de clase. Distribucin de frecuencia es la organizacin de las observaciones que asocia a cada valor de
la variable su correspondiente frecuencia.
MEDIDAS DE TENDENCIA CENTRAL
La MODA es un conjunto de puntuaciones que se repite con mayor frecuencia:
1. Cuando todas las puntuaciones tienen misma frecuencia no hay moda.
2. Cuando dos puntuaciones adyacentes tienen la misma frecuencia y esta frecuencia comn es mayor que
cualquier otra puntuacin, la moda es el promedio de las dos puntuaciones adyacentes.
3. Dos modas no adyacentes son bimodales.
La MEDIANA MD es el perceptil cincuenta en un grupo de puntuaciones. Es la puntuacin que divide las
posiciones en partes iguales, de tal forma que la mitad de las puntuaciones son mayores que la mediana y la
otra mitad menor que ella. La mediana ocupa una posicin central determinando dos subconjuntos de
valores de la variable; el de los valores que son mayores que ella y el de los valores que son menores, cada uno
con una frecuencia que no supera a N/2. La variable debe medirse en escala ordinal.
1. Todo elemento de B precede a cualquier elemento A
2. La frecuencia, tanto de A como de B, es menor o igual que N/2.
3. A lo sumo un elemento queda fuera de A u B precediendo a todos los elementos de A y sucediendo a los
de B.
_ La MEDIA X es el promedio, cuando el 0 tiene verdadero valor es utilizable, no se puede usar cuando no hay valores extremos compensados. MEDIDAS DE VARIABILIDAD/DISPERSIN
RANGO es la medida de la distancia total en la escala numrica a lo largo de la cual varan los puntajes.
Rango excluyente es la diferencia entre la mayor y la menor puntuacin de un grupo.
Rango incluyente es la diferencia entre el lmite superior real del intervalo que abarca la mayor puntuacin, y el
lmite inferior real del intervalo que abarca la puntuacin menor.
En el rango semi-intercuartil Q es la distancia entre el primer y tercer cuartil Q= Q3-Q1/ 2. Se usa cuando la
distribucin es aproximadamente simtrica respecto de la media o mediana. Las desviaciones del tipo X-
(promedio) indican que a mayor heterogeneidad en el grupo, mayor desviacin respecto de la media.
-
Estadstica Resumen 1 Parcial | Pgina 4 de 6
Son caractersticas de los cuartiles y de los intercuartiles:
1. Todo elemento de un intercuatilo es menor que cualquier elemento de un intercuartilo designado con
un subndice mayor.
2. La frecuencia de un intercuartilo es menor o igual que N/4.
3. Quedan fuera de la unin de los intercuartilos a lo sumo 3 elementos.
4. El cuartil Q1 sucede a cualquier elemento de un intercuartil con ndice menor o igual que 1 y precede a
cualquier elemento de un intercuatilo con ndice mayor.
5. El segundo cuartil coincide con la mediana de la distribucin mientras que el primero es la mediana de
los valores menores que ella y el tercero lo es de los mayores.
VARIANZA permite comparar dos N diferentes con la misma media.
Usos, propiedades, ventajas y desventajas de las medidas tratada
Para las variables cualitativas el concepto de dispersin es el opuesto de concentracin.
La medida de dispersin para estas variables es la Entropa.
Dadas dos distribuciones de frecuencias se admite que la dispersin es mayor cuanto mayor es el nmero de
clases, o bien con mismo nmero de clases cuando las observaciones se reparten por igual entre las clases en
lugar de concentrarse en alguna/s de ellas.
Cuando hay mayor dispersin se dice que hay mayor entropa. En este caso la incertidumbre sobre la clase a la
que pertenece una extraccin hecha al azar es mayor.
La entropa informa sobre la incertidumbre acerca de la clase a la que pertenece una extraccin hecha al azar y
se calcula mediante la siguiente expresin:
-
Estadstica Resumen 1 Parcial | Pgina 5 de 6
Usos de la media
El conocimiento de la media de una muestra permite:
Situar una observacin dentro de la distribucin, pudiendo indicar si est por arriba o por debajo de la
media.
Comparar grupos en cuanto a una misma variable de inters, comparando las respectivas medias.
Analizar la importancia relativa de las fuentes sistemticas de variacin, a travs de la comparacin de
las medias correspondientes a las distintas categoras de la variable que se considera como tal.
Estimar la media de la poblacin. La media de una muestra es una estimacin de la media poblacional.
Propiedades de la media:
1) La media es sensible a las puntuaciones. En su clculo intervienen todas las puntuaciones. La modificacin de cualquier valor modifica la media.
Dados los valores 2, 3, 5 y 70, la media es 20. sta no representa adecuadamente a tal conjunto. La medida adecuada en este caso es la mediana, que es 4. Este valor representa adecuadamente a tres de las cuatro puntuaciones.
Comentario: La mediana es sensible slo a la modificacin de la/s puntuacin/es central/es.
Consecuencia: la media no es recomendable cuando hay valores extremos no compensados. En esos casos se
prefiere la mediana.
2) La media es estable porque cambia poco de muestra en muestra. Por esta razn tiene propiedades
importantes en la estadstica inferencial.
Ejemplo. _
Dados los puntajes 5, 8, 8 la media es X = 7 x Efectivamente, (5-7) + (8-7) + (8-7) = (-2) + (1) + (1) = 0
Consecuencia: la media es como un centro de gravedad de la distribucin. Si representramos a los valores de
la variable sobre una barra rgida con un peso sobre ellos igual a su frecuencia, la media resulta ubicada en el
centro de gravedad de la dicha barra.
Coeficiente de variacin: Propiedades
1. Es un valor abstracto, como cociente de dos nmeros concretos (es decir dados en ciertas unidades
concretas de medida) del mismo tipo. Recurdese que la media y la desviacin tpica vienen dadas en las
mismas unidades en la que vienen dadas las puntuaciones a partir de las cuales aquellas don calculadas.
-
Estadstica Resumen 1 Parcial | Pgina 6 de 6
2. Si a unas puntuaciones dadas les sumamos una cantidad positiva, el coeficiente de variacin disminuira,
ya que Sx se mantendr constante, pero el promedio aumentara en esa cantidad. Por tanto, el cociente
Sx/ Promedio disminuir despus de dicha suma. Si por el contrario, les restamos una cantidad positiva,
el coeficiente de variacin aumentar, por anloga razn.
3. Si multiplicamos unas puntuaciones dadas por cualquier constante positiva, el coeficiente de variacin
se mantendr constante, pues el numerador, Sx y el denominador, promedio, quedarn multiplicados
por la misma cantidad. Es recomendable que junto al coeficiente de variacin, se ofrezcan las
correspondientes Sx, y promedio a partir de las cuales ha sido calculado.
Una DISTRIBUCIN DE FRECUENCIA muestra para cada valor de la variable la frecuencia que le corresponde.
Hay ocasiones en que es til exhibir la frecuencia correspondiente a cierto conjunto de valores de la
variable.
Muchas veces la informacin se presenta como una distribucin de frecuencias agrupadas en intervalos de
clase. Esto generalmente ocurre cuando los valores observados son muchos y se supone que la variable es
continua. La TABLA nos indica la cantidad de observaciones que corresponde a cada intervalo. El carcter
continuo de la variable permite que estas observaciones estn situadas en cualquier punto del intervalo.
Modelo respuestas de prctica:
La medida ms adecuada es la mediana por tratarse de la distribucin de frecuencias de una variable cualitativa
con valores jerarquizados. Se prefiere la mediana, pues se observa un valor no compensado extremadamente
diferente del resto.
Se prefiere la media porque en este caso no hay valores distorsionantes y ella tiene mejores propiedades
estadsticas.
Tales categoras son las ms probables para una observacin realizada al azar en cada grupo.
La incertidumbre en la distribucin de la variable es mayor para porque la concentracin de las frecuencias
para el valor modal es menor. Por lo tanto, la distribucin correspondiente a tiene mayor entropa.
Observando el valor de la Entropa (H) correspondiente a cada una de las distribuciones se confirma esta
afirmacin: Observando el grfico, puede decirse que la distribucin para presenta asimetra negativa,
mientras que para el Grupo 2, la distribucin es asimtrica positiva. Ntese que esto puede verificarse
calculando el coeficiente de asimetra para cada grupo:
El intervalo de la mediana es 25,5 31,5. Para encontrar el intervalo donde est la mediana se usa la tabla de
frecuencias y se calculan las frecuencias acumuladas fa y ga tal como se indica a continuacin: Cuando los datos
se presentan agrupados en intervalos de clase no se conocen los valores observados de la variable sino slo
cuntos de ellos (frecuencia) se cuentan en cada intervalo. En estos casos, el clculo de los resmenes
estadstico es aproximado.