Segundo resumen de estadistica

9
1.2 Datos agrupados 1.- su fin es resumir la información. 2.- generalmente, los elementos son de mayor tamaño, por lo cual requieren ser agrupados, esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias. 3.- se agrupa a los datos, si se cuenta con 20 o más elementos. Aunque contemos con más de 20 elementos, debe de verificarse que los datos n sean significativos, Esto es: que la información sea “repetitiva”, también debemos de verificar que los datos puedan clasificarse. Y que dicha clasificación tiene coherencia y lógica (de acuerdo a lo que se nos esta pidiendo).Una vez que ya hemos ordenado y clasificado, presentaremos la información obtenida mediante una ”tabla de frecuencias ” 4.- la agrupación de los datos puede ser simple o mediante intervalos de clase. 1.2.1 Tabla de frecuencia La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos , asignando a cada dato su frecuencia correspondiente . Tipos de frecuencia: Frecuencia absoluta La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.Se representa por f i . La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N .

Transcript of Segundo resumen de estadistica

Page 1: Segundo resumen de estadistica

1.2 Datos agrupados

1.- su fin es resumir la información.

2.- generalmente, los elementos son de mayor tamaño, por lo cual requieren ser agrupados, esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias.

3.- se agrupa a los datos, si se cuenta con 20 o más elementos. Aunque contemos con más de 20 elementos, debe de verificarse que los datos n sean significativos, Esto es: que la información sea “repetitiva”, también debemos de verificar que los datos puedan clasificarse. Y que dicha clasificación tiene coherencia y lógica (de acuerdo a lo que se nos esta pidiendo).Una vez que ya hemos ordenado y clasificado, presentaremos la información obtenida mediante una ”tabla de frecuencias ”

4.- la agrupación de los datos puede ser simple o mediante intervalos de clase.

1.2.1 Tabla de frecuencia

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Tipos de frecuencia:

Frecuencia absoluta

La frecuencia absoluta es el número de veces que aparece un

determinado valor en un estudio estadístico.Se representa por f i.

La suma de las frecuencias absolutas es igual al número total de datos,

que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra

griega Σ (sigma mayúscula) que se lee suma o sumatoria.

Page 2: Segundo resumen de estadistica

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de

un determinado valor y el número total de datos . Se puede expresar

en tantos por ciento y se representa por n i.

La suma de las frecuencias relativas es igual a 1.

Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de

todos los valores inferiores o iguales al valor considerado. Se

representa por F i.

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia

acumulada de un determinado valor y el número total de datos. Se

puede expresar en tantos por ciento.

1.2.2 Medidas de tendencia central y de posición

-De tendencia central:

Media

La media es una medida de tendencia central que se obtiene por la suma de todas las puntuaciones de un grupo dividida por el número de ellas.

Mediana

La mediana es una medida de tendencia central, es el valor que divide en dos partes iguales a un conjunto de puntuaciones ordenadas. Es la puntuación que deja por encima y por debajo de sí el 50% de los casos.

Page 3: Segundo resumen de estadistica

Moda

La moda es una medida de tendencia central que indica cuál es la puntuación, categoría o modalidad que más se repite en el conjunto de medidas.o Ventajas:

La moda puede calcularse con cualquier tipo de datos o Inconvenientes:

La moda es la más inestable de las medidas de tendencia central, ya que puede variar mucho de una a otra muestra extraída de una misma población. Podemos encontrarnos con que no existe una única moda, a lo que llamaríamos distribuciones bimodales o multimodales.

-Medidas de posición

Además de conocer los valores de tendencia central para una distribución, puede resultar interesante localizar la posición de determinadas puntuaciones individuales en relación con el grupo. De esto se encargan las medidas de posición; informan de la posición de determinadas 15 puntuaciones individuales en relación con el grupo del que forman parte.

La mediana, además de indicar una tendencia central, puede ser considerada una medida de posición, puesto que a través de ella podemos saber que el individuo que logra una puntuación similar a ella se encuentra justo en el centro de la distribución, dejando el mismo número de puntuaciones por encima y por debajo. Este tipo de información es la que nos aportan los cuartiles.

Si deseamos expresar la puntuación de un sujeto en relación con el grupo al que pertenece, la forma más sencilla de hacerlo sería ordenar todas las puntuaciones y señalar el lugar que ocupa. Pero no es suficiente decir el lugar que ocupa un determinado sujeto, es preciso conocer también el número de sujetos que integran el grupo.

Para indicar de forma clara el lugar que ocupa un sujeto en un grupo podemos ordenar de mayor a menor todos los componentes del grupo, según las puntuaciones obtenidas. Llamaremos cuartiles a los puntos o valores de corte en la distribución que dejan por debajo de sí un porcentaje determinado de casos o individuos, y por encima otro porcentaje, complementario al anterior. Para poder calcular los cuantiles, la escala ha de ser al menos ordinal, y será preciso ordenar previamente los datos o agruparlos de mayor a menor. Dependiendo del número de partes en que se divide la serie de puntuaciones, podremos hablar de percentiles, cuartiles o deciles.

Page 4: Segundo resumen de estadistica

Percentiles

Los percentiles son los 99 valores que dividen en 100 partes iguales a una serie de puntuaciones ordenadas, de forma que el percentil Pm deja por debajo de sí el m por ciento de las puntuaciones del grupo. A cada 16 -una de estas cien partes en las que se dividen las puntuaciones también las podemos llamar centil (Cm).

Deciles

Si dividimos una serie de puntuaciones en diez partes, cada una de las puntuaciones que limitan las partes se denomina decil (Dm). La escala de deciles va desde el D1 al D9. Definiremos un decil (Dm) como aquel valor numérico que deja por debajo de sí m décimas partes del total de puntuaciones.

Cuartiles

Los cuarteles son los 3 valores que dividen en cuatro partes a una serie de puntuaciones ordenadas, de manera que el cuartel Qm deja por debajo de sí m cuartas partes del total de puntuaciones del grupo.

1.2.3 medidas de dispersión

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Las medidas de dispersión son:

Rango o recorrido

El rango es la diferencia entre el mayor y el menor de los datos de

una distribución estadística.

Desviación media

La desviación respecto a la media es la diferencia entre

cada valor de la variable estadística y la media aritmética.

D i = x - x

La desviación media es la media aritmética de los valores absolutos

de las desviaciones respecto a la media.

Page 5: Segundo resumen de estadistica

La desviación media se representa por

Varianza

La varianza es la media aritmética del cuadrado de las desviaciones

respecto a la media de una distribución estadística.

La varianza se representa por .

Desviación típica

La desviación típica es la raíz cuadrada de la varianza.Es decir, la

raíz cuadrada de la media de los cuadrados de las puntuaciones de

desviación.La desviación típica se representa por σ.

Page 6: Segundo resumen de estadistica

1.2.4 Medidas de asimetría y curtosis

Medidas De Distribución - Asimetría Y Curtosis:

Las medidas de distribución nos permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su representación gráfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son la Asimetría y la Curtosis.

ASIMETRÍA:

Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres estados diferentes, cada uno de los cuales define de forma concisa como están distribuidos los datos respecto al eje de asimetría. Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

Figura 5-1

El Coeficiente de asimetría, se representa mediante la ecuación matemática,

Ecuación 5-9

Page 7: Segundo resumen de estadistica

Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor.

CURTOSIS

Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).

Figura 5-2 Para calcular el coeficiente de Curtosis se utiliza la ecuación:

Ecuación 5-10 Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor.