ESTADISTICA DESCRIPTIVA
Transcript of ESTADISTICA DESCRIPTIVA
ESTADISTICA DESCRIPTIVA
YESENIA MORALES
INSTRCUTOR: EDISON MORALES
ESTADISTICA DESCRIPTIVA
Se refiere a la recolección, presentación, descripción, análisis e interpretación de una colección de datos, esencialmente consiste en resumir éstos con uno o dos elementos de información (medidas descriptivas) que
caracterizan la totalidad de los mismos.
TIPOS DE VARIABLES ESTADISTICAS
• VARIABLES CUALITATIVAS:
se refieren a características o cualidades que no pueden ser medidas con números.
• VARIABLE CUANTITATIVA
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella
CLASIFICACION DE LAS VARIABLES ESTADISTICAS
VARIABLES CUALITATIVAS
VARIABLE ORDINAL: La variable puede
tomar distintos valores ordenados siguiendo
una escala establecida, aunque no es necesario que el intervalo entre
mediciones sea uniforme, por ejemplo: leve, moderado, grave.
VARIABLE NOMINAL:
En esta variable los valores no pueden ser
sometidos a un criterio de orden
como por ejemplo: los colores o el lugar de
residencia.
VARIABLES CUANTITATIVAS
VARIABLE DISCRETA:
Es la variable que presenta
separaciones o interrupciones en la
escala de valores que puede tomar,
Ejemplo: El número de hijos (1, 2, 3, 4, 5).
VARIABLE CONTINUA: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores. Por ejemplo la masa
(2,3 kg, 2,4 kg, 2,5 kg, ...)
INDIVIDUO
Se llama individuo a cada uno de los elementos que componen la
población estadística. El individuo es un ente observable que no tiene por qué ser una persona, puede ser
un objeto, un ser vivo, o incluso algo abstracto.
POBLACIÓN
Llamamos población estadística, universo o colectivo al conjunto de
referencia sobre el cual van a recaer las observaciones.
MUESTRAsubconjunto de elementos de la
población. Se suelen tomar muestras cuando es difícil o costosa
la observación de todos los elementos de la población
estadística.
DISTRIBUCION DE FRECUENCIA
• Es como se denomina en estadística a la agrupación de datos en categorías
mutuamente excluyentes que indican el número de observaciones en cada
categoría. Esto significa una de las cosas más importantes de la matemática, su
estadística con la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que
se pueda ver el número existente en cada clase.
MEDIDAS DE TENDENCIA CENTRAL
LA MEDIA ARITMÉTICA
Es el valor obtenido por la suma de todos sus valores dividida entre el número de
sumandos. La media resume en un valor las características de una variable teniendo en cuenta todos los casos. Solamente puede
utilizarse con variables cuantitativas.
LA MEDIANA
es un valor de la variable que deja por debajo de sí a la mitad de los datos, una
vez que éstos están ordenados de menor a mayor.
Por ejemplo, la mediana del número de hijos de un conjunto de trece familias,
cuyos respectivos hijos son:
3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos:
1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:
LA MODA
• Es el dato más repetido, el valor de la variable con mayor frecuencia absoluta.
Su cálculo es extremadamente sencillo, pues sólo necesita un recuento. En variables
continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la
interpolación.
Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-
6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.
MEDIDAS DE DISPERSION
• Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una
distribución, indicando por medio de un número, si las diferentes puntuaciones de
una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor
será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o
varían mucho entre ellos.
RANGO
Es la diferencia entre el valor mínimo y el valor máximo en un grupo de números aleatorios.
Requisitos del rangoOrdenamos los números según su tamaño.
Restamos el valor mínimo del valor máximo.Ejemplo
Para una muestra (8,7,6,9,4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario
inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en
un rango de:Rango = (9-4) =5
VARIANZA
(también denominada variancia, aunque esta denominación es menos utilizada) es
una medida estadística que mide la dispersión de los valores respecto a un
valor central (media), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su media
aritmética. Suele ser representada con la letra griega σ o una V en mayúscula.
DESVIACIÓN TÍPICA
Se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa
sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta medida viene representada en la
mayoría de los casos por S, dado que es su inicial de su nominación en inglés.
Desviación típica muestral
COEFICIENTE DE CORRELACIÓN DE PEARSON
• permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es
satisfactorio. Se define como el cociente entre la covarianza y el producto de las
desviaciones típicas
•
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante
cualquiera de las dos expresiones siguientes:
HISTOGRAMAS ESTADISTICOS
• es una representación gráfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados.
En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente
señalando las marcas de clase, es decir, la mitad del intervalo en el que están
agrupados los datos.
• En términos matemáticos, puede ser definida como una función inyectiva que
acumula las observaciones que pertenecen a cada sub-intervalo de una
partición. El histograma, como es tradicionalmente entendido, no es más que la representación gráfica de dicha
función.
• Diagramas de barras simples: Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la
frecuencia simple de la categoría que representa.
• Diagramas de barras compuesta: Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra
representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de
cada modalidad.
TIPOS DE HISTOGRAMAS
• Diagramas de barras agrupadas: Se usa para representar la información de
una tabla de doble entrada o sea a partir de dos variables, el cual es
representado mediante un conjunto de barras como se clasifican respecto a las
diferentes modalidades.
• Polígono de frecuencias: Es un gráfico de líneas que se usa para
presentar las frecuencias absolutas de los valores de una distribución en el
cual la altura del punto asociado a un valor de las variables es proporcional a
la frecuencia de dicho valor.
• Ojiva porcentual: Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de
cada valor en una distribución de frecuencias. En los gráficos las barras se
encuentran juntas y en la tabla los números poseen en el primer miembro un corchete y en el segundo un paréntesis,
por ejemplo: (10-20]