Términos básicos en estadística
-
Upload
anibal-garcia -
Category
Data & Analytics
-
view
210 -
download
2
Transcript of Términos básicos en estadística
Términos Básicos en Estadística
Elaborado por: Aníbal García
VariablesLa variable se conoce como cada una de las características o cualidades que poseen el objeto de estudio, se divide en dos tipos y cada uno de estos a su vez en dos características de la siguiente manera:
Variable
Cualitativas Cuantitativas
Nominales Ordinales Continuas Discretas
2
● Cualitativas: son aquellas que no puede ser medidas numéricamente o numeradas, dentro de este tipo existen dos subtipos:
○ Nominales: presenta la cualidad de no obedecer a ningún tipo de orden.
○ Ordinales: presenta la cualidad de sí obedecer a una ordenación no numérico pero calificativo.
● Cuantitativas: son aquella que sí pueden representarse mediante números y se dividen en las siguientes:
○ Continuas: se caracterizan por expresarse en números decimales, siempre comprende valores entre dos números y también pueden indicar intervalos de datos.
○ Discretas: la variable discreta no toma valores intermedios y se caracteriza en diferencia a la anterior por expresarse en número enteros.
3
Ejemplos:
Personas Respuestas
2 Baloncesto
1 Fútbol
3 Béisbol
2 Tenis
Personas Respuestas
1 Nada
2 Poco
1 Mucho
4 Muchísimo
Variable cualitativa:Nominal Ordinal
¿Que tipo de deporte prácticas? ¿Que tanto te gusta el futbol?
Como pueden observar la variable de tipo nominal no obedece ningún orden específico propiamente dicho, pero son datos que pueden ser comparados con otras variables y por otra la ordinal obedece un orden, no numérico pero si calificativo.
4
Hora Temperatura (grados)
1 34-37
1 37-35
3 35-35.8
4 35.8-30.9
Pareja Respuesta(hijos)
#1 2
#2 5
#3 3
#4 2
Variable cuantitativa:Continuas Discretas
Temperatura ambiental durante 5 horas ¿Cuántos hijos tuvieron 4 parejas?
En las discretas podemos apreciar que son números enteros y que no podrían ser de otra manera debido a que no se pueden tener “1.5 hijos”, en la continuas podemos observar cómo se utiliza para expresar un intervalo y asimismo expresarse en número decimales.
5
MuestraSe conoce como la parte finita y representativa que se extrae del objeto de estudio y se toma como referencia para este. Para calcular el tamaño de una muestra se utiliza la siguiente fórmula básica:
Donde (P) es la proporción a favor y (Q) en contra, (e) es el margen de error que prefiera el analista. Si no se tiene (Q) este valor se calcula restando 1-P es decir que Q=1-P y si no se tienen datos previos P y Q se toman como 0.5 y 0.5 . Z se obtiene de un valor determinado que viene dado por la forma que tiene la distribución de Gauss. Los valores más frecuentes son: Nivel de confianza 90% -> Z=1,645 Nivel de confianza 95% -> Z=1,96 Nivel de confianza 99% -> Z=2,575.
Población Se llama población a todo grupo de entes que poseen características comunes que se pretenden analizar.
6
Ejemplo:Por elecciones anteriores se sabe que la cantidad de personas que prefiere al partido PIR es del 40% si se desea actualizar el estudio sobre su preferencia en la población determine el tamaño de la muestra a tomar con un nivel de confianza del 90% para un margen de error permitido de 5%Datos: P= 0.4 n=1.645^2 90.4(0.6)Q=1-0.4=>0.6 0.05^2Confianza= 90%Z=1.645 n=259.7784=> 260
El tamaño de nuestra cantidad de personas a analizar es 260 personas.
=
7
Parámetro estadísticosSon números que se obtienen a partir de los datos de una determinada distribución estadística, estos número se van a dividir en dos tipos:
● Centralización aquellos nos indican entorno a qué valor se van a distribuir los datos que tenemos dentro de estos esta:
○ Media: aritmética que va a ser el promedio de datos que tendríamos. Se representa por y se obtiene con la siguiente fórmula:
○ Mediana: que va hacer el valor que divide a dos datos iguales.Se representa por Me y vienedado por la siguiente formula:
○ Moda: este es el valor que más se repite.Se representa por Mo
8
Parámetro estadísticos● Dispersión aquellos indican que tan distribuidos están los datos unos de otros y son:○ Rango: es la diferencia entre el menor de los datos y mayor de los datos.Se representa por
R.○ Desviación media:La desviación media es la media aritmética de los valores absolutos de las
desviaciones respecto a la media. Se representa con Dm y vienen dado por la siguiente fórmula:
○ Varianza:La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media. Se representa por el signo que veremos a continuación en la fórmula:
○ Desviación típica:La desviación típica es la raíz cuadrada de la varianza. Se representa con la siguiente signo y fórmula:
9
Parámetro estadísticos● Posición son aquellos que dicen un grupo total de datos en grupos más pequeños de igual
tamaño:○ Cuartiles: son los 3 valores que dividen al grupo en 4 partes iguales.Los vamos a representar
por C1, C2 y C3
○ Deciles: son los 9 valores que dividen el grupo en 10 partes iguales.Los representaremos por Dn
○ Percentiles: son los 99 valores que dividen a nuestro grupo en 100 partes iguales.Los representamos por Pn
10
Ejemplo:Las notas de Ana en las 5 pruebas de lengua castellana del segundo trimestre has sido la siguiente 4, 6, 8, 7 y 5, y las de Diego han sido 6, 9, 2, 5 y5. Cual de los dos tiene mayor regularidad en sus nota?Ana Diego
N=5 30 190 N=5 27 171
Xi Li Li x Xi Li x Xi^2
2 1 2 4
5 2 10 50
6 1 6 36
9 1 9 81
Xi Li Li x Xi Li x Xi^2
4 1 4 16
5 1 5 25
6 1 6 36
7 1 7 49
8 1 8 64
11
EjemploMedia: = Li x Xi => 30 = 6 = Li x Xi => 27 = 5.4 N 5 N 5Variancia: = Li x Xi - x^2=> 190 - 6^2 = 2 = Li x Xi - x^2=> 171 - 5.4^2 = 5.04 N 5 N 5Desviación típica: = 2 = 1.41 = 5.04 = 2.24
Coeficiente de variación:CV= __ = 1.41 = 0.41 CV= __ = 2.24 = 0.24 6 5.4Estos son algunos ejemplos donde se pueden utilizar lar formular y como 0.41>0.24 podemos decir que Ana es más regular en sus notas.
12
Se entiende como la asociación de un número con una observación de la realidad de acuerdo con un conjunto de reglas específicas. Tipos de medición:Cualitativas:
● Escala nominal: permite darle un nombre al elemento medido, no tiene mayor función que esta no tienen numeración ni jerarquía son simples etiquetas.
● Escala ordinal: son etiquetas o nombres que sí permiten una ordenación jerárquica pero no numérica.
Cuantitativas:● Discretas: Se toman valores en números enteros. El cero (0) indica ausencia de valor.● Continuas: intervalo entre dos valores. El cero (0) arbitrario es decir indica que el intervalo
parte de ese punto nunca que no haya valor.
Ejemplos en página 4, 5 los tipos de variables se asocian directamente con la escala de medición.
Escalas de Medición
13
● Razón: es una relación entre dos números enteros, la cual puede dar como resultado otro número entero o racional y es expresada en forma de cociente.Por ejemplo:
10 o 10:2 de cualquiera de las dos formas está correcta . 2 Se lee diez es a dos, el resultado es 5 es decir el valor de la razón.
● Proporción: es una igualdad entre dos o más razones. Por ejemplo: 10 = 20 o 10:2 :: 20:4 se lee diez es a dos como veinte es a cuatro. 2 4 Y podemos comprobar la proporción calculando el valor de la razón de cada una que en este caso es 5.
Sumatoria Razón, Proporción, Tasa y Frecuencia
14
● Tasa: es una proporción que utiliza un multiplicador o base y esta base viene dada con respecto al divisor de la proporción. Es regularmente utilizado para calcular un suceso específico que afecta a una población en un lapso de tiempo determinado. Ejemplo: En un estudio sobre exposición a gases en minas subterráneas y silicosis en un grupo de 3000 mineros, de los cuales 60 sufrieron silicosis, cual es la la tasa de silicosis en esta población?
T= 60 x 1000 = 20 3000
● Frecuencia: es el número de veces que se repite una variable en un estudio.
Sumatoria Razón, Proporción, Tasa y Frecuencia
15
● http://www.monografias.com
● http://www.ucv.cl/
● https://espanol.answers.yahoo.com
● https://es.wikipedia.org/
● https://www.vitutor.com.
Bibliografía
16