1
Tema I. Introducción
1.1. La ciencia de la estadística:. El origen de la estadística:
. Ciencia descriptiva
. Evaluación de juegos de azar
Ciro el Grande (560 - 530 A.C.)
Si tengo 1 As y 2 reyes, ¿que descartees mas conveniente (1 As, 2 Reyes, 1+2)?
UNIVERSIDAD DE VIGO
2
Tema I. Introducción
1.1. La ciencia de la estadística:. Definición formal e informal. Aplicaciones de la Estadística:
. Resumen de datos
. Análisis de muestras
. Contraste de hipótesis
. Cuantificación de relaciones
. Predicción de variables. El modelo estadístico:
. Paramétrico/No Paramétrico
. Clásico/Bayesiano
Ciencia que permite obtener conclusiones de la investigación empírica basándose en modelos matemáticos
(33 º C en promedio)
Variable estudiada = Efecto Sistemático + Efecto Aleatorio
UNIVERSIDAD DE VIGO
3
UNIVERSIDAD DE VIGO
Tema I. Introducción
1.2. Algunas definiciones:. Población. Variable aleatoria. Distribución de frecuencias
Cuando en una población conocemos los posibles valores o medidas de un atributo y su probabilidad correspondiente
4
Tema I. Introducción
1.3. La estadística descriptiva:- Tipos de variable:
. Cualitativa
. Rangos
. Numérica
Variables Cualitativas
UNIVERSIDAD DE VIGO
5
UNIVERSIDAD DE VIGO
Tema I. Introducción
1.3. La estadística descriptiva:- Tipos de variable:
. Cualitativa
. Rangos
. Numérica
Posiciones en el Mundial F1
Poles en el Mundial, en los últimos 6 premios:
Alonso: 4, 3, 2, 4, 6, 2
Hamilton: 3, 1, 2, 1, 3, 1
Se pueden utilizar los métodos de las cualitativas y de las numéricas
6
Tema I. Introducción
1.3. La estadística descriptiva:- Tipos de variable:
. Cualitativa
. Rangos
. Numérica:. Discreta. De intervalo (“cuantitativa”)
Discreta (nº de pelos)
De intervalo (longitud de pelos, en mm)
Las de intervalo pueden tener∞ valores entre cada dos valores cualesquiera
UNIVERSIDAD DE VIGO
7
Tema I. Introducción
1.3. La estadística descriptiva:- Descripción de una variable de intervalo en una población:
. Medidas de centralidad:. Media. Moda. Mediana
13
11
12
10
11
14
9
12
10
11
Población de 10 medidas
Tabla de Frecuencias:
Valor 9 10 11 12 13 14
Frecuencia 1 2 3 2 1 1
Media = ∑ (Xi) = 11.3n
Moda = 11
Mediana = 11 (el segundo 11)
0
0.5
1
1.5
2
2.5
3
3.5
9 10 11 12 13 14
UNIVERSIDAD DE VIGO
8
Tema I. Introducción
1.3. La estadística descriptiva:- Descripción de una variable en una población:
. Medidas de dispersión:. Varianza. Desviación típica. Coeficiente de variación
Var = 1,2 y 3
(∑xi)2
∑xi2 - n
σ2 =n
Fórmula práctica:∑(xi
2) = 1297(∑xi) = 113
σ2 = 2,23333
σ = 1,4944
σ2
CV (adimensional) = x 100 = 19,8% μ
Tabla de Frecuencias
Valor 9 10 11 12 13 14
Frecuencia 1 2 3 2 1 1
UNIVERSIDAD DE VIGO
9
Tema I. Introducción
1.4. La probabilidad y sus reglas:. Probabilidad . Distribución de probabilidades
Cuando un evento puede ocurrir de N maneras mutuamente excluyentes (las 6 caras de un dado), la probabilidad de que ocurra una de ellas (el 6) es 1/N (1/6 en el ejemplo)
Probabilidad en ruleta
Probabilidad en dados
Distribución de probabilidad de tirada de 3 dados
La probabilidad de sacar negro será 4/8 = 0,5
UNIVERSIDAD DE VIGO
10
Tema I. Introducción
1.4. La probabilidad y sus reglas:- Propiedades elementales de la probabilidad
. Siempre mayor que 0; P(Ei) ≥ 0
. La suma de probabilidades de todos los eventos posibles es 1:P(E1) + P(E2) + … P(En) = 1
. La probabilidad de que ocurra E1 ó E2 es la sumaP(E1 ó E2) = P(E1) + P(E2)
. La probabilidad de dos sucesos independientes es el productoP(E1 y E2) = P(E1) x P (E2)
¿Probabilidad de 1 ó 3?
1/8 + 1/8 = 0,25
¿Probabilidad de 4 y 2, sucesivamente?
1/8 x 1/8 = 0,015625
UNIVERSIDAD DE VIGO
11
Tema I. Introducción
1.4. La probabilidad y sus reglas:- Necesidad de trucos de conteo para estimar probabilidades
. Factoriales de n (ordenaciones posibles sin restricciones)n! = n x (n-1) x (n-2) x …1
. Permutaciones (arreglo ordenado de objetos) n!nPr = n x (n-1) x (n-2) x (n-r+1) =
(n-r)!. Combinaciones (permutaciones sin importar el orden)
Permutaciones de 4 objetos de dos
En algunas permutacionessólo cambia el orden:
n n!r r! (n-r)!=
combinaciones de 4 de dos en dos 4! 4 x 3 x 2! 4 x 3
2! X 2! 2! x 2! 2 x 1 = 2 x 3 = 6= =
UNIVERSIDAD DE VIGO
12
1.4. La probabilidad y sus reglas:- Ejemplos sencillos de estimación de probabilidades:
. Probabilidad empleado < 30
. Probabilidad enfermería
. Probabilidad enfermería y < 30
. Probabilidad <30 siendo enfermero
Trabajo <30 31-35 >35 Tot
Médicos 5 25 75 105Laboratorio 50 35 35 120Enfermería 575 442 203 1220Farmacia 13 8 3 24Otros 135 101 69 305
TOTAL 778 611 385 1774
Nº de empleados por clases de edad en un Hospital
778/1774 = 0,44
1220/1774 = 0,69
575/1774 = 0,32
575/1220 = 0,47
5/105 = 0,05Otra estrategia de obtención de las probabilidades:la probabilidad de ser enfermero y menor de 30
0,69 x 0,44 = 0,30
Tema I. IntroducciónUNIVERSIDAD DE VIGO
13
Tema I. Introducción
1.5. La distribución de probabilidad y la inferencia estadística:- Cálculo de la distribución de probabilidad de tirar una moneda 6 veces:
. Representamos el número de caras que salen: 0, 1, 2, 3, 4, 5 y 6
. Probabilidad de una tirada ½
. Probabilidad de una tirada n veces (½)n
6 6!5 5!x1!= = 6
Nº de tiradas
Nº de caras
c c c c c c Probabilidad = (½)6 = 0,015625
+ + + + + + Probabilidad = (½)6 = 0,015625
+ c c c c cc + c c c cc c + c c cc c c + c c
etc.
Combinaciones de 6 de 5 en 5
Probabilidad = 6 x (½)6 = 0,09375
6 6!6 6!= = 1
Tabla Resumen
Nº caras 0 1 2 3 4 5 6Probabilidad 0.016 0.094 0,234 0,312 0,234 0.094 0.016
+ + c c c c
etc.
UNIVERSIDAD DE VIGO
14
Tema I. Introducción
1.5. La distribución de probabilidad y la inferencia estadística:- Cálculo de la distribución de probabilidad de tirar una moneda 6 veces:
. Obtención de la distribución de probabilidad
. Utilización de la inferencia estadística:. ¿Que probable sería que de 6 tiradas se obtuviesen?:
. A) 6 caras
. B) 1 cara
. C) Al menos 2 caras
. D) entre 1 y 5
a) p = 0,016
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,016 0,094 0,234 0,312 0,234 0,094 0,016
0 1 2 3 4 5 6
b) p = 0,094
c) p = 1- (0,016 + 0,094) = 0,89
d) p = 0,968
El test estadístico de una/dos colas
UNIVERSIDAD DE VIGO
15
Tema I. Introducción
1.6. El modelo estadístico general para poblaciones:- Estamos interesados en un determinado atributo (estadístico):
. Por ejemplo la media de un carácter (μ)- Conocemos su distribución de probabilidad en la población- Nos hacemos preguntas sobre la probabilidad de que ciertos valores puedan darse
en nuestra población
Estadística Paramétrica
. La función se describe matemáticamente
. La función es integrableDistribución de Probabilidad
hipotética
Valores del estadístico
Prob
abilid
ad
Estadística NO Paramétrica
. La función se genera empíricamente (mediante ordenadores y númerospseudo-aleatorios)
. Se tabulan los resultados empíricos o seevalúa mediante conteo
UNIVERSIDAD DE VIGO
16
Tema I. Introducción
Se puede conocer la probabilidad de un área bajo la curva, en relación por ejemplo a su σ
1.7. La distribución normal y la estadística paramétrica:- ESTADÍSTICA PARAMÉTRICA (asumimos una distribución normal)- Una distribución muy frecuente y muy conveniente:
. Función matemática depende de μ y σ
. Es simétrica, con media = moda = mediana
. La función matemática es integrable
UNIVERSIDAD DE VIGO
17
Tema I. Introducción1.7. La distribución normal y la estadística paramétrica:
- Conjunto de distribuciones normales, con μ y σ- La conversión a una sola distribución normal:
distribución normal unitaria (Distribución Z; 0 y 1)- Interpretación de tablas…
UNIVERSIDAD DE VIGO
18
Tema I. Introducción
1.8. La inferencia paramétrica para poblaciones:- Conocemos TODOS los valores de la población- Estimación de intervalos de confianza.
Ejemplo de Población ALUMNOS DE UNA CLASE: 10,2 9,7 10 9,6 8,7 11 10,5 10,9 X?
Estadística descriptiva:Media de población conocida (μ) = 10,07 Varianza (σ2) = 0,499Desviación típica (σ) = 0,707
OBTENCIÓN DE INTERVALO DE CONFIANZA
Distribución Z Población Real INT1 INT2
0 ± 15% (65%=0,39) 10,07 ± 0,27 (0,39 x 0,707) 9,8 10,340 ± 30% (80%=0,84) 10,07 ± 0,59 (0,84 x 0,707) 9,5 10,70 ± 47,5% (97,5%=1,96) 10,07 ± 1,38 (1,96 x 0,707) 8,7 11,40 ± 49,5% (99,5%=2,58) 10,07 ± 1,82 (2,58 x 0,707) 8,2 11,9
IC 95%IC 99%
Método General → Media ± z × σ
UNIVERSIDAD DE VIGO
19
Tema I. Introducción
Nivel significación 5% (p una cola 0.025)
Si X = 11; H0 = pertenece a la población; H1 =no
(valor – μ)/σ = (11 – 10,07)/0,707 = 1,32 : p en tabla z = 0.09; (0,18 dos colas)
Según NS del 5% se acepta H0
1.8. La inferencia paramétrica para poblaciones:- Realización de un test de hipótesis (la otra cara del mismo fenómeno):
. Dos hipótesis alternativas (H0 y H1)
. Evaluación de la Ho en función de un nivel de significación (5%)
Ejemplo de Población ALUMNOS DE UNA CLASE: 10,2 9,7 10 9,6 8,7 11 10,5 10,9 X?
Si X = 11,9; H0 = pertenece a la población; H1 =no
(valor – μ)/σ = (11,9 – 10,07)/0,707 = 1,32 : p en tabla z = 0.005; (0,01 dos colas)
Se rechaza H1 (p = 0.01; significativo para NS de 0,05)
Método General → Valor – μσ = z
UNIVERSIDAD DE VIGO
20
Referencias Bibliográficas
Daniel, W.W. 1989. Bioestadística. Base para el análisis de las ciencias de la salud. Limusa, México.
Sokal,R.R., Rohlf, F.J. 1995. Biometry. Freeman and co., New York
LIBROS:
PÁGINAS WEB:
http://www.statsoft.com/textbook/sttable.html(tablas en línea para ver probabilidades de la distribución Z)
http://personal5.iddeo.es/ztt/Tem/T11_Estadistica_Introduccion.htm(algunos conceptos básicos de estadística)
http://home.ubalt.edu/ntsbarsh/excel/excel.htm(programación de cálculos estadísticos en EXCEL)
UNIVERSIDAD DE VIGO
Top Related