Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio...

21
Bioestadística Práctica de Ordenadores 6 1 José Aurelio Pina Romero [email protected] Bioestadística Grado Enfermería UA- Departamento de Enfermería

Transcript of Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio...

Page 1: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

Bioestadística

PrácticadeOrdenadores6

1

José[email protected]

Bioestadística– GradoEnfermeríaUA-DepartamentodeEnfermería

Page 2: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

¿Quévamoshacer?• RepasodeconceptosdeInferencia• Ejercicio4.3(mano)• Ejercicio4.8(mano–ordenador)• Ejercicio4.12(mano–ordenador)• Ejercicioingestaverduras(mano-ordenador)

2

Page 3: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

9

DistribucionesenelmuestreoSi utilizamos una técnica de muestreo para recoger la muestra aleatoria, entonces puede construirse un estimador puntual. Puesto que la muestra es aleatoria:

1.  Se pueden obtener muestras.

2.  Y para cada una de las muestras se dispondría de un estimador puntual del parámetro poblacional (µ).

Nn

⎝⎜⎜

⎠⎟⎟

x

Ω m1

m2

MUESTRA MEDIAMUESTRAL

MEDIAPOBLACIONAL

m1 µ

m2 µ

m3 µ

m4 µ

m5 µ

m6 µ

1X2X3X4X5X6X

Estimador Parámetro

Page 4: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

9

Distribucionesenelmuestreo

Puesto que el estimador puntual varía en cada muestra, entonces este estimador es una variable aleatoria. à se puede hallar la estimación de los parámetros poblaciones.

Ω m1

m2

MUESTRA MEDIAMUESTRAL

MEDIAPOBLACIONAL

m1 µ

m2 µ

m3 µ

m4 µ

m5 µ

m6 µ

1X2X3X4X5X6X

Parámetro Estimador

∑=

=n

i

i

nXX

1

Page 5: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

9

RecordamosEl parámetro es una característica o medida obtenida mediante el uso de todos los valores de datos de una población específica. (letras griegas) Estimación, es el proceso de estimar el valor de un parámetro a partir de la información obtenida de una muestra. Estimador (o punto estimado) es una estimación de un valor numérico específico de un parámetro utilizando los valores de datos de una muestra. (letras latinas) Un estimador es una cantidad numérica calculada sobre una muestra y que esperamos que sea una buena aproximación de cierta cantidad con el mismo significado en la población (parámetro).

Page 6: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

9

RecordamosLos estimadores son características cuantitativas calculadas a partir de los datos de la muestra observada que, por su conducción, intentan acercarse al verdadero valor del parámetro desconocido de la población.

Page 7: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

9

Estimadorespuntualesmáximoverosímiles

Parámetro(población) Estimadorpuntual(muestra)

Mediaμ Mediamuestral

Proporciónρ Proporciónmuestral

Varianzaσ² Varianzamuestralcorregida

Diferenciademediasμ1–μ2Diferenciademediasmuestrales

Diferenciadeproporcionesρ1–ρ2Diferenciadeproporcionesmuestrales

nrp == ρ̂

∑=

==n

i

i

nXX

1

µ̂

∑= −

−==

n

i

i

nXxs

1

222

1)(

σ̂

2221 ˆˆ µµ −=− XX

2121 ˆˆ ρρ −=− pp

Page 8: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

Dadoqueunestimadoresunav.aleatoria,entoncestienesentidopreguntarse,

8

¿Podría ser conocida la distribución de la probabilidad asociada a cada uno de los estimadores puntuales descritos?

Teoremacentraldellímite

Page 9: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

9

TeoremacentraldellímiteTeorema central del límite Sean {X1, ..., Xn} variables aleatorias independientes con media µ y varianza σ2 finita y conocida, entonces

Cuando el tamaño de la muestra fuera lo suficiente grande (n>30)

X =X i

ni =1

n

∑ ~N µ, σn

⎝⎜

⎠⎟

Normal estandarizada Si X~N(µ,σ), E[X]=µ VAR[X]= σ2 entonces Z= (X-µ)/ σ ~N(0,1)

X ~N µ, σn

⎝⎜

⎠⎟⇒ Z =

X −µ

σ

n

⎝⎜

⎠⎟

~N (0,1)

Page 10: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

10

Intervalodeconfianzaparalamedia(μ)Definición: Intervalo [a,b] que contiene al verdadero valor de la media (poblacional) con una confianza 1-α. Nótese que α es la probabilidad de error (no contener al parámetro). En el tema de contrastes de hipótesis se llamará probabilidad de error tipo I o nivel de significación. En general el tamaño del intervalo disminuye con el tamaño muestral y aumenta con 1-α. Nivel de confianza es frecuente que se exprese en %

Page 11: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

9

Intervalodeconfianzaparalamedia(μ)

-1,96 1,96 P0,025 P0,975

0,95

P (-1,96 < X <1,96) = 0,95

95,0)96,196,1( =<

⎟⎠

⎞⎜⎝

−<−

n

XPσµ

95,0)96,196,1( =+−<−<−−n

Xn

XP σµ

σ

95,0)96,196,1( =−>>+n

Xn

XP σµ

σ

95,0)96,196,1( =+<<−n

Xn

XP σµ

σ

µ desconocida σ conocida

)1,0(~ N

n

XZ⎟⎠

⎞⎜⎝

−=

σµ

Page 12: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

9

Intervalodeconfianzaparalamedia(μ)

95,0)96,196,1( =+<<−n

Xn

XP σµ

σµ desconocida σ conocida

)1,0(~ N

n

XZ⎟⎠

⎞⎜⎝

−=

σµ

IC0,95 µ( ) = x −1,96 σ

n,x +1,96 σ

n

⎝⎜

⎠⎟

Entonces el 95% de los intervalos que podrían construirse a partir de las diferentes muestras que podrían haberse obtenido por muestreo aleatorio, contendrán al verdadero valor del parámetro poblacional.

IC0,95 µ( ) = x −Zα /2

σ

n,x +Z1−α /2

σ

n

⎝⎜

⎠⎟

Page 13: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

9

Intervalodeconfianzaparalamedia(μ)

P (X − tα /2n−1 s

n< µ < X + t1−α /2

n−1 sn) = 0,95µ desconocida

σ desconocida

t = X −µ

sn

⎝⎜

⎠⎟

~ tn−1

IC0,95 µ( ) = x ± t1−α /2n−1 snN-1 grados de libertad

IC1−α µ( ) = x ± t1−α /2n−1 sn

n>30

Page 14: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

Ejercicio4.3Enunestudio realizadoparadeterminarelestadode salud de una comunidad se entrevistó a 82personas, preguntándoles acerca de su actividadfísicahabitual.Delas82personasencuestadas,36de ellas declararon practicar algún deporte deforma regular. Además se les preguntó por lashoras de sueño y los resultados se recogen en lasiguientetabla

14

Realizanejercicio Norealizanejercicio

Nºindividuos 36 46

Mediahorassueño 8.5horas/día 7.2horas/día

D.Típicahorasdesueño 0.9horas 0.8horas

Construya un intervalo de confianza al nivel 0.95 para cada una de las medias de horas de sueño de las dos poblaciones consideradas

Page 15: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

Ejercicio4.8EnunestudiosobrelitiasisbiliarrealizadoenGandiayRealdeGandiaseobtuvoinformaciónsobre200individuos.Sabiendoquedelos200individuos92sonhombresy108mujeresyqueelnivelpromediodecolesteroldelos92hombresesde226.58mg/100mlconunadesviacióntípicade49.39,yqueelelnivelpromediodecolesterolentrelas108mujeresfuede228.06mg/100mlconunadesviacióntípicade51.87

15

Construya un intervalo de confianza al nivel 0.99 para el nivel promedio de colesterol poblacional en mujeres.

¿Sería admisible, a la vista del resultado obtenido, un valor promedio de colesterol superior a 235?

Page 16: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

Ejercicio4.12El Indice de Quetelet es unamedida de obesidadque se construye a partir del peso y la talla de laforma IQ=peso/talla2. En las 108 mujeresestudiadas(estudiosobrelitiasis)elvalormediodelmencionadoíndicefuede26.87conunadesviacióntípicade4,11.Al 90% de confianza ¿cuánto vale el valor mediopoblacional del Índice de Quetelet en la población demujeresdelaquepartiólamuestra?¿SeríaadmisibleunvalorpromediodelIndicedeQueteletde30? 16

Page 17: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

Recordamos–Mediaydesviacióntípica

17

1)  Primerohayquesegmentarodividirelarchivo2)  AnalizaràEstadísticosdescriptivosàFrecuencias

Page 18: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

Recordamos–Mediaydesviacióntípica

18

1)  Primerohayquesegmentarodividirelarchivo2)  AnalizaràEstadísticosdescriptivosàFrecuencias

Page 19: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

Intervalodeconfianzaparalamedia

19

1)  Primerohayquesegmentarodividirelarchivo2)  AnalizaràCompararmediasàPruebaTparauna…3)  PulsamosenOpcionesàintroducimosniveldeconfianza

Page 20: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

BBDDLITIABISCalcular el intervalo de confianza al 95% para lamediade las variablespeso, talla y trigliceliridos,tantoparahombrescomoparamujeres.Calcular el intervalo de confianza al 99% para lamediade las variablespeso, talla y trigliceliridos,tantoparahombrescomoparamujeres.Comprueba que el tamaño del intervalo aumentacuandoaumentaelniveldeconfianza.

20

Page 21: Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X

EjercicioingestadeverdurasLatablaadjuntapresentalosvaloresdeingestadeverdura (grs/día) de 30 individuos aleatoriamenteseleccionadosdeunapoblación:280,140,200,380,220,50,150,370,425,140,120,280,360,300,240,150,80,310,210,215,360,250,440,320,290,410,190,360,240,300i.   Calcule el intervalo de confianza al 95% para la ingesta media

diariadeverduraenlapoblación.ii.   Calcule el intervalo de confianza al 99% para la ingesta media

diariadeverduraenlapoblacióniii.   Comparelosresultados.iv.  Con una confianza al 95% ¿sería admisible un valor de ingesta

mediadiariade200gr/día?

21