Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio...

Post on 13-Aug-2020

35 views 0 download

Transcript of Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio...

Bioestadística

PrácticadeOrdenadores6

1

JoséAurelioPinaRomeroJa.pina@ua.es

Bioestadística– GradoEnfermeríaUA-DepartamentodeEnfermería

¿Quévamoshacer?• RepasodeconceptosdeInferencia• Ejercicio4.3(mano)• Ejercicio4.8(mano–ordenador)• Ejercicio4.12(mano–ordenador)• Ejercicioingestaverduras(mano-ordenador)

2

9

DistribucionesenelmuestreoSi utilizamos una técnica de muestreo para recoger la muestra aleatoria, entonces puede construirse un estimador puntual. Puesto que la muestra es aleatoria:

1.  Se pueden obtener muestras.

2.  Y para cada una de las muestras se dispondría de un estimador puntual del parámetro poblacional (µ).

Nn

⎝⎜⎜

⎠⎟⎟

x

Ω m1

m2

MUESTRA MEDIAMUESTRAL

MEDIAPOBLACIONAL

m1 µ

m2 µ

m3 µ

m4 µ

m5 µ

m6 µ

1X2X3X4X5X6X

Estimador Parámetro

9

Distribucionesenelmuestreo

Puesto que el estimador puntual varía en cada muestra, entonces este estimador es una variable aleatoria. à se puede hallar la estimación de los parámetros poblaciones.

Ω m1

m2

MUESTRA MEDIAMUESTRAL

MEDIAPOBLACIONAL

m1 µ

m2 µ

m3 µ

m4 µ

m5 µ

m6 µ

1X2X3X4X5X6X

Parámetro Estimador

∑=

=n

i

i

nXX

1

9

RecordamosEl parámetro es una característica o medida obtenida mediante el uso de todos los valores de datos de una población específica. (letras griegas) Estimación, es el proceso de estimar el valor de un parámetro a partir de la información obtenida de una muestra. Estimador (o punto estimado) es una estimación de un valor numérico específico de un parámetro utilizando los valores de datos de una muestra. (letras latinas) Un estimador es una cantidad numérica calculada sobre una muestra y que esperamos que sea una buena aproximación de cierta cantidad con el mismo significado en la población (parámetro).

9

RecordamosLos estimadores son características cuantitativas calculadas a partir de los datos de la muestra observada que, por su conducción, intentan acercarse al verdadero valor del parámetro desconocido de la población.

9

Estimadorespuntualesmáximoverosímiles

Parámetro(población) Estimadorpuntual(muestra)

Mediaμ Mediamuestral

Proporciónρ Proporciónmuestral

Varianzaσ² Varianzamuestralcorregida

Diferenciademediasμ1–μ2Diferenciademediasmuestrales

Diferenciadeproporcionesρ1–ρ2Diferenciadeproporcionesmuestrales

nrp == ρ̂

∑=

==n

i

i

nXX

1

µ̂

∑= −

−==

n

i

i

nXxs

1

222

1)(

σ̂

2221 ˆˆ µµ −=− XX

2121 ˆˆ ρρ −=− pp

Dadoqueunestimadoresunav.aleatoria,entoncestienesentidopreguntarse,

8

¿Podría ser conocida la distribución de la probabilidad asociada a cada uno de los estimadores puntuales descritos?

Teoremacentraldellímite

9

TeoremacentraldellímiteTeorema central del límite Sean {X1, ..., Xn} variables aleatorias independientes con media µ y varianza σ2 finita y conocida, entonces

Cuando el tamaño de la muestra fuera lo suficiente grande (n>30)

X =X i

ni =1

n

∑ ~N µ, σn

⎝⎜

⎠⎟

Normal estandarizada Si X~N(µ,σ), E[X]=µ VAR[X]= σ2 entonces Z= (X-µ)/ σ ~N(0,1)

X ~N µ, σn

⎝⎜

⎠⎟⇒ Z =

X −µ

σ

n

⎝⎜

⎠⎟

~N (0,1)

10

Intervalodeconfianzaparalamedia(μ)Definición: Intervalo [a,b] que contiene al verdadero valor de la media (poblacional) con una confianza 1-α. Nótese que α es la probabilidad de error (no contener al parámetro). En el tema de contrastes de hipótesis se llamará probabilidad de error tipo I o nivel de significación. En general el tamaño del intervalo disminuye con el tamaño muestral y aumenta con 1-α. Nivel de confianza es frecuente que se exprese en %

9

Intervalodeconfianzaparalamedia(μ)

-1,96 1,96 P0,025 P0,975

0,95

P (-1,96 < X <1,96) = 0,95

95,0)96,196,1( =<

⎟⎠

⎞⎜⎝

−<−

n

XPσµ

95,0)96,196,1( =+−<−<−−n

Xn

XP σµ

σ

95,0)96,196,1( =−>>+n

Xn

XP σµ

σ

95,0)96,196,1( =+<<−n

Xn

XP σµ

σ

µ desconocida σ conocida

)1,0(~ N

n

XZ⎟⎠

⎞⎜⎝

−=

σµ

9

Intervalodeconfianzaparalamedia(μ)

95,0)96,196,1( =+<<−n

Xn

XP σµ

σµ desconocida σ conocida

)1,0(~ N

n

XZ⎟⎠

⎞⎜⎝

−=

σµ

IC0,95 µ( ) = x −1,96 σ

n,x +1,96 σ

n

⎝⎜

⎠⎟

Entonces el 95% de los intervalos que podrían construirse a partir de las diferentes muestras que podrían haberse obtenido por muestreo aleatorio, contendrán al verdadero valor del parámetro poblacional.

IC0,95 µ( ) = x −Zα /2

σ

n,x +Z1−α /2

σ

n

⎝⎜

⎠⎟

9

Intervalodeconfianzaparalamedia(μ)

P (X − tα /2n−1 s

n< µ < X + t1−α /2

n−1 sn) = 0,95µ desconocida

σ desconocida

t = X −µ

sn

⎝⎜

⎠⎟

~ tn−1

IC0,95 µ( ) = x ± t1−α /2n−1 snN-1 grados de libertad

IC1−α µ( ) = x ± t1−α /2n−1 sn

n>30

Ejercicio4.3Enunestudio realizadoparadeterminarelestadode salud de una comunidad se entrevistó a 82personas, preguntándoles acerca de su actividadfísicahabitual.Delas82personasencuestadas,36de ellas declararon practicar algún deporte deforma regular. Además se les preguntó por lashoras de sueño y los resultados se recogen en lasiguientetabla

14

Realizanejercicio Norealizanejercicio

Nºindividuos 36 46

Mediahorassueño 8.5horas/día 7.2horas/día

D.Típicahorasdesueño 0.9horas 0.8horas

Construya un intervalo de confianza al nivel 0.95 para cada una de las medias de horas de sueño de las dos poblaciones consideradas

Ejercicio4.8EnunestudiosobrelitiasisbiliarrealizadoenGandiayRealdeGandiaseobtuvoinformaciónsobre200individuos.Sabiendoquedelos200individuos92sonhombresy108mujeresyqueelnivelpromediodecolesteroldelos92hombresesde226.58mg/100mlconunadesviacióntípicade49.39,yqueelelnivelpromediodecolesterolentrelas108mujeresfuede228.06mg/100mlconunadesviacióntípicade51.87

15

Construya un intervalo de confianza al nivel 0.99 para el nivel promedio de colesterol poblacional en mujeres.

¿Sería admisible, a la vista del resultado obtenido, un valor promedio de colesterol superior a 235?

Ejercicio4.12El Indice de Quetelet es unamedida de obesidadque se construye a partir del peso y la talla de laforma IQ=peso/talla2. En las 108 mujeresestudiadas(estudiosobrelitiasis)elvalormediodelmencionadoíndicefuede26.87conunadesviacióntípicade4,11.Al 90% de confianza ¿cuánto vale el valor mediopoblacional del Índice de Quetelet en la población demujeresdelaquepartiólamuestra?¿SeríaadmisibleunvalorpromediodelIndicedeQueteletde30? 16

Recordamos–Mediaydesviacióntípica

17

1)  Primerohayquesegmentarodividirelarchivo2)  AnalizaràEstadísticosdescriptivosàFrecuencias

Recordamos–Mediaydesviacióntípica

18

1)  Primerohayquesegmentarodividirelarchivo2)  AnalizaràEstadísticosdescriptivosàFrecuencias

Intervalodeconfianzaparalamedia

19

1)  Primerohayquesegmentarodividirelarchivo2)  AnalizaràCompararmediasàPruebaTparauna…3)  PulsamosenOpcionesàintroducimosniveldeconfianza

BBDDLITIABISCalcular el intervalo de confianza al 95% para lamediade las variablespeso, talla y trigliceliridos,tantoparahombrescomoparamujeres.Calcular el intervalo de confianza al 99% para lamediade las variablespeso, talla y trigliceliridos,tantoparahombrescomoparamujeres.Comprueba que el tamaño del intervalo aumentacuandoaumentaelniveldeconfianza.

20

EjercicioingestadeverdurasLatablaadjuntapresentalosvaloresdeingestadeverdura (grs/día) de 30 individuos aleatoriamenteseleccionadosdeunapoblación:280,140,200,380,220,50,150,370,425,140,120,280,360,300,240,150,80,310,210,215,360,250,440,320,290,410,190,360,240,300i.   Calcule el intervalo de confianza al 95% para la ingesta media

diariadeverduraenlapoblación.ii.   Calcule el intervalo de confianza al 99% para la ingesta media

diariadeverduraenlapoblacióniii.   Comparelosresultados.iv.  Con una confianza al 95% ¿sería admisible un valor de ingesta

mediadiariade200gr/día?

21