¿Por qué resumir?

13
26/1/2021 1 Consideraciones éticas Diseño Participantes Entorno Intervenciones Análisis estadístico ¿Cómo se hizo? Objetivos de la Clase: - Definir qué es la estadística descriptiva y diferenciarla con estadística inferencial. - Cómo se reportan las variables categóricas: Frecuencias Absolutas y Relativas (porcentaje) - Cómo se reportan las variables numéricas: Media, mediana, moda, desvío estandar, percentiles (cuartiles). - Tipos de distribución (Normal) Test de Normalidad. - Concepto de estadistica inferencial, estimación por intervalos de confianza. Estadística Descriptiva Inferencial Presentación, organización y resumen de la información. Generar Hipótesis. Sacar conclusiones de la población a partir de lo observado en una muestra. Probar Hipótesis. ¿ cuál es el valor más frecuente en este conjunto de datos? ¿ cuál es el valor mínimo en este conjunto de datos? ¿ cuál es el valor máximo en este conjunto de datos? ¿ cuál es valor promedio? ¿Por qué resumir? Definición: Rama de la matemática que trata de los métodos para organizar y presentar datos numéricos para que se haga fácil su interpretación. Sus recursos suelen ser cálculos, tablas, gráficos. Estadística descriptiva 1 2 3 4 5 6

Transcript of ¿Por qué resumir?

Page 1: ¿Por qué resumir?

26/1/2021

1

Consideraciones éticas

Diseño

Participantes

Entorno

Intervenciones

Análisis estadístico

¿Cómo se hizo?

Objetivos de la Clase:

- Definir qué es la estadística descriptiva y diferenciarla con estadística inferencial.

- Cómo se reportan las variables categóricas: Frecuencias Absolutas y Relativas (porcentaje)

- Cómo se reportan las variables numéricas: Media, mediana, moda, desvío estandar,

percentiles (cuartiles).

- Tipos de distribución (Normal) Test de Normalidad.

- Concepto de estadistica inferencial, estimación por intervalos de confianza.

Estadística

Descriptiva Inferencial

Presentación, organización y

resumen de la información.

Generar Hipótesis.

Sacar conclusiones de la

población a partir de lo

observado en una muestra.

Probar Hipótesis.

¿ cuál es el valor más frecuente en este conjunto de datos?

¿ cuál es el valor mínimo en este conjunto de datos?

¿ cuál es el valor máximo en este conjunto de datos?

¿ cuál es valor promedio?

¿Por qué resumir?

Definición:

Rama de la matemática que trata de los métodos para organizar y presentar datos numéricos para que se haga fácil su interpretación. Sus recursos suelen ser cálculos, tablas, gráficos.

Estadística descriptiva

1 2

3 4

5 6

Page 2: ¿Por qué resumir?

26/1/2021

2

¿Cómo se resume?Términos… • Media = Promedio = mean • Desvío Estándar (DE) = Standard Desviation (SD)• Mediana o Percentil 50 o segundo cuartil (C2) = Median (Med)

• Percentil 25 - Percentil 75 (25 -75) o Primer y tercer cuartil (C1 –C3) first and third quartiles (Q1-Q3)

• Rango Intercuartílico (RIQ, diferencia entre Q3-Q1) = IQR (Interquartile Range)

• Rango (diferencia entre máximo y mínimo) • Mínimo - Máximo (Min - Max) = Min - Max • Tamaño muestral (N) = sample size

• Frecuencia absoluta (n) = Cantidad de eventos• Frecuencia relativa (%)= cantidad de eventos con respecto a total

Materiales y Métodos

• Redacción del apartado estadístico:

• El objetivo de esta sección de materiales y métodos es detallar que técnicas o herramientas estadísticas se utilizaron para describir o analizar los resultados del estudio.

• Subtitulo: Análisis Estadístico

7 8

9 10

11 12

Page 3: ¿Por qué resumir?

26/1/2021

3

13 14

15 16

17 18

Page 4: ¿Por qué resumir?

26/1/2021

4

Ejemplo de sección “Análisis estadístico”…

Las variables categóricas se presentan como frecuencia absoluta de aparición y porcentaje.

Las variables numéricas se presentan mediante medida de tendencia central y dispersión o posición según la distribución observada.

Se utilizó la prueba de Shapiro Wilk para evaluar la parametricidad(normalidad) de las variables numéricas.

Se estableció como significativo un valor de p < 0,05.

“Dime en que escala mides y te diré como la representas…”

Análisis estadístico:

Las variables categóricas se presentan como frecuencia absoluta de aparición y porcentaje del total.

Las variables numéricas se presentan mediante medida de tendencia central y dispersión o posición según la distribución observada.

Se utilizó la prueba de Shapiro Wilk para evaluar la normalidad de las variables numéricas.

Se estableció como significativo un valor de p < 0,05.

Frecuencia absoluta o

número de veces en que

dicho evento se repite

durante un experimento o

muestra.

n

¿Qué es “número absoluto de presentación”?

Frecuencia

Absoluta Frecuencia

Relativa(%)

19 20

21 22

23 24

Page 5: ¿Por qué resumir?

26/1/2021

5

Frecuencias Absolutas: número de veces que aparece un determinado

valor. La suma de las frecuencias absolutas es igual al número total de

datos (se representa por la letra “n”).

Frecuencias Relativas: es el cociente entre la frecuencia absoluta de un

determinado valor y el número total de datos para esa categoría. Se

puede expresar en porcentaje. La suma de las frecuencias relativas es

igual a 1 (100%).

n o FA = 8

¿Cuál es la frecuencia absoluta de masculinos?

Sexo femenino=0

Sexo masculino=1

¿Cuál es la frecuencia relativa de femeninos?

FR de femeninos = 4/12= 0,333

Id Apellido Edad sexo

1 García 34 1

2 Gimenez 45 0

3 Pérez 32 1

4 Maradona 28 1

5 Gutierrez 49 0

6 Diaz 41 1

7 Silva 32 0

8 García 25 1

9 Gonzalez 40 1

10 Andreu 37 0

11 Sanguinati 50 1

12 Tevez 38 1

% de femeninos = 0,333 x 100 = 33,3%

Excluyente: Sexo

- Masculino (66,1)

- Femenino (43,9)

No Excluyente: a)Servicio que lo ingresó

- Medicina (19,4)

- Cirugía (?)

- Trauma(?)

- Podría haber más(?)

b) Tipo de TQT

-Percutanea

-Quirurgica

-?

Ejemplo:

TQT Percutanea

-Si (77,2)

-No (22,8)

?

25 26

27 28

29 30

Page 6: ¿Por qué resumir?

26/1/2021

6

Análisis estadístico:

Las variables categóricas se presentan como frecuencia absoluta de aparición y porcentaje del total.

Las variables numéricas se presentan mediante medida de tendencia central y dispersión o posición según la distribución observada.

Se utilizó la prueba de Shapiro Wilk para evaluar la parametricidad(normalidad) de las variables numéricas.

Se estableció como significativo un valor de p < 0,05.

Reportando Variables Contínuas

• Medidas para reportar el centro de la información = Media (x) y Mediana (Med o P50)

• Medidas para reportar la disperción (variabilidad) de los datos = Desvío Estándar (DE) Varianza (σ2), Rango (R), Rango intercuartil (RIC)

• Otras medidas de Ubicación de los datos = Maximo y Mínimo (Máx- Min), Percentiles (P25 - P75), Cuartiles (Q1 – Q3)

Media muestral

Sumar datos y dividir por el número total de datos (tamaño muestral)

31 32

33 34

35 36

Page 7: ¿Por qué resumir?

26/1/2021

7

ID VAS

1 5

2 7

3 9

4 8

5 7

6 7

7 6

8 6

5 + 7 + 9 + 8 + 7 + 7 + 6 + 6 = 55/8 = 6,88 5 + 7 + 9 + 8 + 7 + 7 + 6 + 6 + 1 + 1 = 57/10 = 5,7

La media es sensible a datos extremos

[(5 + 7 + 9 + 8 + 7 + 7 + 6 + 6)x3] + 1 + 1 = 167/26 = 6,42

A ↑ tamaño muestral ↑ la estabilidad a datos extremos Mediana (percentil 50)

Valor del medio que es menor

a una mitad de la muestra y

mayor a la otra mitad de la

muestra

5 + 6 + 6 + 7 + 7 + 7 + 8 + 9 = 14/2 = 7

5 + 7 + 9 + 8 + 7 + 7 + 6 + 6 = 55/8 = 6,88

La mediana es más estable a datos extremos

1+1+ 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9 = 13/2 = 6,5

Percentil

Percentil 25 =

1 2 3 4 5 6 7 8 9 10

25

100(10+1)

Percentil 25 = 25/100 x 11

Percentil 25 = 2,75

1 + 1 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9

2,75

El valor por debajo del cual se encuentra un porcentaje de los datos

37 38

39 40

41 42

Page 8: ¿Por qué resumir?

26/1/2021

8

Percentil

Percentil 25 = 2,75º ≈ 3º = 5

Percentil 50 = 5,5º = 6,5 (6+7/2 )

Percentil 75 = 7,25 ≈ 7º = 7

Med (p25 - p75) = 6,5 (4 – 7,25)

6,5 (5 - 7)

1 + 1 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9 Los Percentiles dividen a la muestra en 100 partes

Percentil 25 = 1º Cuartil

Percentil 50 = 2º Cuartil

Percentil 75 = 3º Cuartil

Los cuartiles la dividen en 4 partes

Entre cada cuartil queda el 25% de la muestra

25%25%25%25%

1º Cuartil 2º Cuartil 3º Cuartil

Percentil 25 (P25) o 1º cuartil (Q1) y Percentil 75 (P75) o 3º cuartil (Q3)

1 + 1 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9

Rango intercuartil (RIC)

Rango intercuartil = 3,25

1ºQ = 4

3ºQ = 7,25

3ºQ - 1ºQ = 7,25 - 4

50% 50%

10 días

14 días

17 días

25%25% 50%

43 44

45 46

47 48

Page 9: ¿Por qué resumir?

26/1/2021

9

Valor Mínimo y Máximo

1 + 1 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9

Rango

Rango = 8

Mínimo = 1

Máximo = 9

1 + 1 + 5 + 6 + 6 + 7 + 7 + 7 + 8 + 9

50% 50%

41 días

100%

16 días 235 días

Rango = 219

DE (desvío estándar)

¿Qué tan lejos están los números del promedio (media)?

Raíz Cuadrada del promedio de los

cuadrados de las desviaciones de la media.

6,88Media VAS: 6,88 puntos

49 50

51 52

53 54

Page 10: ¿Por qué resumir?

26/1/2021

10

6,88

IDVAS

basal (Valor – Media) (Desviación)2

1 5 -1.88 3,53

2 7 0,12 0,01

3 9 2,12 4,49

4 8 1,12 1,25

5 7 0,12 0,01

6 7 0,12 0,01

7 6 -0,88 0,77

8 6 -0,88 0,77

6,88 0 10,84/7 = 1,55 DE= √1,55 = 1,25 puntos

¿Que tan lejos están los números del promedio (media)?

Análisis estadístico:

Las variables categóricas se presentan como frecuencia absoluta de aparición y porcentaje del total.

Las variables numéricas se presentan mediante medida de tendencia central y dispersión o posición según la distribución observada.

Se utilizó la prueba de Shapiro Wilk para evaluar la parametricidad(normalidad) de las variables numéricas.

Se estableció como significativo un valor de p < 0,05.

• 1 sola mmoda y media = mediana

• Valores simétricamente

distribuidos a ambos lados de la

media (50% y 50%)

• Valores cercanos a la media son

mas frecuentes que los valores

alejados de la media

Propiedades de la Distribución NormalDistribución Normal

ID VAS basal

1 5

2 7

3 9

4 8

5 7

6 7

7 6

8 6

Media VAS: 6,88 puntos

DE ± 1,25 puntos

Mediana VAS = 7 puntos

Media VAS 6,88 puntos

DE ± 1,25 puntos

55 56

57 58

59 60

Page 11: ¿Por qué resumir?

26/1/2021

11

¿ Cómo puede explicarse esto ?

72,1 + 2DE = 72,1 + (2x67,7) = 72,1 + 135,4 = 207,5 días

72,1 - 2DE = 72,1 - (2x67,7) = 72,1 - 135,4 = -63,3 días

Todo muy lindo… pero ... ¿cómo sabemos qué

utilizar?

Análisis estadístico:

Las variables categóricas se presentan como frecuencia absoluta de aparición y porcentaje del total.

Las variables numéricas se presentan mediante medida de tendencia central y dispersión o posición según la distribución observada.

Se utilizó la prueba de Shapiro Wilk para evaluar la parametricidad(normalidad) de las variables numéricas.

Se estableció como significativo un valor de p < 0,05.

Prueba de NormalidadLos resultados de la prueba indican si rechazamos o aceptamos la

hipótesis nula de que los datos provienen de una población distribuida

normalmente.

Ho = Los datos tienen una distribución aprox normal

Ha = Los datos NO tienen una distribución aprox normal

p < 0.05 >>>>> Rechazamos Ho

p ≥ 0.05 >>>>> No Rechazamos Ho

61 62

63 64

65 66

Page 12: ¿Por qué resumir?

26/1/2021

12

Ho = La distribución de los datos es aproximadamente normal.

Nivel de significancia 5%

Valor p < 0.05 = Ho >>>> No puedo asumir normalidad

Entonces ... Mediana (RIQ) o Mediana (Mín-Máx)

Medidas de Forma

- Asimetría o Skewness

- Curtosis o Kurtosis

Histograma

Es una representación gráfica de una variable en

forma de barras, donde la superficie de cada barra

es proporcional a la frecuencia de los valores

representados.

Asimetría: Es una medida de la forma de una distribución.

Negativa (Izquierda): la media es menor que la mediana.

Simétrica: la media es similar a la mediana.

Positiva (Derecha): la media es mayor a la mediana.

Curtosis: determina el grado de concentración que presentan los valores en la

región central de la distribución.

Leptocúrtica: Existe una gran concentración.

Mesocúrtica: Existe una concentración normal.

Platicúrtica: Existe una baja concentración.

67 68

69 70

71 72

Page 13: ¿Por qué resumir?

26/1/2021

13

Resumen Test de Normalidad

p ≥ 0.05 Distribución Normal ➞ media (DE)

p < 0.05 ➞ mediana (p25 – p75)

➞ mediana (min – max)

Shapiro-Wilk hasta 50

Kolmogorov-Smirnov ≥ 51

73