La Estadistica no engaña

66
La Estadística no engaña Índic e UPTC 30-5-2011 Pág. 1 de 1 Introducción 1.- La incertidumbre y la probabilidad 2 .- La presentación gráfica de datos. Errores más comunes 3.- La correlación y la relación causa-efecto 4.- La media aritmética 5.- La variabilidad en los procesos naturales 6.- Unas pocas muestras permiten conocer un conju nto grande 7.- Unas nociones de fiabilidad

description

Seminario breve para mostrar algunas de las principales ideas sobre las que se ha creado la estadística, así como algunos ejemplos. Celebrado el 6 de marzo de 2012 en la Universidad Popular Carmen de Michelena de Tres Cantos. Más información en: http://www.universidadpopularc3c.es/index.php/actividades/conferencias/details/219-conferencia-las-estadisticas-no-enganan

Transcript of La Estadistica no engaña

Page 1: La Estadistica no engaña

La Estadística no engañaÍndice

UPTC30-5-2011

Pág. 1 de 1

Introducción1.- La incertidumbre y la probabilidad2.- La presentación gráfica de datos. Errores más comunes3.- La correlación y la relación causa-efecto4.- La media aritmética5.- La variabilidad en los procesos naturales6.- Unas pocas muestras permiten conocer un conjunto grande7.- Unas nociones de fiabilidad

Page 2: La Estadistica no engaña

La Estadística no engañaIntroducción

UPTC30-5-2011

Pág. 1 de 8

Se atribuye a Lord Kelvin esta frase:

“Nada sabemos de los fenómenos físicos y naturales hasta que no somos capaces de medirlos y expresarlos numéricamente”.

En consecuencia, cualquier descripción de fenómenos - sistemas naturales o creados por el hombre debe estar expresada mediante “datos”.

Esto es aplicable a una gama amplísima de cuestiones que nos afectan: salud, economía, sociología, técnica, etc.

Volver a Índice

Page 3: La Estadistica no engaña

La Estadística no engañaIntroducción

UPTC30-5-2011

Pág. 2 de 8

El desarrollo del conocimiento científico y técnico que ha experimentado el Mundo en los dos últimos siglos se ha apoyado en la Matemática.

Muchos procesos y sistemas naturales o creados por el hombre tienen un comportamiento aleatorio. La Matemática ha desarrollado herramientas específicas para tratar esos casos.

Esta herramienta es la Estadística

Volver a Índice

Page 4: La Estadistica no engaña

La Estadística no engañaIntroducción

UPTC30-5-2011

Pág. 3 de 8

La Estadística es una rama de la Matemática que nos proporciona ayuda para elaborar los datos y presentarlos de forma inteligible y útil.

Tiene como objeto avanzar en el conocimiento a partir de la observación y el análisis de la realidad, de forma inteligente y objetiva. Es la esencia del método científico

Volver a Índice

Page 5: La Estadistica no engaña

La Estadística no engañaIntroducción

UPTC30-5-2011

Pág. 4 de 8

Por otro lado, la Estadística se ha desarrollado intensamente, y en la actualidad abarca un número elevado de campos, tales como, por ejemplo:

- Métodos de inferencia- Aplicaciones de la teoría de la probabilidad- Diseño de experimentos- Pruebas de hipótesis-Etc.

Volver a Índice

Page 6: La Estadistica no engaña

La Estadística no engañaIntroducción

UPTC30-5-2011

Pág. 5 de 8

Una de la primeras aplicaciones prácticas, que tuvo enormes consecuencias, fue el estudio que realizó Florence Nightingale a mediados del siglo XIX sobre las causas de mortalidad del ejército inglés (guerra de Crimea).

Volver a Índice

Page 7: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 6 de 8

Volver a Índice

.

Introducción

Observar que la presentación de datos que muestra este documento se sigue empleando en nuestros días.

Page 8: La Estadistica no engaña

La Estadística no engañaIntroducción

UPTC30-5-2011

Pág. 7 de 8

El uso de datos estadísticos está muy extendido en nuestro mundo actual, y podemos decir que no hay campo de la actividad o conocimiento humanos en los que el empleo de datos estadísticos no sea fundamental.

Recibimos un aluvión constante de datos estadísticos, transmitidos habitualmente por los medios de comunicación.

Se dan bastantes casos en los que los datos estadísticos, sin ser necesariamente falsos, se prestan a interpretaciones erróneas. Por ello vemos la necesidad de preparar a la ciudadanía para juzgar con una base firme los datos estadísticos que recibimos.

Volver a Índice

Page 9: La Estadistica no engaña

La Estadística no engañaIntroducción

UPTC30-5-2011

Pág. 8 de 8

No pretendemos dar un “curso acelerado” de Estadística

Pretendemos mostrar las características mínimas imprescindibles que deben tener los datos

estadísticos para no inducir a error.

Recomendamos dos libros de divulgación de la Estadística, ambos de la editorial RBA.

“La certeza absoluta y otras ficciones. Los secretos de la estadística” - Autor: Pere Grima“La conquista del azar. La teoría de las probabilidades” - Autores F. Corbalán y G. Sanz

Volver a Índice

Page 10: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 1 de 15

Volver a Índice

1.- La incertidumbre y la probabilidad

Muchos procesos y sistemas, tanto naturales como creados por el hombre, son aleatorios. Esto hace que sus datos numéricos solo se puedan conocer con un cierto grado de incertidumbre.

La Estadística es especialmente útil en estos casos de aleatoriedad e incertidumbre.

Ejemplos comunes:- Sondeos de opinión- Epidemiología- Ensayos de medicamentos- Estudios de fiabilidad de equipamientos técnicos- Análisis de la calidad de alimentos- Etc.

Page 11: La Estadistica no engaña

La Estadística no engaña1.-La incertidumbre y la probabilidad

UPTC30-5-2011

Pág. 2 de 15

Parece que podemos afirmar que los juegos de azar, y el concepto asociado de probabilidad, se conocían en la antigüedad (antiguo Egipto, etc.).

Pero no es hasta mediados del siglo XVIII cuando se estudian estas cuestiones desde un punto de vista matemático. Entonces se desarrolla el concepto de Probabilidad matemática.

El concepto de incertidumbre se aplica a las predicciones de eventos futuros, a las mediciones físicas ya realizadas, o cuando tratamos de lo desconocido

Volver a Índice

Page 12: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la

probabilidad

UPTC30-5-2011

Pág. 3 de 15

Ejemplo: arrojamos un dado normal (6 caras) una vez. Mostrará un número entre 1 y 6, pero de antemano no podemos asegurar cual va a ser el resultado concreto.

El desconocimiento del resultado concreto se denomina incertidumbre. Pero a pesar de que ese desconocimiento es inevitable, podemos conocer algo del fenómeno, mediante el concepto de probabilidad.

Volver a Índice

Page 13: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la

probabilidad

UPTC30-5-2011

Pág. 4 de 15

Siguiendo con el ejemplo anterior:

Si repitiésemos la tirada 600 veces por ejemplo, el 1 saldría aproximadamente unas 100 veces. Y lo mismo podríamos decir del resto de números del dado.

Definición operativa:

Número de casos favorablesProbabilidad = Número de casos posibles

No podemos conocer cual va a ser el resultado concreto de una tirada, pero avanzamos en el conocimiento al introducir el concepto de probabilidad.

Volver a Índice

Page 14: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la

probabilidad

UPTC30-5-2011

Pág. 5 de 15

La probabilidad es un número entre 0 y 1. Por ejemplo, 0,23

Una probabilidad = 0 significa que el suceso es imposible

Una probabilidad = 1 significa que el suceso se va a producir con una seguridad total

Por lo tanto, si un suceso tiene una probabilidad 0,23 de suceder, tendrá una probabilidad (1-0,23) = 0,77 de no suceder.

Volver a Índice

Page 15: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 6 de 15

Volver a Índice

1.- La incertidumbre y la probabilidad

Los especialistas emplean la palabras Incertidumbre y Riesgo de forma muy diferente a como las emplea el público en general. Para los especialistas, se definen como sigue:

1.- Incertidumbre: Falta de certeza, un estado en el cual se tiene un conocimiento limitado que hace imposible describir con exactitud el estado actual, un resultado futuro, o uno más entre varios resultados posibles.

2.- Riesgo: Combinación de la Probabilidad de que se de un suceso, con las consecuencias económicas, humanas, etc. de ese suceso.

Page 16: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la probabilidad

UPTC30-5-2011

Pág. 7 de 15

Una persona aficionada a los juegos de azar se encuentra frente a esta disyuntiva:

La Lotería A consta de 65.000 números. Ofrece un premio principal de 10 millones de €. El precio de cada número es 10 €.

La Lotería B consta de 650.000 números. Ofrece un premio principal de 100 millones de €. El precio de cada número es de 30 €.

¿Qué lotería recomendaríamos a esa persona?.

Volver a Índice

Page 17: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la

probabilidad

UPTC30-5-2011

Pág. 8 de 15

Volver a Índice

Errores comunes en el empleo del concepto de incertidumbre

No todos los datos estadísticos se conocen con incertidumbre, y por ello tenemos que aplicar algún criterio para saber en qué casos los datos tienen incertidumbre:

- Procesos o sistemas cuyo comportamiento es aleatorio- Procesos o sistemas que cambian con el tiempo- Procesos de los que tomamos solo muestras- Etc.

En todos esos casos tenemos que exigir que se nos proporcione la incertidumbre con la que se obtienen los datos.

Page 18: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 9 de 15

Volver a Índice

1.- La incertidumbre y la probabilidad

Errores más comunes en el empleo de probabilidad

El error más común en el empleo del concepto de probabilidad es la confusión con el concepto de posibilidad.

Decimos probabilidad y posibilidad de forma indistinta

La probabilidad debe expresarse de forma cuantificada (por ejemplo: 0,3, 0,7, etc.).

Page 19: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la

probabilidad

UPTC30-5-2011

Pág. 10 de 15

Volver a Índice

Errores comunes en el empleo del concepto de incertidumbre

El error más común es considerar que la incertidumbre no existe, y que, por lo tanto, se pueden conocer todas las cosas con certeza absoluta.

Ante la posibilidad (no probabilidad) de ocurrencia de siniestros, tenemos que aplicar el “Principio de Precaución”, pero de forma que no nos conduzca a la parálisis.

Page 20: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la

probabilidad

UPTC30-5-2011

Pág. 11 de 15

Volver a Índice

Paradojas de la probabilidad

De las numerosas paradojas que el concepto de probabilidad da lugar, vamos a mostrar una mediante un ejemplo, dada su importancia en la vida real.

Lo presentamos como una muestra de las paradojas a que conducen las probabilidades condicionadas por otras probabilidades (teorema de Bayes)

Page 21: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la

probabilidad

UPTC30-5-2011

Pág. 12 de 15

Volver a Índice

Paradojas de la probabilidad

Datos de entrada:

La enfermedad E afecta a un 0,4 % de la población de un país.

La enfermedad E se detecta mediante una prueba diagnóstica P. En caso de que una persona padezca E, hay un 99,5 % de probabilidad de que P arroje un resultado positivo (“positivo cierto”).

Por otro lado si una persona no sufre E, la prueba P arrojará un resultado positivo erróneo (“falso positivo”) con un 1 % de probabilidad.

Este 1% de falsos positivos ¿invalida la prueba P?

Page 22: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la

probabilidad

UPTC30-5-2011

Pág. 13 de 15

Volver a Índice

Paradojas de la probabilidad

Cálculos:

Suponemos que 1.000.000 (un millón) de personas se someten a P para detectar E.

Por lo datos anteriores sabemos que 0,4 % de 1.000.000 sufren E, luego: 0,4 x 1.000.000/100 = 4.000 personas sufren E.

Como hemos dicho, el 99,5 % de los enfermos arrojarán un resultado positivo cierto en P. Es decir: 99,5 x 4000/100 = 3980 personas tendrán un resultado positivo cierto.

Page 23: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la

probabilidad

UPTC30-5-2011

Pág. 14 de 15

Volver a Índice

Paradojas de la probabilidad

Cálculos:

Pero del millón de personas sometidas a P, habrá 1.000.000 – 4000 = 996.000 personas sanas

Pero como hemos dicho, de esas personas sanas, 1 x 996.000 /100 = 9.960 personas recibirán un “falso positivo” (diagnóstico erróneo)

Es decir, el número total de positivos (ciertos y falsos) será: 3.980 + 9.960 = 13940 diagnósticos positivos

Page 24: La Estadistica no engaña

La Estadística no engaña1.- La incertidumbre y la

probabilidad

UPTC30-5-2011

Pág. 15 de 15

Volver a Índice

Paradojas de la probabilidad

Conclusión:

De los 13940 resultados positivos que va a ofrecer la prueba, solo son ciertos: (3.980/13.940)/100 = 28,6 %.

El resto, es decir el 71,4 % son falsos positivos

En definitiva, la prueba P no ofrece ninguna garantía

Page 25: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 1 de 6

Errores gráficos

El gráfico muestra errores de bulto en las longitudes de las barras, por lo cual no podemos hacer una comparación rápida entre las familias, incluso ni aproximadamente.

Volver a Índice

2.- Errores más comunes

en la presentación de datos estadísticos

La longitud de las barras es errónea

Page 26: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 2 de 6

¿Datos absolutos o relativos?

La presentación de datos exige un estudio cuidadoso para determinar que clase de datos son necesarios: Absolutos o Relativos.

Cada situación concreta exigirá una de las dos clases de datos. En caso de duda, es conveniente dar las dos clases de datos.

Volver a Índice

2.- Errores más comunes

en la presentación de datos estadísticos

Page 27: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 3 de 6

¿Datos absolutos o relativos?

Volver a Índice Gráficos de datos absolutos y datos relativos

2.- Errores más comunes

en la presentación de datos estadísticos

Page 28: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 4 de 6

Elección de las escalas vertical y horizontal

Volver a Índice

-Este gráfico no permite hacer ninguna predicción

- Este gráfico permite hacer alguna predicción (dentro de los límites de la Estadística).

2.- Errores más comunes

en la presentación de datos estadísticos

Page 29: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 5 de 6

Elección de las escalas vertical y horizontal

¿Ha crecido la renta per cápita de los países ricos mucho más que la de los países medios y pobres?

Volver a Índice

2.- Errores más comunes

en la presentación de datos estadísticos

Crecimiento de la renta per cápita 1961-1997

Países ricos: x2,5Países medios: x2,4

Page 30: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 6 de 6

Elección de las escalas vertical y horizontal

Volver a Índice

La elección de las escalas vertical y horizontal puede dar lugar a un panorama totalmente distinto.Es muy importante la posición del gráfico respecto del “cero”

2.- Errores más comunes

en la presentación de datos estadísticos

Page 31: La Estadistica no engaña

La Estadística no engaña3.- La correlación y la relación causa-efecto

UPTC30-5-2011

Pág. 1 de 4

Volver a Índice

Coeficiente de correlación = 0,73¿Depende la autoestima de la estatura?. ¿O es al contrario? ¿Hay alguna relación causa-efecto?

PersonaAltura Pulgadas Autoestima

1 68 4.12 71 4.63 62 3.84 75 4.45 58 3.26 60 3.17 67 3.88 68 4.19 71 4.3

10 69 3.711 68 3.512 67 3.213 63 3.714 62 3.315 60 3.416 63 4.017 65 4.118 67 3.819 63 3.420 61 3.6

La correlación estadística se puede definir como una medida de la influencia que un parámetro de un proceso ejerce sobre otro parámetro.

Altura (pulgadas)

Aut

oest

ima

Page 32: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 2 de 4

La relación causa – efecto no se puede deducir del gráfico

Volver a Índice

Este ejemplo, tomado de los estudios del Cambio Climático, muestra que la relación causa-efecto no se puede establecer con garantía hasta no haber alcanzado un conocimiento profundo del fenómeno en cuestión.

3.- La correlación y la relación causa-efecto

En este caso, la relación causa-efecto se apoya en el conocimiento del efecto de invernadero

Page 33: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 3 de 4

El coeficiente de correlación NO prueba la relación causa- efecto.

Volver a Índice

Gráfico del gasto por alumno de enseñanza secundaria en las CCAA españolas, y la tasa de abandono escolar .¿Influye el gasto por alumno en el % de abandono escolar?

La correlación es una condición necesaria, pero no suficiente

3.- La correlación y la relación causa-efecto

Page 34: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 4 de 4

La relación causa – efecto está oculta entre los datos

Volver a Índice

Este ejemplo nos muestra algo importante: Los gráficos, por si solos, no proporcionan información válida sobre las causas de los fenómenos 

3.- La correlación y la relación causa-efecto

Page 35: La Estadistica no engaña

La Estadística no engaña4.- La media aritmética

UPTC30-5-2011

Pág. 1 de 7

Definición y ejemplo

Volver a Índice

Suma de valoresMedia aritmética =

Número de valores

Page 36: La Estadistica no engaña

La Estadística no engaña4.- La media aritmética

UPTC30-5-2011

Pág. 2 de 7

Definición y ejemplo

Volver a Índice

Vamos a considerar procesos se repiten a lo largo del tiempo.

Tomamos los datos de un período de tiempo y calculamos la media M1

Tomamos otro período de tiempo, y calculamos su media M2

M1 y M2 serán diferentes. ¿Cuál será la diferencia entre M1 y M2?

Page 37: La Estadistica no engaña

La Estadística no engaña4.- La media aritmética

UPTC30-5-2011

Pág. 3 de 7

Cómo cambia la media al cambiar los datos

Volver a Índice

En este ejemplo,

cambia un solo dato

La media es poco sensible a los cambios en los datos

Media antes del cambio

Media después del cambio

Page 38: La Estadistica no engaña

La Estadística no engaña4.- La media aritmética

UPTC30-5-2011

Pág. 4 de 7

Consecuencia

Volver a Índice

Para que la media cambie significativamente, los datos tienen que cambiar de forma importante, es decir:

- Tienen que cambiar muchos datos en un solo sentido (+ o -).

- Tienen que cambiar solo unos pocos datos, pero éstos tienen que cambiar de forma muy importante en un solo sentido (+ o -).

Page 39: La Estadistica no engaña

La Estadística no engaña4.- La media aritmética

UPTC30-5-2011

Pág. 5 de 7

Consecuencia

Volver a Índice

En caso de que la media haya cambiado significativamente, podemos decir que los

datos han tenido que cambiar de forma muy importante

Page 40: La Estadistica no engaña

La Estadística no engaña4.- La media aritmética

UPTC30-5-2011

Pág. 6 de 7

Ejemplos

Volver a Índice

Un ejemplo de uso de la media, con resultados aparentemente paradójicos, es el cambio climático:

Para muchas personas, un aumento de la temperatura media global de 0,5 ºC en un período de unos 50 años es un aumento muy pequeño.

Pero esa cifra es el aumento de una media aritmética, y por ello tienen que haberse dado temperaturas máximas muy elevadas durante muchos días para que la temperatura media aumente 0,5 ºC.

Page 41: La Estadistica no engaña

La Estadística no engaña4.- La media aritmética

UPTC30-5-2011

Pág. 7 de 7

Ejemplos

Volver a Índice

50 años = 18250 días = 600 meses

Vamos a suponer que todo el aumento de temperatura se da en 3 días de cada mes, es decir, en 3x600 = 1800 días

El número de días en los que no ha cambiado la temperatura será: 18250 – 1800 = 16450 días.Tm = Temperatura media antes del cambioI = Incremento de temperatura en los 1800 díasS = Aumento de la temperatura media en los 50 años = 0,5 ºC

16450xTm + 1800x(Tm+I)= 18250x(Tm+S)

I = (18250x0,5)/1800 = 5,06 ºC

Page 42: La Estadistica no engaña

La Estadística no engaña 5.- La variabilidad en los procesos naturales

UPTC30-5-2011

Pág. 1 de 10

Definición

Volver a Índice

Los procesos naturales presentan variabilidad, achacable a dos clases de causas:

- Causas aleatorias- Causas asignables

En general, todos los procesos contienen causas de variabilidad de ambas clases.

Lo que sigue es aplicable a procesos que se desarrollan a lo largo del tiempo

Page 43: La Estadistica no engaña

La Estadística no engaña 5.- La variabilidad en los procesos naturales

UPTC30-5-2011

Pág. 2 de 10

Definición

Volver a Índice

- Causas aleatorias. * Fenómenos que están activos de forma constante en el sistema

* Su efecto es predecible estadísticamente* Varían irregularmente a lo largo del tiempo* El valor individual de cada una de estas causas no es significativo

- Causas asignables. •Fenómenos nuevos, no previstos, emergentes o previamente despreciados• Su efecto es inherentemente impredecible, incluso estadísticamente• Suponen la evidencia de algún cambio inherente al sistema

Page 44: La Estadistica no engaña

La Estadística no engaña5.- La variabilidad en los procesos naturales

UPTC30-5-2011

Pág. 3 de 10

Definición

Volver a Índice

La distinción entre causas aleatorias y causas asignables tiene una gran importancia: - El tratamiento de ambas clases es totalmente distinto- En caso de que solo actúen causas aleatorias, el sistema o proceso es previsible.- En caso de que actúen causas asignables, el sistema o proceso no es previsible.

Page 45: La Estadistica no engaña

La Estadística no engaña5.- La variabilidad en los procesos naturales

UPTC30-5-2011

Pág. 4 de 10

Definición de estado de control estadístico

Volver a Índice

Un proceso en el actúen exclusivamente causas aleatorias se dice que está bajo control estadístico.

En este caso, el proceso es predecible dentro de ciertos límites estadísticos.

Page 46: La Estadistica no engaña

La Estadística no engaña4.- La variabilidad en los procesos naturales

UPTC30-5-2011

Pág. 5 de 10

Volver a Índice

Gráfica de la presión diastólica de un paciente hipertenso.(Cada punto es la media de 5 medidas).

Las líneas LSCE y LICE muestran los límites estadísticos inherentes del proceso o sistema.

Todos lo valores situados dentro de ambos límites han sido originados por causas aleatorias de variabilidad.

Ejemplo de proceso bajo control estadístico

Page 47: La Estadistica no engaña

La Estadística no engaña4.- La variabilidad en los procesos naturales

UPTC30-5-2011

Pág. 6 de 10

Volver a Índice

¿Qué información proporcionan los datos de la gráfica?

Todos los puntos del gráfico se hallan dentro de los límites LSCE y LICE, luego en el proceso solo actúan causas de variabilidad aleatorias.

Mientras no comiencen a actuar causas de variabilidad asignables,

el 99,73 % de los valores de presión diastólica se van a mantener dentro de los límites LSCE y LICE.

Las únicas evidencias de cambios significativos corresponderían a puntos fuera de los límites LSCE y LICE y otros criterios (rachas, series de datos crecientes, decrecientes, etc.).

Page 48: La Estadistica no engaña

La Estadística no engaña4.- La variabilidad en los procesos naturales

UPTC30-5-2011

Pág. 7 de 10

Volver a Índice

Consecuencias importantes:

Todos lo valores de presión diastólica son diferentes numéricamente, pero desde un punto de vista estadístico son EQUIVALENTES.

Las diferencias existentes entre puntos (sucesivos o no) no son significativas, y no se pueden tomar como evidencia de cambios en el proceso o sistema.

Page 49: La Estadistica no engaña

La Estadística no engaña5.- La variabilidad en los procesos naturales

UPTC30-5-2011

Pág. 8 de 10

Volver a Índice

¿Qué podemos decir en caso de que haya algún punto fuera de los límites LSCE y LICE ?

Lo más importante es señalar que en el proceso o sistema comienzan a actuar causas de variabilidad asignables.

Si se dieran estas condiciones, no podemos realizar ninguna predicción acerca del comportamiento futuro del sistema o proceso.

Page 50: La Estadistica no engaña

La Estadística no engaña5.- La variabilidad en los procesos naturales

UPTC30-5-2011

Pág. 9 de 10

Volver a Índice

Errores más comunes en la interpretación de gráficas de evolución temporal de procesos o sistemas.

El error más común consiste en olvidar el carácter aleatorio de los procesos o sistemas, por lo cual es muy importante conocer los límites de variabilidad aleatoria inherente al proceso. Para ello se calculan y trazan las rectas LSCE y LICE.

Un error muy común consiste en considerar como una mejora (o empeoramiento) la evolución positiva o negativa de un solo valor respecto del precedente.

No hay verdadera mejora o empeoramiento mientras no se sobrepasen los límites de control estadístico.

Page 51: La Estadistica no engaña

La Estadística no engaña5.- La variabilidad en los procesos naturales

UPTC30-5-2011

Pág. 10 de 10

Volver a Índice

¿Ha empeorado la capacidad lectora de los estudiantes españoles (15 años de edad) entre 2000 y 2006?. ¿Cuál será la valoración en 2011? (se publicará en 2012)

Page 52: La Estadistica no engaña

La Estadística no engaña 6.- Unas pocas muestras permiten

conocer un conjunto grande

UPTC30-5-2011

Pág. 1 de 11

La estadística hace uso muy frecuente de las técnicas de muestreo:

El análisis de una muestra relativamente pequeña nos permite conocer propiedades de un conjunto de objetos mucho mayor.

Ejemplos más comunes:- Sondeos de opinión- Estudios de mercado- Análisis de productos fabricados/producidos (caso “pepinillos”)- Estudio de la eficacia de medicamentos, vacunas, etc.

Las técnicas de muestreo se deben poner en práctica de forma rigurosa con objeto de no perder la validez de los resultados.

Volver a Índice

Page 53: La Estadistica no engaña

La Estadística no engaña 6.- Unas pocas muestras permiten

conocer un conjunto grande

UPTC30-5-2011

Pág. 2 de 11

Volver a Índice

Las técnica de muestreo ofrecen resultados con incertidumbre que procede de varias fuentes.

La más importante es la incertidumbre estadística, provocada por el hecho de que se utiliza una muestra mucho menor que la “población”

Conceptos fundamentales de las técnicas de muestreo

Page 54: La Estadistica no engaña

La Estadística no engaña 6.- Unas pocas muestras permiten

conocer un conjunto grande

UPTC30-5-2011

Pág. 3 de 11

Los rasgos fundamentales de un estudio por muestreo adecuadamente diseñado y ejecutado son:

- Representatividad de la muestra: Debe contener ejemplares de todos los grupos significativos (edad, nivel de estudios, nivel socio-económico, área geográfica, ciudad/rural, etc.

- Grado de confianza de los resultados. Mide la seguridad que podemos tener de que los resultados caigan dentro del intervalo de confianza

- Intervalo de confianza de los datos numéricos. Mide la incertidumbre estadística de los resultados

Volver a Índice

Page 55: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 4 de 11

Tabla de intervalo de confianza para un nivel de confianza del 95%

Interpretación de la tabla:Queremos conocer la estatura media de los hombres de una ciudad. Tomamos una muestra de 1000 hombres, los medimos y calculamos la media “M”.

Si repitiésemos el estudio 100 veces, 95 veces el resultado (media) caería entre los límites:

M ± 3,1 %En 5 estudios, el resultado caería fuera de esos límites.

Volver a Índice

6.- Unas pocas muestras permiten

conocer un conjunto grande

Page 56: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 5 de 11

Ejemplo de estudio por muestreo bien diseñado y realizado:

El enlace siguiente muestra un estudio estadístico realizado en 2008 por la Universidad de Santiago de Compostela, en colaboración con la Fundación MAPFRE, sobre una muestra de 1200 personas de toda España. La incertidumbre (intervalo de confianza) de los resultados es ± 2,89 % para un grado de confianza del 95,5 %.

http://www.mma.es/portal/secciones/formacion_educacion/grupos_ceneam/respuestas_educ_cc/pdf/1sociedad_ante-cc.pdf

Volver a Índice

6.- Unas pocas muestras permiten

conocer un conjunto grande

Page 57: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 6 de 11

Ejemplo de comunicación de resultados de un estudio por muestreo

Es habitual que se especifiquen los resultados así:“Tras realizar el estudio, el 75 % de los pacientes tratados experimentó una mejoría”

Debiera decirse: “Tras realizar el estudio, el 75 % de los pacientes tratados experimentó una mejoría, siendo el intervalo de confianza ±6 %, para un nivel de confianza del 95 %”

Con ello queremos decir que si repitiésemos el estudio 100 veces, en 95 estudios la media caería entre el 69 % y el 81 %.En 5 estudios la media caería fuera de esos límites.

Volver a Índice

6.- Unas pocas muestras permiten

conocer un conjunto grande

Page 58: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 7 de 11

Volver a Índice

El Informe PISA (Resultados de Competencia Lectora)

Tabla publicada por un diario español el 7-12-2010

¿Cuánta incertidumbre tienen estos datos?

6.- Unas pocas muestras permiten

conocer un conjunto grande

Page 59: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 8 de 11

Volver a ÍndiceTabla publicada por el Ministerio de Educación con datos de PISA

6.- Unas pocas muestras permiten

conocer un conjunto grande

Page 60: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 9 de 11

Volver a Índice

Tabla publicada por el Ministerio de Educación con datos de PISA

Averiguar los resultados significativamente distintos, basándonos en los límites de confianza (casos Murcia-Andalucía/Cantabria-Italia)

6.- Unas pocas muestras permiten

conocer un conjunto grande

Page 61: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 10 de 11

Volver a Índice

6.- Unas pocas muestras permiten

conocer un conjunto grande

¿Qué falta en esta tabla?

Page 62: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 11 de 11

Volver a Índice

6.- Unas pocas muestras permiten

conocer un conjunto grande

¿Qué falta en esta tabla?

Page 63: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 1 de 4

Volver a Índice

En los sistemas mecánicos, electrónicos, etc., se supone que durante el período de vida útil de funcionamiento, cada uno de los componentes tiene una tasa de fallos constante.

Esto conduce a que el tiempo medio entre fallos del producto se puede calcular como:

MTBF = 1 / (suma de todos los tipos de fallo de piezas)

Se puede interpretar también como sigue:Suponemos que tenemos un cierto número de sistemas iguales en operación. El MBTF es la media de los períodos de tiempo sin fallos de todos los sistemas iguales.

7.- Unas nociones de fiabilidad

Page 64: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 2 de 4

Volver a Índice

La probabilidad de que el sistema funcione sin fallos durante un período de tiempo T está dada por:

(-T/MTBF) R (T) = e

Ejemplo: Un producto con un MTBF de 250.000 horas (28,5 años) lo hacemos funcionar durante 5 años (24x7 = 43.800 horas), tenemos que:

R = exp (-43800/250000) = 0,84 = 84 %

Esto significa que tenemos una probabilidad del 84% de que el producto funcione durante los 5 años sin fallar.

¿Significa esto que tenemos que esperar a que pasen 5 años para sufrir el primer fallo?

7.- Unas nociones de fiabilidad

Page 65: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 3 de 4

Volver a Índice

Otra interpretación es que el 84% de un número de sistemas iguales en operación seguirá trabajando sin fallos durante 5 años.

Nota: el cálculo de fiabilidad asume el reemplazo del componente en caso de fallo .

7.- Unas nociones de fiabilidad

Page 66: La Estadistica no engaña

La Estadística no engañaUPTC30-5-2011

Pág. 4 de 4

Volver a Índice

Ejemplo: Tenemos un sistema con un MTBF = 1000 años.

¿Que probabilidad tenemos de que funcione sin fallos durante 25 años?

R = exp (-25/1000) = 0,975 = 97,5 %

También significa que si hubiera muchos sistemas iguales al indicado, por ejemplo 100, en promedio 2,5 sistemas sufrirán fallos en 25 años de funcionamiento.

7.- Unas nociones de fiabilidad