LECTURA N°2 T-STUDENT

2
BIOGRAFIA DE WILLIAM SEALY GOSSET (STUDENT) William Sealy Gosset fue el hijo mayor del coronel Frederic Gosset, R.E. Nació en Canterbury en el año de 1876 y falleció el 16 de octubre de 1937. Se educó en Winchester, en donde más tarde fue profesor, y en el New College de Oxford en donde estudió química y matemáticas. En 1899 se inició en trabajos en el departamento de fermentación de la compañía cervecera de los Sres. Guinness en Dublín. No se sabe con exactitud en qué momento empezó a interesarse Gosset en la estadística, sin embargo en ese época se empezaron a usar métodos científicos y determinaciones de laboratorio para técnicas de fermentación, por lo que es muy posible que siendo Gosset el de mayor inclinación matemática del departamento de fermentación recibiera las preguntas que le hacían sus colegas sobre los métodos estadísticos en uso y sobre la masa de datos que se colectaban -los cuales requerían análisis-. Quizá esto lo motivó a estudiar la materia más a fondo. Su principal herramienta y con la que inició sus estudios fueron los libros "Teoría de errores de observaciones" de G.B.Airy y "El método de mínimos cuadrados" de M. Merriman. Se sabe que ya en 1903 él calculaba el error probable. Las circunstancias en las que se llevan a cabo los procesos de fermentación en la producción de cerveza, con materiales variables, susceptibilidad a cambio de temperaturas y necesariamente series pequeñas de experimentos, son tales que pronto demostraron a Gosset las limitaciones de la teoría de muestras grandes y le enfatizaron la necesidad de un método correcto para el tratamiento de muestras pequeñas. No fue entonces un accidente, sino más bien las circunstancias de su trabajo, las que dirigieron a Gosset hacia este problema, y lo condujeron al descubrimiento de la distribución de la desviación estándar muestral, lo cual dio origen a lo que en su forma moderna se conoce como la prueba t. Durante mucho tiempo después de su descubrimiento, el uso de esta prueba no se conoció ampliamente fuera de la compañía Cervecera Guinness, en donde se le ha usado intensamente desde entonces. En el desarrollo de su estadística, Gosset mismo realizaba toda la aritmética involucrada en sus investigaciones, ya que no tuvo asistente estadístico permanente sino hasta 1922. La aritmética que manejaba era considerable, debido a que sus descubrimientos se basaban en una gran cantidad de experimentos. En al menos una ocasión le fue ofrecida una posición académica en la que tal vez hubiera sido un buen profesor, pero es muy poco probable que su trabajo de investigación hubiera florecido en circunstancias académicas; su mente funcionaba en forma diferente. En los trabajos con el Departamento de Agricultura de Irlanda, Gosset tuvo la oportunidad de estar en contacto con agricultores y conocer todos los detalles relacionados con el cultivo de la cebada. El mismo hizo algunas cruzas de cebada en su propio jardín. Se traslada a Dublín para mejorar tanto el proceso de fermentación como la selección de materias primas. Gosset tendría como objetivo analizar muestras para optimizar ambos procesos. Su problema, matemáticamente hablando, era obtener resultados estadísticamente significativos a partir de un número comparativamente reducido de muestras. Con la ayuda del matemático Karl Pearson, Gosset obtuvo unos resultados a los que en principio no se concedió mucha importancia, pero que acabarían siendo claves para la estadística moderna. Había un pequeño problema: Guinness prohibía la publicación de las investigaciones realizadas por la compañía, puesto que lo consideraba como un secreto industrial. Gosset decidió entonces utilizar el seudónimo “Student” y publicarlas igualmente, con la esperanza de no ser descubierto. El trabajo de Gosset pasó inicialmente inadvertido. Envió sus tablas al padre de la bioestadística Ronald Fisher, diciéndole que creía que sería el único que las fuese a utilizar. Fisher comprendió el gran alcance del trabajo de Gosset, y lo aplicó a sus propias investigaciones, completándolo y mejorándolo. La función t de Student se hizo famosa, de hecho, gracias a Fisher. La importancia de la función t La t de Student está relacionada con el estudio de poblaciones muy grandes a partir de una muestra comparativamente muy pequeña. La función surge al querer estimar la media de una determinada variable en cierta población, que se supone normalmente distribuida, pero de la cual se desconoce la varianza, es decir, la tendencia de las muestras a desviarse del valor promedio. Pues bien, este es precisamente el caso de las encuestas realizadas sobre la población de un territorio. Por ejemplo, el objetivo de una encuesta electoral es estimar el promedio de intención de voto de cada partido, contando con muy pocas muestras aleatorias de la población total. Para evaluar la „calidad‟ de la estimación, es necesario recurrir a la función t de Student, de la cual obtenemos un intervalo de confianza. Su muerte a la relativamente temprana edad de 61 años fue una gran pérdida para la estadística, ya que con su mente vigorosa, todavía, seguramente hubiera podido continuar trabajando durante muchos años más

Transcript of LECTURA N°2 T-STUDENT

Page 1: LECTURA N°2 T-STUDENT

BIOGRAFIA DE WILLIAM SEALY GOSSET (STUDENT)

William Sealy Gosset fue el hijo mayor del coronel Frederic Gosset, R.E. Nació en Canterbury en el año

de 1876 y falleció el 16 de octubre de 1937.

Se educó en Winchester, en donde más tarde fue profesor, y en el New College de Oxford en donde

estudió química y matemáticas. En 1899 se inició en trabajos en el departamento de fermentación de la

compañía cervecera de los Sres. Guinness en Dublín.

No se sabe con exactitud en qué momento empezó a interesarse Gosset en la estadística, sin embargo en

ese época se empezaron a usar métodos científicos y determinaciones de laboratorio para técnicas de

fermentación, por lo que es muy posible que siendo Gosset el de mayor inclinación matemática del

departamento de fermentación recibiera las preguntas que le hacían sus colegas sobre los métodos

estadísticos en uso y sobre la masa de datos que se colectaban -los cuales requerían análisis-. Quizá esto

lo motivó a estudiar la materia más a fondo. Su principal herramienta y con la que inició sus estudios

fueron los libros "Teoría de errores de observaciones" de G.B.Airy y "El método de mínimos cuadrados"

de M. Merriman. Se sabe que ya en 1903 él calculaba el error probable. Las circunstancias en las que se

llevan a cabo los procesos de fermentación en la producción de cerveza, con materiales variables,

susceptibilidad a cambio de temperaturas y necesariamente series pequeñas de experimentos, son tales

que pronto demostraron a Gosset las limitaciones de la teoría de muestras grandes y le enfatizaron la

necesidad de un método correcto para el tratamiento de muestras pequeñas. No fue entonces un accidente,

sino más bien las circunstancias de su trabajo, las que dirigieron a Gosset hacia este problema, y lo

condujeron al descubrimiento de la distribución de la desviación estándar muestral, lo cual dio origen a lo

que en su forma moderna se conoce como la prueba t. Durante mucho tiempo después de su

descubrimiento, el uso de esta prueba no se conoció ampliamente fuera de la compañía Cervecera

Guinness, en donde se le ha usado intensamente desde entonces.

En el desarrollo de su estadística, Gosset mismo realizaba toda la aritmética involucrada en sus

investigaciones, ya que no tuvo asistente estadístico permanente sino hasta 1922. La aritmética que

manejaba era considerable, debido a que sus descubrimientos se basaban en una gran cantidad de

experimentos.

En al menos una ocasión le fue ofrecida una posición académica en la que tal vez hubiera sido un buen

profesor, pero es muy poco probable que su trabajo de investigación hubiera florecido en circunstancias

académicas; su mente funcionaba en forma diferente. En los trabajos con el Departamento de Agricultura

de Irlanda, Gosset tuvo la oportunidad de estar en contacto con agricultores y conocer todos los detalles

relacionados con el cultivo de la cebada. El mismo hizo algunas cruzas de cebada en su propio jardín.

Se traslada a Dublín para mejorar tanto el proceso de fermentación como la selección de materias primas.

Gosset tendría como objetivo analizar muestras para optimizar ambos procesos. Su problema,

matemáticamente hablando, era obtener resultados estadísticamente significativos a partir de un número

comparativamente reducido de muestras.

Con la ayuda del matemático Karl Pearson, Gosset obtuvo unos resultados a los que en principio no se

concedió mucha importancia, pero que acabarían siendo claves para la estadística moderna. Había un

pequeño problema: Guinness prohibía la publicación de las investigaciones realizadas por la compañía,

puesto que lo consideraba como un secreto industrial. Gosset decidió entonces utilizar el seudónimo

“Student” y publicarlas igualmente, con la esperanza de no ser descubierto.

El trabajo de Gosset pasó inicialmente inadvertido. Envió sus tablas al padre de la bioestadística Ronald

Fisher, diciéndole que creía que sería el único que las fuese a utilizar. Fisher comprendió el gran alcance

del trabajo de Gosset, y lo aplicó a sus propias investigaciones, completándolo y mejorándolo. La

función t de Student se hizo famosa, de hecho, gracias a Fisher.

La importancia de la función t

La t de Student está relacionada con el estudio de poblaciones muy grandes a partir de una muestra

comparativamente muy pequeña. La función surge al querer estimar la media de una determinada variable

en cierta población, que se supone normalmente distribuida, pero de la cual se desconoce la varianza, es

decir, la tendencia de las muestras a desviarse del valor promedio.

Pues bien, este es precisamente el caso de las encuestas realizadas sobre la población de un territorio. Por

ejemplo, el objetivo de una encuesta electoral es estimar el promedio de intención de voto de cada

partido, contando con muy pocas muestras aleatorias de la población total. Para evaluar la „calidad‟ de la

estimación, es necesario recurrir a la función t de Student, de la cual obtenemos un intervalo de confianza.

Su muerte a la relativamente temprana edad de 61 años fue una gran pérdida para la estadística, ya que

con su mente vigorosa, todavía, seguramente hubiera podido continuar trabajando durante muchos años

más

Page 2: LECTURA N°2 T-STUDENT

El aporte de Student a la Medición del Grado de Significación de una Tendencia:

En este orden ideas, una contribución muy importante en el desarrollo de los tests estadísticos fue el

ensayo titulado The probable error of a mean (1908), escrito por el matemático inglés William Sealy

Gosset (1876−1937), mejor conocido por su seudónimo de «Student» con el que firmó varios de sus

escritos.

En esta obra Student analiza a profundidad el problema de los errores que generalmente se pueden

cometer en la interpretación de los datos estadísticos y propone parámetros para medir objetivamente

el grado de significación de las tendencias o desviaciones encontradas en una muestra estadística

analizada, aportes que son el fundamento de la actualmente denominada «Prueba T de Student».

Student también aportó profundas reflexiones sobre los procedimientos matemáticos aplicables

para determinar el tamaño adecuado de una muestra estadística, y realizó importantes análisis sobre

la valoración matemática de las diferentes decisiones que adopta un investigador cuando diseña un

experimento antes de realizarlo, todo lo cual fue expuesto en diferentes ensayos publicados entre

1908 y 1920 en la revista Biométrica cuya línea editorial era la divulgación de temas referentes a la

genética, la experimentación biológica, la estadística demográfica y la eugenesi.

A Student se le debe:

La demostración de la convergencia de la distribución binomial a la

Distribución de Poisson.

Si X N ( ) con muestras aleatorio simple de tamaño n obtiene la distribución de la

variable aleatoria

Estableciendo su distribución. Donde X es la media muestral y S

2 la cuasi varianza muestral.

Para muestras correlacionadas obtiene la expresión de la varianza de la media muestral

Con p el coeficiente de correlación de la población.

Introduce la función de potencia de un contraste dado por la región

Critica RC mediante la función

Student era para los estadísticos un consultor en una fábrica de cervezas y para los fabricantes

de cerveza, alguien que dedicaba su tiempo libre a la estadística.