Alternativa de Herramientas Estadísticas para el ...

123
INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY CAMPUS MONTERREY DIVISIÓN DE INGENIERÍA Y ARQUITECTURA PROGRAMA DE GRADUADOS EN INGENIERÍA Alternativa de Herramientas Estadísticas para el Desarrollo de Proyectos Seis Sigma con Datos No Normales TESIS PRESENTADA COMO REQUISITO PARCIAL PARA OBTENER EL GRADO ACADÉMICO DE: MAESTRA EN CIENCIAS ESPECIALIDAD EN SISTEMAS DE CALIDAD Y PRODUCTIVIDAD POR: MARCIA ORTEGA INFANTE MONTERREY, N. L. MAYO DE 2006

Transcript of Alternativa de Herramientas Estadísticas para el ...

Page 1: Alternativa de Herramientas Estadísticas para el ...

INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY

CAMPUS MONTERREY

DIVISIÓN DE INGENIERÍA Y ARQUITECTURA PROGRAMA DE GRADUADOS EN INGENIERÍA

Alternativa de Herramientas Estadísticas para el Desarrollo de Proyectos Seis Sigma con Datos No Normales

TESIS

PRESENTADA COMO REQUISITO PARCIAL PARA OBTENER EL GRADO ACADÉMICO DE:

MAESTRA EN CIENCIAS ESPECIALIDAD EN SISTEMAS DE CALIDAD Y PRODUCTIVIDAD

POR:

MARCIA ORTEGA INFANTE

MONTERREY, N. L. MAYO DE 2006

Page 2: Alternativa de Herramientas Estadísticas para el ...

INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY CAMPUS MONTERREY

DIVISIÓN DE INGENIERÍA Y ARQUITECTURA

PROGRAMA DE GRADUADOS EN INGENIERÍA Los miembros del Comité de Tesis recomendamos que el presente Proyecto de Tesis presentado por la Ing. Marcia Ortega Infante sea aceptado como requisito parcial para obtener el grado académico de:

Maestra en Ciencias

Especialidad en Sistemas de Calidad y Productividad

Comité de Tesis:

María del Carmen Temblador Pérez, M. C. Asesora

Alberto Hernández Luna, Ph. D. Erika Guadalupe Acosta Silva, M.C. Sinodal Sinodal

Aprobado:

Federico Viramontes Brown, Ph. D. Director del Programa de Graduados en Ingeniería

Mayo 2006

Page 3: Alternativa de Herramientas Estadísticas para el ...

DEDICATORIA

A mis papás, Mayda y Guillermo, mi ejemplo, mi fuerza, mi fuente inagotable de amor.

A mi hermana, Mariana,

mi inspiración, mi alegría, mi amor.

A mis abuelos, Guadalupe y Baldemar, mi apoyo, mis amigos incondicionales.

A mis padrinos, Irma Ruth y Jorge Luis y a mis primas, Krysthel y Alejandra,

mi familia, mis compañeros inseparables.

Page 4: Alternativa de Herramientas Estadísticas para el ...

AGRADECIMIENTOS

A mi familia, especialmente a mis padres, por quienes soy lo que soy, a quienes debo todo. Por su amor y fe en mí. A mi asesora, Maricarmen Temblador, por su apoyo incondicional en la realización de esta tesis, por ser un ejemplo a seguir en lo profesional y en lo personal, pero sobre todo, por su amistad. A mis sinodales, Alberto Hernández y Erika Acosta, por sus consejos y sus comentarios oportunos y relevantes para esta tesis. A los profesores y directivos del Departamento de Ingeniería Industrial y de Sistemas y del Centro de Calidad y Manufactura del Tecnológico de Monterrey, Campus Monterrey, por su apoyo a lo largo de mis estudios de posgrado. A mis amigos, que también son familia, por estar conmigo en las buenas y en las malas.

Page 5: Alternativa de Herramientas Estadísticas para el ...

RESUMEN

La metodología Seis Sigma es uno de lo programas de calidad más implementados alrededor del mundo por organizaciones reconocidas internacionalmente. A lo largo de las cinco fases que integran su modelo genérico DMAIC (Definir, Medir, Analizar, Mejorar y Controlar), se utiliza una gran variedad de herramientas estadísticas. Al hablar de las etapas MAIC, encontramos que los procedimientos estadísticos tradicionales implementados en éstas tienen como requisito básico la normalidad de los datos. Cuando los datos de los procesos bajo estudio no son normales, existen técnicas que permiten su ajuste o normalización. Sin embargo, hay ocasiones en las que ninguna de estas técnicas cumple su objetivo y los datos permanecen no normales. Cuando se presenta una situación como ésta, es necesario el uso de procedimientos estadísticos no paramétricos, insensibles al supuesto de normalidad, dándole validez a los resultados obtenidos y otorgando al investigador evidencia suficiente para la toma de decisiones. En el Capítulo 1 de este documento se plantea la definición del problema, las hipótesis de la investigación, así como la justificación de la misma. En el Capítulo 2 se presentan los antecedentes tanto de Seis Sigma, como de la Estadística No Paramétrica. A lo largo del Capítulo 3 se presentan algunas de las herramientas estadísticas no paramétricas equivalentes a los procedimientos paramétricos comúnmente utilizados en las fases MAIC. En el Capítulo 4 se muestra la aplicación de algunas de las herramientas no paramétricas expuestas en el capítulo anterior, en la problemática de una empresa de la localidad. Se desarrollan las mismas pruebas con su contraparte paramétrica, con el fin de comparar los resultados obtenidos. Finalmente, en el Capítulo 5 se concluye acerca de la investigación realizada.

ii

Page 6: Alternativa de Herramientas Estadísticas para el ...

ÍNDICE

Resumen ii Índice iii

Capítulo 1: Introducción

1.1 Planteamiento del problema 01 1.2 Objetivos 02

1.3 Hipótesis 03 1.4 Preguntas de Investigación 03 1.5 Justificación 04 1.5.1 Magnitud y trascendencia 04 1.5.2 Valor metodológico 05 1.6 Método de Investigación 06 1.6.1 Tipo de estudio 06 1.6.2 Alcance del estudio 06 1.6.3 Pasos para elaborar la investigación 07 1.6.4 Selección de la muestra 07 1.6.5 Recolección de datos 07 1.6.6 Análisis de datos 08 1.7 Alcance y Limitaciones 08

1.7.1 Características de la muestra 08 1.7.2 Área geográfica para el estudio 08 1.7.3 Limitaciones ni definidas por el investigador 08

Capítulo 2: Antecedentes

2.1 Antecedentes 09 2.2 Seis Sigma 10 2.2.1 Metodología DMAIC 12 2.2.2 Equipos de Trabajo 15

iii

Page 7: Alternativa de Herramientas Estadísticas para el ...

2.3 La Estadística 16 2.3.1 La Estadística Paramétrica y la Estadística No Paramétrica 16 2.3.2 Limitaciones de la Estadística No Paramétrica 17 2.3.3 Ventajas de la Estadística No Paramétrica 18

Capítulo 3: Procedimientos Estadísticos No Paramétricos

3.1 Conceptos Básicos 20 3.1.1 Niveles de Medición 20 3.1.2 Variables Continuas y Discretas 21 3.1.3 Estadístico contra Parámetro 21 3.1.4 Pruebas de Hipótesis 21 3.2 Procedimientos No Paramétricos 23 3.2.2 Medición 27

3.2.2.1 Capacidad del Sistema de Medición: Análisis de Dos Factores 27

3.2.2.2 Capacidad del Proceso: Curvas de Pearson 29

3.2.3 Análisis 33 3.2.3.1 Prueba de Ranks Con Signo de Wilcoxon 33 3.2.3.2 La Prueba Chi Cuadrada 34 3.2.3.3 Prueba de la χ2 para Tablas r x c 36 3.2.3.4 Prueba de Bondad de Ajuste Kolmogorov – Smirnov 37 3.2.3.5 Prueba de Bondad de Ajuste de la χ2 39 3.2.3.6 Prueba de Bondad de Ajuste Anderson – Darling 40 3.2.4 Mejora 41 3.2.4.1 Prueba U de Mann – Whitney 41 3.2.4.2 La Prueba Kruskal – Wallis 42 3.2.4.3 Análisis de un Factor para Alternativas

en Forma Curva 43 3.2.4.4 La Prueba de Levene 45 3.2.4.5 La Prueba de Siegel – Tukey 46 3.2.4.6 La Prueba de Moses 48 3.2.4.7 La Prueba de Rangos Cuadrados 50 3.2.4.8 Prueba de Rangos Cuadrados con

Signo de Wilcoxon para Muestras Pareadas 51 3.2.4.9 Prueba Q de Cochran 53 3.2.4.10 Coeficiente de Correlación de Spearman 55

3.2.5 Control 56 3.2.5.1 Gráficas de Control EWMA 56 3.3 Síntesis del Capítulo 58

iv

Page 8: Alternativa de Herramientas Estadísticas para el ...

Capítulo 4: Aplicación

4.1 Definición 61 4.1.1 Introducción a la Problemática 61 4.1.2 Definición 61 4.2 Medición con Procedimientos No Paramétricos 62 4.2.1 Proceso 62

4.2.2 Pruebas de Normalidad 64 4.2.3 Capacidad del Proceso en la Variable Brillo 67

4.3 Análisis con Procedimientos No Paramétricos 68 4.3.1 Gráficas de Dispersión 68 4.3.2 Correlación 70 4.3.3 Comparación de Medianas de la Variable Brillo 72 4.3.4 Gráfico de Control EWMA 73 4.3.5 Comparación de Kilogramos Rechazados en Puntos Dentro y Fuera de Control en la Variable Brillo 76 4.3.6 Comparación de Kilogramos Rechazados en Puntos Fuera de Control para la Variable Brillo en la Cara Superior y Cara Inferior 77 4.3.7 Comparación de Kilogramos Rechazados a Diferentes Temperaturas 78 4.3.8 Comparación de Kilogramos Rechazados a Diferentes Viscosidades 79 4.3.9 Comparación de la Interacción entre las Variables Temperatura, Viscosidad y Kilogramos Rechazados 80 4.3.10 Resultados Obtenidos 81 4.4 Medición con Procedimientos Paramétricos 82

4.4.1 Capacidad del Proceso en la Variable Brillo 82

4.5 Análisis con Procedimientos Paramétricos 83 4.5.1 Comparación de Medianas de la Variable Brillo 83 4.5.2 Gráfico de Control X – R 86 4.5.3 Comparación de Kilogramos Rechazados en Puntos Dentro y Fuera de Control en la Variable Brillo 89 4.5.4 Comparación de Kilogramos Rechazados en Puntos Fuera de Control para la Variable Brillo en la Cara Superior y Cara Inferior 92 4.5.5 Comparación de Kilogramos Rechazados a Diferentes Temperaturas 93 4.5.6 Comparación de Kilogramos Rechazados a Diferentes Viscosidades 95 4.5.7 Resultados Obtenidos 96 4.6 Conclusión sobre Resultados Obtenidos 96

v

Page 9: Alternativa de Herramientas Estadísticas para el ...

Capítulo 5: Conclusiones 5.1 De la Investigación 99 5.2 Del Contenido 99 5.3 De la Aplicabilidad de la Herramienta 100 5.4 De Futuras Investigaciones 101

Referencias 102 Lista de Figuras 104

Lista de Tablas 105

Anexos 106

vi

Page 10: Alternativa de Herramientas Estadísticas para el ...

CAPÍTULO 1

INTRODUCCIÓN En la década de los 80’s, época en la que inició el boom de la calidad, Philip Crosby popularizó el concepto de Cero Defectos como orientación para el control de calidad (Cantú, 1999). Este enfoque tiene la particular característica de establecer como meta resultados perfectos, que carezcan de errores en su totalidad. Este concepto no difiere tanto al enfoque Seis Sigma. Ésta es una metodología integrada por herramientas estadísticas que permite llevar a cabo, de forma sostenida y eficiente, el proceso de solución de problemas, transformando un problema real en uno estadístico, y finalmente, las soluciones estadísticas a soluciones reales, a través del desarrollo de proyectos. Aunque el término Seis Sigma surgió también en los años 80 como una importante aportación de Motorola, actualmente hay una continua búsqueda por adaptar este enfoque a las necesidades emergentes de las organizaciones. Debido a la naturaleza de la metodología Seis Sigma (cimentada en conceptos relativos a la normalidad de los datos), los análisis estadísticos concernientes a cada proyecto se realizan teniendo como base una distribución normal. Pero, ¿qué sucede cuando un analista encuentra que los datos arrojados por sus procesos no se ajustan a esta distribución? Es entonces cuando se presenta la necesidad de utilizar los fundamentos de la estadística no paramétrica. Debido a lo anterior, el principal objetivo de esta tesis es recopilar las herramientas estadísticas básicas que permitan desarrollar proyectos Seis Sigma cuando los datos del proceso bajo estudio no cumplen con el criterio básico de normalidad. 1.1 Planteamiento del Problema La forma más común de ver a la metodología Seis Sigma es a través de su objetivo de eliminar los defectos y la variación de los procesos por medio de las herramientas estadísticas adecuadas. La opción gráfica de la aplicación Seis Sigma generalmente se ve relacionada con la distribución de probabilidad normal, dado que una gran variedad de procesos sigue un desempeño similar al de esta distribución (Stamatis, 2002).

Capítulo 1: Introducción 1

Page 11: Alternativa de Herramientas Estadísticas para el ...

El desempeño estándar de un proceso actualmente gira alrededor de 3 sigmas, es decir, partiendo de la media del proceso, sus límites de especificación se encuentran a ± 3 desviaciones estándar. El área que se encuentra fuera de estos límites corresponde a aquellas partes defectuosas que no cumplen la especificación proporcionada por el cliente. Un proceso Seis Sigma equivaldría a tener 6 desviaciones estándar de cada lado de la media a los mismos límites de especificación, lo que se traduce en una menor variación, incrementando así la confiabilidad de los procesos. Como resultado, entonces, encontramos que generalmente se relaciona esta metodología con procesos normales. Pero, ¿qué sucede cuando, al realizar la recolección y análisis de datos para el desarrollo de un proyecto, se detecta que los datos de los procesos bajo estudio no se ajustan a esta distribución? La bibliografía acerca de la implementación del modelo DMAIC dentro de Seis Sigma para datos que se distribuyen normalmente es vasta; sin embargo, cuando se trata de lidiar con datos no normales, la información acerca de los procedimientos estadísticos disponibles y aplicables comienza a escasear. Con lo anterior, ahora se puede definir el problema en una pregunta:

“¿Cuáles son algunas de las herramientas estadísticas no paramétricas que debe contener el modelo DMAIC, cuando se manejan procesos con datos no normales, para que su implementación sea exitosa?”.

1.2 Objetivos • Objetivo General

Determinar y mostrar el uso de algunas de las herramientas estadísticas no paramétricas que equivalen a las herramientas paramétricas estándar en el modelo DMAIC, cuando los procesos bajo análisis arrojan datos no normales.

• Objetivos Específicos

o Definir en cada una de las etapas del modelo DMAIC, dentro del Seis

Sigma, las posibles herramientas a utilizar cuando los datos bajo análisis no son normales.

o Determinar en qué casos es necesaria la aplicación de métodos estadísticos no paramétricos cuando se desarrolla un proyecto Seis Sigma.

o Proponer qué pruebas estadísticas no paramétricas son las adecuadas para cada caso.

o Evaluar la factibilidad, cuando aplique, de su uso mediante la aplicación en una empresa manufacturera de la localidad.

Capítulo 1: Introducción 2

Page 12: Alternativa de Herramientas Estadísticas para el ...

1.3 Hipótesis Como resultado de la identificación y planteamiento del problema y del establecimiento de los objetivos de esta tesis, se obtuvo la siguiente hipótesis:

“Es posible identificar y describir el procedimiento de las herramientas estadísticas no paramétricas más comunes equivalentes a las existentes en el modelo DMAIC, para hacerlo utilizable en procesos con datos no normales”.

La hipótesis será validada a lo largo de la realización de esta tesis mediante la investigación y análisis de literatura especializada en el tema. Algunas de ellas se validarán a través de su aplicación en la problemática de una empresa, obteniendo de esta manera evidencia suficiente, tanto teórica como práctica, que permita finalmente aceptarla o rechazarla. 1.4 Preguntas de Investigación Ahora bien, considerando la problemática, los objetivos y la hipótesis de esta tesis, las preguntas que servirán como guía de la investigación son:

• ¿Cuáles son los orígenes de la calidad? • ¿Cuáles son los principios que rigen la metodología Seis Sigma? • ¿Cuál es su aportación a la calidad? • ¿Quiénes participan en esta metodología? • ¿Qué pasos/procedimientos se sigue en esta metodología? • ¿En qué consiste el proceso DMAIC? • ¿En qué parte de la metodología se aplica el análisis estadístico? ¿Qué

resultados se esperan en cada etapa o fase del desarrollo de un proyecto Seis Sigma?

• ¿Qué pruebas estadísticas son necesarias antes de iniciar un proyecto Seis Sigma?

• ¿Qué pruebas estadísticas son necesarias durante el desarrollo de un proyecto Seis Sigma?

• ¿Qué relación existe entre la metodología Seis Sigma y la Estadística No Paramétrica?

• ¿En qué casos es necesario el uso de la Estadística No Paramétrica? • ¿Existen pruebas básicas en la Estadística No Paramétrica? • ¿Cuáles son útiles y aplicables para un proyecto Seis Sigma? • ¿Es factible aplicarlas a un caso real?

Capítulo 1: Introducción 3

Page 13: Alternativa de Herramientas Estadísticas para el ...

1.5 Justificación

Seis Sigma es una metodología que involucra el uso de herramientas estadísticas como parte elemental en su aplicación. Es muy común el hecho de relacionarla estrechamente con procedimientos estadísticos que tienen como supuesto primordial la normalidad de los datos bajo análisis. Esto puede suceder debido a que la metodología en sí está desarrollada a partir los fundamentos de la distribución normal, ya que se engloba conceptos como media, desviaciones estándar y áreas defectuosas bajo la curva. Por otro lado, gran parte del entrenamiento para convertirse en un experto en Seis Sigma se enfoca de manera exclusiva en la estadística paramétrica, utilizando métodos válidos únicamente para datos normales. Inconvenientemente, los procesos no siempre se ajustan a una distribución normal; de hecho, es bastante común que éstos sigan distribuciones diferentes (Azzimonti, 2000). La mayoría de los procesos, especialmente aquellos que tienen que ver con la confiabilidad y ciclos de vida, no se distribuyen normalmente. En días pasados se pensaba que había algo mal con los procesos que no seguían esta distribución o incluso que estaban fuera de control. Actualmente los estadísticos y profesionales de la calidad reconocen que la distribución normal es utilizada debido a su simplicidad y a su buena definición; sin embargo gran parte de los proyectos en pro de la calidad involucran procesos con datos no normales (Padnis, 2006). Entre éstos se encuentran tiempos de ciclo, llamadas por hora, tiempo de espera del cliente, perpendicularidad, encogimiento, etc. De este modo, si el analista detecta que los datos que está manejando no son normales, se topa con la escasez de información que le permita conocer las opciones en cuanto a procedimientos estadísticos se refiere. Cuando se presenta una situación como ésta, la estadística no paramétrica brinda al investigador las herramientas adecuadas para el tratamiento de dichos datos. Es en este punto que radica la importancia de investigar, recopilar y desarrollar las herramientas estadísticas no paramétricas básicas, que sean útiles al analista en caso de encontrarse con procesos no normales durante el desarrollo de un proyecto de mejora Seis Sigma. 1.5.1 Magnitud y trascendencia Actualmente uno de los principales retos a los que se enfrentan las organizaciones es la competencia en un mundo cada vez más global e interdependiente. La calidad, más que un valor agregado, es ahora una exigencia del cliente y una ventaja competitiva para el proveedor que puede otorgarla. Si a esto se le agrega la aceleración del desarrollo y renovación de la tecnología, la urgencia de una mejora continua y de la eficiencia de los procesos es

Capítulo 1: Introducción 4

Page 14: Alternativa de Herramientas Estadísticas para el ...

evidente. Debido a esta situación, las empresas se han percatado de la enorme necesidad de realizar un cambio en su estilo de manejarse. Una de las respuestas que ha traído muy buenos resultados ha sido la metodología Seis Sigma, debido a tres características principales: • Seis Sigma está enfocado en el cliente. • Los proyectos Seis Sigma producen importantes retornos sobre la inversión. En

un artículo del “Harvard Business Review”, Sasser y Reichheld señalan que las compañías pueden ampliar sus ganancias en casi un 100% si retienen sólo un 5% más de sus clientes gracias al logro un alto grado de calidad.

• Seis Sigma cambia el modo que opera la organización, al conocer y aprender nuevos enfoques en la forma de resolver problemas y tomar decisiones.

Por otra parte, el llamado “costo de la calidad” es un concepto que también expone la magnitud y trascendencia de la aplicación de proyectos Seis Sigma (PPG Consultores, 2003). Mientras que los directivos de las empresas pueden llegar a pensar que invertir en la mejora de la calidad en los procesos representa un costo, la realidad es que el gasto mayor se da a partir de la ausencia de la calidad (fallas internas o externas). Cuando un proceso se encuentra controlado a seis desviaciones estándar, como lo propone la metodología, se presume que los costos de calidad, como porcentaje de las ventas, disminuyen considerablemente como se observa en la Tabla 1.1:

Nivel de Calidad DPMO Nivel

Sigma Costo

Calidad 30.90% 690,000 1 NA 69.20% 308,000 2 NA 93.30% 66,800 3 25-40% 99.40% 6,210 4 15-25% 99.98% 320 5 5-15%

100.00% 3.4 6 <1% Tabla 1.1: El Costo de Calidad

Extraída de PPG Consultores, 2003

Con los argumentos anteriores, es posible percatarse de la importancia de la correcta implementación de Seis Sigma en las organizaciones. Pues bien, si el desarrollo de estos proyectos de mejora es hoy en día trascendental para las empresas que manejan Seis Sigma, por consecuencia, lo es también la aplicación de los procedimientos no paramétricos adecuados a lo largo de la metodología MAIC, cuando se tienen datos no normales. 1.5.2 Valor metodológico La riqueza metodológica y teórica de esta tesis reside en que la recopilación de las herramientas estadísticas adecuadas para el desarrollo de proyectos Seis Sigma con datos no normales será un instrumento prácticamente nuevo. Su

Capítulo 1: Introducción 5

Page 15: Alternativa de Herramientas Estadísticas para el ...

aportación se presenta en forma de una guía, considerada de gran utilidad para los analistas que se enfrentan a esta situación en el desarrollo de los proyectos de mejora. La información obtenida con esta investigación brinda orientación en un tema sobre el cual no existe literatura extensa ni condensada en un solo documento. Por tanto, cabe la posibilidad de que esta tesis dé pie al surgimiento de nuevas investigaciones y sirva como base para otras similares. 1.6 Método de Investigación 1.6.1 Tipo de estudio El enfoque de esta investigación es mixto, es decir, una combinación de cualitativo y cuantitativo. Al inicio y durante la mayor parte de la realización de esta tesis, la naturaleza del estudio fue cualitativo debido a que se utilizó la recolección de datos en forma de investigación bibliográfica, sin involucrar la medición numérica (Hernández, 2002), para contestar las preguntas de investigación enfocadas a la aplicación del Seis Sigma y al uso de la estadística no paramétrica en conjunto, desde un punto de vista teórico. Por otra parte, se utilizó el enfoque cuantitativo al aplicar el procedimiento resultante de la investigación teórica, con datos reales en una empresa, para probar la hipótesis de que el modelo MAIC en Seis Sigma sí puede ser adaptado para procesos no normales, con base a la medición numérica y el análisis estadístico (Salkind, 1998). 1.6.2 Alcance del estudio Esta investigación comenzó como un estudio exploratorio, debido a que el problema de investigación examinado ha sido poco estudiado (Hernández, 2002). Si bien es cierto que existe una cantidad importante de literatura respecto a Seis Sigma y la estadística no paramétrica por separado, cuando se trata de la conjunción de ambos elementos, la información se reduce considerablemente. Por otra parte, esta investigación también tuvo una naturaleza descriptiva, ya que se busca identificar las propiedades y características esenciales que deben tener los procedimientos estadísticos no paramétricos para que su aplicabilidad pueda ser validada en una empresa. Esta investigación incluye la recopilación y desarrollo de las herramientas básicas que pueden ser de gran ayuda a los miembros de un equipo Seis Sigma cuando los procesos que están analizando presentan datos no normales.

Capítulo 1: Introducción 6

Page 16: Alternativa de Herramientas Estadísticas para el ...

1.6.3 Pasos para elaborar la investigación A grandes rasgos, los pasos para la elaboración de esta tesis fueron los siguientes: • Se realizó una revisión bibliográfica de fuentes primarias y secundarias, para

recolectar información que pudiera contestar las preguntas de investigación y dar un soporte teórico a las herramientas estadísticas más adecuadas para cada situación, que a fin de cuentas, es el entregable de esta tesis.

• Se hizo un análisis de la información recolectada, para hacer uso de la literatura realmente útil y relevante para los objetivos de investigación y, por consecuencia, desechar lo inservible.

• Con todo lo anterior, se determinaron los elementos teóricos y prácticos que debe contener la descripción de las herramientas estadísticas para la aplicación de Seis Sigma a proyectos que involucren procesos con datos no normales.

• Se revisó, integró y estructuró la información. • Se elaboró el reporte de herramientas no paramétricas adecuadas para cada

situación. • Se buscó, evaluó y seleccionó un proyecto de mejora adecuado para validar

la aplicabilidad del procedimiento ya elaborado. • Se aplicaron los procedimientos investigados al proyecto. • Se interpretaron los resultados obtenidos. • Se elaboraron las conclusiones.

1.6.4 Selección de la muestra Se utilizaron datos de un proceso que cumpliera con el requisito de la existencia de procesos con datos no normales y se evaluó la factibilidad de aplicación de las herramientas investigadas. Por otra parte, la muestra de los datos que se analizaron estadísticamente se tomó de manera directa de los procesos de manufactura de una organización de la localidad. La cantidad de datos a ser analizados corresponde a 302, obtenidos de 35 muestras con un promedio de 9 lecturas en cada muestra, correspondientes a 5 días de trabajo. 1.6.5 Recolección de datos La recolección de información teórica se realizó a través de la investigación bibliográfica en fuentes primarias y secundarias. En la parte práctica, aplicable a los procesos de una organización, la recolección de datos para su análisis estadístico se hizo a través un muestro del proceso bajo estudio, en la compañía seleccionada.

Capítulo 1: Introducción 7

Page 17: Alternativa de Herramientas Estadísticas para el ...

1.6.6 Análisis de datos El análisis de la muestra se llevó a cabo a través de la aplicación de las herramientas estadísticas no paramétricas adecuadas para cada caso, de acuerdo a la información obtenida de la investigación literaria, que se presenta posteriormente en el marco teórico de esta tesis. Asimismo, se aplicaron las herramientas paramétricas estándar para comparar los resultados obtenidos, así como la validez de su implementación. 1.7 Alcance y Limitaciones 1.7.1 Características de la muestra Se buscó específicamente que la muestra seleccionada para el estudio en el proyecto de mejora cumpliera con la característica de no normalidad, ya que ésta es un requisito básico para la aplicabilidad de los procedimientos y herramientas estadísticas propuestos. 1.7.2 Área geográfica para el estudio El estudio fue realizado con datos recolectados a partir de los procesos de manufactura de una empresa de Monterrey, Nuevo León, México. 1.7.3 Limitaciones no definidas por el investigador Por cuestiones de tiempo, la validación de la aplicabilidad de los procedimientos estadísticos puede llegar a ser sólo analítica, ya que la implementación real podría tomarse incluso como material para otras tesis, o bien, para la continuación de ésta. Además, debido a la confidencialidad acordada con la organización involucrada, se omiten algunos de los datos relacionados a sus procesos.

Capítulo 1: Introducción 8

Page 18: Alternativa de Herramientas Estadísticas para el ...

CAPÍTULO 2

ANTECEDENTES Desde su nacimiento, el programa de calidad Seis Sigma ha tenido como cimiento el uso de diferentes métodos estadísticos para el análisis de información y la optimización de procesos. Debido a que su concepción se basa principalmente en parámetros referentes a la curva normal, Seis Sigma se ha visto estrechamente vinculado a la Estadística Paramétrica. A causa de esto, la mayoría de las personas involucradas con proyectos de esta naturaleza esperan que los datos arrojados por la medición de sus procesos se ajusten a la distribución normal, siendo que esto no sucede en todos los casos. Cuando una situación como ésta se presenta es necesario el uso de la Estadística No Paramétrica. Algunas de las herramientas estadísticas no paramétricas útiles para este caso se muestran a lo largo del Capítulo 3. 2.1 Antecedentes La metodología Seis Sigma se inicia en los años 80's como una estrategia de negocios y de mejora de calidad, introducida por Motorola, adoptándose y difundiéndose posteriormente por otras organizaciones de clase mundial como G.E., Sony, Polaroid, FeDex, Dupont, Toshiba, Ford y Black & Decker, entre otros. Su origen en Motorola se da cuando Mikel Harry comienza a influenciar a la organización para que se estudie la variación en los procesos, es decir, la desviación estándar. Esta iniciativa se convirtió en el centro del esfuerzo para mejorar la calidad en la empresa, capturando la atención de Bob Galvin, ejecutivo de Motorola. Con el apoyo de Galvin, se hizo énfasis, no sólo en el análisis de la variación, sino también en la mejora continua, estableciendo como meta obtener 3.4 defectos por millón en los procesos. Anteriormente, Motorola había utilizado herramientas de los grandes gurúes de la calidad, como Juran, e implantado aplicaciones del Control Estadístico del Proceso (SPC). Esto propició el desarrollo de una nueva metodología tomando lo mejor de aquellos conceptos, pero ahora con un enfoque completo hacia la satisfacción del cliente. Esta metodología fue llamada después Seis Sigma. El impulso hacia esta metodología se incrementó cuando Motorola ganó el Malcolm Baldridge Nacional Quality Award en 1988. En 1991, Lawrence Bossidy, CEO de Allied Signal, implantó esta metodología, logrando transformarla de una empresa con problemas en una realmente exitosa. Durante la implantación de Seis Sigma en los años 90, Allied Signal multiplicó sus ganancias de manera considerable. Durante el verano de 1995, Jack Welch de

Capítulo 2: Antecedentes 9

Page 19: Alternativa de Herramientas Estadísticas para el ...

GE se entera del éxito de esta nueva estrategia, dando lugar al mayor cambio iniciado en esta organización. La forma en que Seis Sigma se convirtió de un programa de calidad en manufactura, a un sistema para reducir fallas en el diseño y comercialización de productos se logró por dos razones significativas: la formación de equipos de trabajo como los Master Black Belts, Black Belts y Green Belts; además de la inclusión de la metodología de selección y desarrollo de proyectos como el DMAIC (Snee, 2001).

En el modelo DMAIC (Definir, Medir, Analizar, Mejorar y Controlar), todas las etapas utilizan herramientas estadísticas, pero son las de medición, análisis, mejora y control las que involucran el uso de métodos estadísticos con requerimientos de normalidad. Cuando dicho requerimiento no se cumple, hace su entrada la Estadística No Paramétrica. Generalmente en los proyectos Seis Sigma, se analizan modelos estadísticos que implican distribuciones tanto continuas como discretas, con ciertos supuestos básicos para la aplicación de estas técnicas (el supuesto de normalidad, por ejemplo). El principal uso de estos modelos es la estimación de parámetros desconocidos de la población que se está estudiando, para poder hacer pruebas de validación y de hipótesis planteadas. A esta metodología de trabajo se le denomina Estadística Paramétrica. Mientras los supuestos usados en la paramétrica especifican la distribución original, hay otros casos en la práctica donde no se puede hacer esto. Se requiere entonces de otra metodología de trabajo, la Estadística No Paramétrica (Azzimonti, 2000). En las secciones posteriores de esta tesis, se hace una mención más extensa de los conceptos mencionados anteriormente. 2.2 Seis Sigma Desde principios de la década de 1980 a 1990, surgió la conciencia de la necesidad de productos de buena calidad: las normas que las que las empresas seguían ya no eran aceptables. Fue así como la satisfacción del cliente, la confiabilidad, la productividad, los costos y la rentabilidad comenzaron a ser directamente dependientes a la calidad de los productos y servicios. A la par de esta tendencia, surgió también un movimiento que incluía teorías, metodologías y herramientas para lograr lo demandado por los clientes, basados en conceptos previos y nuevos referentes al control de la calidad. Entre ellos se encontraba la metodología Seis Sigma. Pero ¿qué diferencia a Seis Sigma de todas las demás metodologías y herramientas? Desarrollada en 1987 por Motorola como una iniciativa de negocios, Seis Sigma tiene el principal objetivo de reducir el número de defectos en un proceso para lograr la satisfacción del cliente, basándose en el hecho de que la variación es el principal enemigo de la productividad en cualquier organización.

Capítulo 2: Antecedentes 10

Page 20: Alternativa de Herramientas Estadísticas para el ...

El término Seis Sigma tiene su origen en la estadística a partir de un proceso capaz de abarcar seis sigmas en la curva normal. Sigma (σ) es la letra griega que se utiliza para representar la desviación estándar, una medida de dispersión en una distribución. Por tanto, un proceso que comprenda seis sigmas, es decir, seis desviaciones estándar, puede tener 3.4 defectos por millón de oportunidades. Esto equivale a un nivel de calidad de 99.99966%, que se aproxima de forma considerable al ideal de cero defectos. En esencia, entonces, la sigma refleja la capacidad de un proceso y tiene la propiedad de relacionarse de manera directa con características como defectos por unidad, partes por millón y la probabilidad de falla o error. Por lo anterior, el seis sigma en sí se ha convertido en la meta para muchas organizaciones, ya que provee un métrico uniforme para medir el desempeño. La comparación clásica de la diferencia del nivel 6σ se muestra en la Tabla 2.1:

Capacidad del Proceso

Defectos por Millón de

Oportunidades (DPMO)

6 3.4 5 233 4 6,210 3 66,807 2 308,537

Tabla 2.1: Niveles Sigma con un desplazamiento de ± 1.5σ Extraída de Stamatis, D.H., 2002

Otra forma de apreciar y entender el efecto de moverse del estándar histórico de 3σ, al estándar actual de la mayoría de las organizaciones de 4σ y, finalmente, al nuevo estándar de 6σ, se presenta en la Tabla 2.2:

Sigma Tiempo Dinero

3σ 3.5 meses por cada 100 años. Por cada $1000 millones de activos, hay una deuda de $2.7 millones.

4σ 2.5 días por cada 100 años. Por cada $1000 millones de activos, hay una deuda de $63,000.

5σ 30 minutos por cada 100 años.

Por cada $1000 millones de activos, hay una deuda de $570.

6σ 6 segundos por cada 100 años.

Por cada $1000 millones de activos, hay una deuda de $2.

Tabla 2.2: Comparación de Estándares Adaptada de Stamatis, D.H. (2002)

Capítulo 2: Antecedentes 11

Page 21: Alternativa de Herramientas Estadísticas para el ...

Sin embargo, y por conveniente que esto es, Seis Sigma no se enfoca solamente en lo que se refiere a los métricos de desempeño de la organización, sino que exige además un cambio de paradigma total en sus funciones, involucrando el compromiso de la dirección y la responsabilidad y aceptación de la propiedad del proceso de quienes forman parte de los mismos. Por tanto, Seis Sigma tiene una metodología específica para identificar, medir, analizar, mejorar y controlar los procesos, a partir del trabajo en equipo. La utilidad de la metodología Seis Sigma radica en que puede ser aplicada no solamente a procesos de manufactura, que es el ambiente del que proviene, sino también a procesos transaccionales y de servicios. 2.2.1 Metodología DMAIC La metodología DMAIC* es el modelo genérico de Seis Sigma∗. Es un acrónimo cuyas siglas en inglés significan Definir, Medir, Análisis, Mejorar y Controlar, representando cada una de las fases que se siguen en un proyecto de mejora.

Figura 2.1: Modelo General DMAIC

• Definir Se identifican los posibles proyectos Seis Sigma evaluados por la alta dirección. En esta fase se especifica la misión del proyecto, se selecciona el equipo de trabajo, se asignan roles, se determinan objetivos, metas y roles, así como el alcance del mismo.

Herramientas: o QFD: Traducir los requerimientos del cliente (VOC) a CTQ’s (Critical to

Quality). o Diagrama de Pareto: Identificar la principal problemática a atacar. o AMEF: Identificar parámetros que no desea el cliente o fallas

potenciales. o Benchmarking: Comparar lo que hacen otras empresas contra la

propia. o Mapa del proceso: Identificar procesos principales. o SIPOC: Identificar proveedores, entradas, procesos, salidas y clientes. o VOP: Identificar los requerimientos principales del proceso. o Planeación Operativa: Identificar áreas de oportunidad que se

transformen en proyectos Seis Sigma.

∗ Términos acuñados por Motorola.

Capítulo 2: Antecedentes 12

Page 22: Alternativa de Herramientas Estadísticas para el ...

Resultados: o Equipo integrado. o Requerimientos del cliente y del proceso. o Oportunidades de triunfo. o Planteamiento del problema. o Proyecto clarificado.

• Medir Se basa en la caracterización del proceso. En ésta se identifican los requisitos clave de los clientes, las características clave del producto (o variables de salida) y los parámetros (variables de entrada) que afectan al funcionamiento del proceso. A partir de esta caracterización se define el sistema de medición y se mide la capacidad del proceso. Herramientas: o Gráficos de Control: Verificar si el proceso se encuentra bajo control. o Cp y Cpk: Conocer la capacidad del proceso. o MSA= Atributos y Gage R&R: Conocer la capacidad del sistema de

medición. o DPMO: Medición de los defectos por millón de oportunidades. o Diagrama Causa – Efecto (Ishikawa) y Matriz Causa – Efecto: Encontrar

las causas raíz de un problema determinado. o Baseline: Determinar el estado actual del proceso y su nivel sigma. o Series de tiempo: Comprender el comportamiento de datos de los

procesos a través del tiempo en intervalos uniformes. Resultados: o Indicadores del proceso, de entradas y de salidas. o Identificación de las posibles variables que afectan al métrico primario. o Representación del proceso para obtener un punto de partida válido.

• Analizar El equipo analiza los datos obtenidos en la fase anterior. Se desarrollan y comprueban hipótesis sobre posibles relaciones causa-efecto utilizando diversas herramientas estadísticas. De esta forma el equipo identifica las variables clave de entrada que afectan a las variables de respuesta del proceso.

Herramientas: o Pruebas de Hipótesis: Verificar la relación entre los efectos. o Análisis de Regresión: Identificar las relaciones entre las variables de

entrada y las de salida. o ANOVA: Verificar la igualdad de medias de los procesos. o Diagrama de Ishikawa: Identificar las causas raíz. o AMEF: Plantear planes de acción para controlar las variables críticas

identificadas en la etapa anterior.

Capítulo 2: Antecedentes 13

Page 23: Alternativa de Herramientas Estadísticas para el ...

Resultados: o Análisis de datos. o Causas raíz validadas. o Fuentes de variación. o Identificación de variables a mejorar. o Identificación de variables a discriminar. o Comprobación de la relación causal entre las variables críticas y el

métrico primario.

• Mejorar El equipo de trabajo trata de determinar la relación causa-efecto para predecir, mejorar y optimizar el funcionamiento del proceso. Por último se determina el rango operacional de los parámetros o variables de entrada del proceso.

Herramientas: o Diseño de Experimentos y Superficies de Respuesta: Optimizar las

salidas a través del uso de los niveles adecuados de las entradas. o EVOP: Alcanzar el óptimo mediante cambios paulatinos. o Regresión: Desaclopar variables para simplificar su control. o Simulación: Encontrar el óptimo mediante la representación de

condiciones reales del proceso. o Series de tiempo: Comprender el comportamiento de los datos para

predecir eventos futuros. Resultados: o Soluciones. o Documentación de cambios necesarios. o Niveles óptimos de operación. o Comprobación de los cambios propuestos.

• Controlar Se diseñan y documentan los controles necesarios para asegurar que lo conseguido mediante el proyecto se mantenga una vez que se hayan implantado los cambios.

Herramientas: o Planes de Control: Determinar planes de contingencia. o Gráficos de Control y Control Estadístico del Proceso: Monitorear la

estabilidad del proceso y comprobar las mejoras. o Planes de Mantenimiento Preventivo y Predictivo: Evitar adoptar la

filosofía de “apagar incendios”. o Poka Yoke: Procesos a “prueba de errores”. o Auditorías: Asegurarse de que las soluciones se han puesto en marcha

y se han mantenido. o Planes de transición: Organizar los esfuerzos para mantener la mejora.

Capítulo 2: Antecedentes 14

Page 24: Alternativa de Herramientas Estadísticas para el ...

Resultados: o Planes de control. o Planes de transición. o Evidencia de la mejora. o Reportes de auditorías. o Normas y procedimientos.

2.2.2 Equipos de Trabajo En la actualidad, y de forma creciente, las organizaciones están implementando equipos de trabajo para alcanzar los beneficios del esfuerzo colectivas. La metodología Seis Sigma no es ajena a esta tendencia, sino, por el contrario, es promotora del trabajo en equipo, y éste forma parte esencial de sus procedimientos. Como una forma de identificar a determinados miembros dentro de la organización que cumplen funciones específicas en la metodología de Seis Sigma, e inspirados en las artes marciales como filosofía de mejora, se asignan diferentes niveles de cinturones para aquéllos que lideran y están involucrados de alguna forma en los proyectos. De esta manera, los Black Belt son personas que se dedican a tiempo completo a detectar oportunidades de cambio y a conseguir que logren resultados. El Black Belt es responsable de liderar, entrenar y cuidar de los miembros de su equipo. Debe poseer conocimientos tanto en materia de calidad, como en temas relativos a estadística, resolución de problemas y toma de decisiones. El Green Belt está formado en la metodología Seis Sigma como apoyo a las tareas del Black Belt. Sus funciones fundamentales consisten en aplicar los nuevos conceptos y herramientas de Seis Sigma a las actividades del día a día de la organización. El Master Black Belt desempeña un rol de entrenador, mentor y consultor para los Black Belts que trabajan en los diversos proyectos. Debe poseer amplia experiencia en el campo de Seis Sigma y en las operaciones de producción, administrativas y de servicios de la organización. El Champion es un ejecutivo o directivo que inicia y patrocina a un Black Belt o a un equipo de proyecto, siendo sus responsabilidades garantizar que éstos estén alineados con los objetivos generales de la empresa y proveer dirección cuando eso no ocurra, mantener informados a los otros directivos sobre el progreso del proyecto, proveer o persuadir a terceros para aportar al equipo los recursos necesarios y efectuar enlaces con otros proyectos Seis Sigma.

Capítulo 2: Antecedentes 15

Page 25: Alternativa de Herramientas Estadísticas para el ...

2.3 La Estadística Actualmente, las organizaciones, en su lucha constante por el liderazgo, tienen la tarea de esforzarse por mejorar constantemente la calidad de sus productos y servicios, con el objetivo de competir exitosamente en el mercado local y mundial. Los ingenieros juegan un papel fundamental en este afán por el mejoramiento de la calidad, ya que son ellos quienes tienen como responsabilidad diseñar y desarrollar nuevos productos y procesos de fabricación, así como el perfeccionamiento de los ya existentes. Los recursos estadísticos son una herramienta básica en estas actividades debido a que proporcionan métodos descriptivos y analíticos para conocer y manejar la variabilidad de los datos observados dentro de los procesos de interés. La Estadística trata de la recolección, presentación, análisis y uso de datos para la toma de decisiones, solución de problemas y diseño de productos y procesos (Montgomery, 2002). 2.3.1 La Estadísica Paramétrica y la Estadística No Paramétrica La estadística es un campo dentro de las matemáticas, que involucra la agrupación, clasificación y análisis de datos. La estadística puede ser dividida en dos áreas generales, la estadística descriptiva y la estadística inferencial. La estadística descriptiva emplea métodos y procedimientos para presentar y organizar datos, mientras que en la estadística inferencial los datos son utilizados para hacer predicciones y derivar conclusiones acerca de una población mediante la selección de una muestra. Ambas ramas de la estadística poseen procedimientos paramétricos y no paramétricos. El propósito de la estadística es proporcionar las herramientas necesarias para darle objetividad a las conclusiones de los analistas; de esta manera, es posible separar la ciencia de la opinión (Conover, 1980). Las leyes de la probabilidad son aplicadas a ciertos modelos de experimentación con el objetivo de determinar cuáles son las oportunidades de ocurrencia de todos los resultados posibles. A pesar de que en ocasiones es difícil describir un modelo teórico apropiado para cada experimento, la mayor dificultad se da cuando, después de que el modelo ha sido definido, se desean determinar las probabilidades asociadas a dicho modelo. Por tanto, existen modelos para los cuales nunca se han encontrado soluciones probabilísticas. Ante esta circunstancia los estadísticos han modificado ligeramente los modelos, con el objetivo de encontrar las probabilidades deseadas, procurando que el cambio sea lo suficientemente pequeño para obtener resultados válidos. De esta forma, se encuentran soluciones exactas a problemas aproximados. A esta parte de la Estadística, se le llama Estadística Paramétrica, e incluye pruebas tan conocidas como la prueba T o la prueba F.

Capítulo 2: Antecedentes 16

Page 26: Alternativa de Herramientas Estadísticas para el ...

En la década de 1930 a 1940, surgió un enfoque diferente para lidiar con este tipo de problemas. Éste involucraba métodos simples para encontrar las probabilidades deseadas, o al menos una buena aproximación de estas probabilidades, haciendo pocas o ninguna modificación al modelo original. Con esto era posible encontrar soluciones aproximadas a problemas exactos, lo contrario a la estadística paramétrica. A esta rama de la estadística se le conoce desde entonces como Estadística No Paramétrica. La mayoría de los procedimientos relativos a pruebas de hipótesis y construcción de intervalos de confianza utilizados en diversos ámbitos, especialmente en ingeniería, parten del supuesto de que las muestras aleatorias con las que se trabajan provienen de poblaciones normales. Estos procedimientos son conocidos como métodos paramétricos, ya que se basan en una distribución paramétrica particular, en este caso, la normal. De igual manera, existen los llamados métodos no paramétricos, también conocidos como métodos de distribución libre. Generalmente, el único supuesto en el que éstos se basan es el de continuidad, es decir, que la distribución de la población de la proceden es continua. Una de las ventajas de estos procedimientos es que no es necesario que los datos sean cuantitativos, sino que pueden ser datos categóricos o datos en forma de rank, además su aplicación es rápida y sencilla. Si es posible aplicar ambos métodos (paramétricos y no paramétricos) en un problema específico, se optaría por utilizar un método paramétrico eficiente (Montgomery, 2002). Sin embargo, los supuestos necesarios para que este tipo de procedimientos sean válidos en ocasiones pueden ser difíciles o imposibles de satisfacer, situación que es muy frecuente en la práctica. Por ejemplo, en caso de que los datos estén en forma de ranks, es improbable que éstos cumplan el supuesto de normalidad. Muchos métodos no paramétricos incluyen el análisis de ranks y, por tanto, se ajustan a este tipo de problemas. Una diferencia importante entre ambos tipos de estadística, que no puede dejarse de mencionar, es que la paramétrica se enfoca en el valor de los datos como tal, mientras que la no paramétrica considera el orden de éstos (por ello se otorga el nombre de estadísticos de orden). De esta forma, mientras la primera utiliza como medidas la media y la varianza, la segunda hace uso de la mediana y ranking de los datos. 2.3.2 Limitaciones de la Estadística No Paramétrica La mayoría de las fuentes hacen distinción entre las pruebas paramétricas y las no paramétricas basándose en el hecho de que las primeras hacen suposiciones específicas con respecto a uno o más parámetros que caracterizan a la

Capítulo 2: Antecedentes 17

Page 27: Alternativa de Herramientas Estadísticas para el ...

distribución poblacional para cual se está empleando dicha prueba (Sheskin, 2004). De la misma manera, se hace énfasis en la descripción de las pruebas no paramétricas como pruebas de “distribuciones libres”, debido a que no se hace ninguna suposición acerca de los parámetros de la población. Sin embargo, es importante señalar que en realidad las pruebas no paramétricas también hacen ciertas suposiciones. Como una regla general, las pruebas de inferencia estadística que evalúan datos categóricos o nominales y ordinales o ordenados, se categorizan como no paramétricas, mientras que aquellas que evalúan datos en forma de intervalo o proporción se conocen como paramétricas. Los autores concuerdan en que mientras no haya ninguna razón para creer que una o más de las suposiciones de las pruebas paramétricas no han sido cumplidas y cuando el nivel de medición de un grupo de datos está en forma de intervalo o proporción, éste debe ser evaluado con la prueba paramétrica apropiada. Sin embargo, si una o más de las suposiciones son violadas, algunas fuentes (no todas) mencionan que es prudente transformar los datos a un formato compatible para el análisis con la prueba no paramétrica adecuada (Sheskin, 2004). Sin embargo, existe cierta negativa por parte de algunos autores en hacer esta transformación, ya que los datos en forma de intervalo o proporción contienen más información que los otros formatos. Debido a lo anterior, se cree más prudente emplear la prueba paramétrica apropiada aun cuando existe la duda del cumplimiento de los supuestos. Estos autores argumentan que las pruebas paramétricas son robustas, es decir, pueden proveer información razonablemente confiable acerca de la población, a pesar de lo anteriormente mencionado. Generalmente cuando una prueba paramétrica es empleada bajo estas condiciones se hacen ciertos ajustes en lo que se refiere a la evaluación del estadístico de prueba para mejorar su confiabilidad. 2.3.3 Ventajas de la Estadística No Paramétrica A pesar de tener ciertas limitaciones, es importante resaltar las ventajas que tienen los métodos no paramétricos sobre los paramétricos. Hollander y Wolfe (1999) las sintetizan en una lista:

Los procedimientos no paramétricos requieren pocas suposiciones acerca de las poblaciones de las cuales proceden los datos bajo análisis. De manera particular, es posible dejar a un lado la suposición de normalidad de los datos.

Estos métodos son capaces de proveer con exactitud p-valores e intervalos de confianza para diferentes pruebas de hipótesis, así como tasas de error para comparaciones múltiples, entre otras.

Capítulo 2: Antecedentes 18

Page 28: Alternativa de Herramientas Estadísticas para el ...

Las pruebas no paramétricas son a menudo más fáciles de aplicar y entender que sus contrapartes paramétricas.

Aunque a primera vista pareciera que estos procedimientos sacrifican mucha información contenida en las muestras, investigaciones teóricas han demostrado que éste no es el caso, sino por el contrario, cuando los datos no son normales, su eficiencia puede ser igual o mayor que las pruebas paramétricas.

Las técnicas no paramétricas son relativamente insensibles a observaciones alejadas del centro de los datos. Esto es, que al usar parámetros como el rango (R), cualquier variación en los datos afecta el resultado, mientras que en la estadística no paramétrica, se utiliza la posición del dato (ranking), insensibilizando así el resultado ante observaciones alejadas del centro de los datos (mediana).

Éstas son aplicables en muchas situaciones donde los procedimientos de la teoría normal no pueden ser utilizados.

Son la alternativa ideal a utilizar cuando los datos no pueden ser transformados a normales.

Capítulo 2: Antecedentes 19

Page 29: Alternativa de Herramientas Estadísticas para el ...

Capítulo 2: Antecedentes 20

Page 30: Alternativa de Herramientas Estadísticas para el ...

CAPÍTULO 3

PROCEDIMIENTOS ESTADÍSTICOS NO PARAMÉTRICOS

3.1 Conceptos Básicos 3.1.1 Niveles de Medición La información cuantificada con propósitos de análisis es clasificada respecto al nivel de medición que presentan los datos. Existen diferentes niveles de medición, los cuales contienen diferentes cantidades de información de lo que sea que se está midiendo (Sheskin, 2004). Stevens (1946) desarrolló un sistema de clasificación de niveles de medición, el más usado en las disciplinas científicas. Las categorías existentes se presentan a continuación:

a) Nominal/Categórico: En este tipo de nivel de medición, los números se utilizan para identificar categorías mutuamente excluyentes, pero no pueden ser manipulados de forma matemática. Por ejemplo, la matrícula de un vehículo, cuyo único propósito es la identificación y por ende no puede ser utilizada en una operación aritmética.

b) Ordinal: En este caso, los números representan un orden específico, pero no proporcionan ninguna información acerca de las diferencias entre órdenes adyacentes. Por ejemplo, el orden de llegada en una carrera, que no indica la distancia de diferencia entre primero, segundo y tercer lugar.

c) Intervalo: Una escala en intervalo considera el orden relativo de las mediciones pero también considera el hecho de que una diferencia en escala entre dos medidas, corresponde a la misma diferencia en la cantidad del atributo medido. Por ejemplo, si se hablara del IQ (Coeficiente Intelectual), la diferencia entre una persona que tiene un IQ de 100 y otra de 101 debería ser igual a una que tiene un IQ de 130 y otra de 131.

Capítulo 3: Procedimientos Estadísticos No Paramétricos 21

Page 31: Alternativa de Herramientas Estadísticas para el ...

d) Proporción: El concepto de nivel de medición tipo proporción es igual al del intervalo, pero además se caracteriza por tener un punto cero. Debido a lo anterior, es posible hacer aseveraciones significativas acerca del atributo o variable medido. Por ejemplo, la mayoría de las medidas físicas (estatura, peso) tienen este tipo de nivel: tienen un punto cero y se pueden hacer afirmaciones sobre el peso de alguien en forma de proporción (una persona pesa el doble que otra).

3.1.2 Variables Continuas y Discretas Cuando se hacen mediciones acerca de personas u objetos, se asume que existirá cierta variabilidad, es decir, que lo que estamos cuantificando o midiendo no tendrá siempre el mismo valor para todos los sujetos estudiados. Es por esto que cuando algo es medido, comúnmente es llamado variable. Las variables se clasifican en continuas y discretas. Una variable continua es aquella que puede asumir cualquier valor dentro de un rango que define los límites de dicha variable, por ejemplo, la temperatura ambiental. Por otro lado, una variable discreta es que aquella que sólo puede tomar un número limitado de valores, por ejemplo, el valor de una de las caras de un dado, que sólo puede asumir valores enteros entre 1 y el 6. 3.1.3 Estadístico contra Parámetro Un estadístico se refiere a la característica de una muestra, mientras que un parámetro se refiere a la característica de una población. Un estadístico puede ser utilizado tanto para propósitos descriptivos como inferenciales. En la estadística inferencial un estadístico se emplea para hacer suposiciones acerca de su parámetro correspondiente dentro de una población, de la cual se ha extraído una muestra aleatoria. 3.1.4 Pruebas de Hipótesis La inferencia estadística tiene muchas formas. La forma que ha tenido mayor aplicación, difusión y atención por parte de los usuarios de los métodos no paramétricos es la llamada prueba de hipótesis (Conover, 1980). La prueba de hipótesis es el proceso de inferir, a partir de una muestra, si un enunciado acerca de una población debe ser aceptado o rechazado. Dicho enunciado es lo que se llama hipótesis. En cada caso la hipótesis es probada a partir de evidencia contenida en la muestra. Ésta es rechazada si la evidencia existente nos revela con cierto grado de confianza que la hipótesis es falsa. Si, por el contrario, la evidencia muestra que la hipótesis es verdadera, ésta se acepta. El procedimiento general para realizar una prueba de hipótesis es el siguiente:

Capítulo 3: Procedimientos Estadísticos No Paramétricos 22

Page 32: Alternativa de Herramientas Estadísticas para el ...

a) Las hipótesis son establecidas en términos de la población. b) Se selecciona un estadístico de prueba. c) Se establece una regla en cuanto a los valores posibles del estadístico de

prueba, para decidir se si se acepta o rechaza la hipótesis. d) Se evalúa dicho estadístico contra la evidencia que arroje la muestra

aleatoria extraída de la población, y se toma la decisión. Existen dos tipos de hipótesis, la nula y la alternativa. La hipótesis nula (H0) es la hipótesis que afirma una verdad establecida, y en caso de ser cierta, no es necesario ejecutar acción alguna. Por otro lado, la hipótesis alternativa (H1) es la que se desea sea la sustituta de la hipótesis nula y, cuando es verdadera, es necesario efectuar cambios. De la misma manera, hay dos tipos de errores que pueden ser cometidos en al momento de llevara cabo una prueba de hipótesis, el Error tipo I y Error tipo II, su definición se presenta en la Tabla 3.1:

Naturaleza Se acepta H0 Se rechaza H0

H0 es verdadera No existe error Error tipo I H0 es falsa Error tipo II No existe error

Tabla 3.1: Errores Tipo I y Tipo II Por otra parte, el nivel de significancia es la probabilidad de cometer el error tipo I, y se denota por α. A la probabilidad de cometer el error tipo II se le conoce como β. Existen dos tipos de pruebas de hipótesis, la prueba bilateral y la prueba unilateral. La hipótesis nula es la misma para ambos casos, y se representa como:

00 : θθ =H En la prueba bilateral, la hipótesis alternativa es:

01 : θθ ≠H

En la prueba unilateral, hay dos opciones de hipótesis alternativa:

01 : θθ >H ó

01 : θθ <H

Capítulo 3: Procedimientos Estadísticos No Paramétricos 23

Page 33: Alternativa de Herramientas Estadísticas para el ...

Una forma de reportar los resultados de una prueba de hipótesis es enunciando que la hipótesis nula se rechazó o no en un nivel de significancia determinado. Este enunciado puede ser inadecuado, ya que no le da al analista ninguna idea acerca de cuánto se acercó el estadístico de prueba a la zona de rechazo. Para evitar esto, se utiliza el p-value o p-valor. Éste es la probabilidad de que el estadístico de prueba tome un valor que es al menos tan extremo como el valor observado del estadístico cuando la hipótesis nula es verdadera (Montgomery, 2002). 3.2 Procedimientos No Paramétricos 3.2.1 Procedimientos Paramétricos vs No Paramétricos En la Sección 2.2.1 se describieron cada una de las etapas de la metodología DMAIC (Definir, Medir, Analizar, Mejorar, Controlar) como corazón de Seis Sigma, tanto su definición, como una breve explicación las herramientas utilizadas. Dentro de la etapa de Definición, como puede observarse, sólo se aplica estadística descriptiva, que no requiere de la normalidad de los datos, por lo que los procedimientos no paramétricos presentados en los siguientes apartados se enfocarán específicamente en las etapas MAIC. Teniendo como base diversas fuentes consultadas especializadas en estadística, y como resultado de esta tesis, en la Tabla 3.2, se presenta una propuesta que incluye los sustitutos o equivalentes no paramétricos para algunos de los procedimientos paramétricos utilizados en las fases MAIC. Se incluye también la fase de Definición, con algunas de las herramientas de estadística descriptiva empleadas, así como una guía a grandes rasgos, para verificar que los datos no pueden ser normalizados, y por tanto, tomar la decisión de utilizar herramientas no paramétricas.

Capítulo 3: Procedimientos Estadísticos No Paramétricos 24

Page 34: Alternativa de Herramientas Estadísticas para el ...

Tabla 3.2: Procedimientos Paramétricos vs Procedimientos No Paramétricos Propuestos

Capítulo 3: Procedimientos Estadísticos No Paramétricos 25

Page 35: Alternativa de Herramientas Estadísticas para el ...

Capítulo 3: Procedimientos Estadísticos No Paramétricos 26

Tabla 3.2: Procedimientos Paramétricos vs Procedimientos No Paramétricos Propuestos

(Continuación)∗ **

∗ Debido a que la prueba Gage R&R es considerada como un ANOVA de dos factores, su equivalente no paramétrico es el Análisis de 2 Factores, o Two-Way Layout. ** Algunos autores, como Sheskin, consideran la Prueba Chi Cuadrada como no paramétrica, mientras que otros, como Montgomery, la consideran un procedimiento paramétrico.

Sí ¿Son normales los datos de y?

No

Page 36: Alternativa de Herramientas Estadísticas para el ...

En los siguientes apartados del documento, se desarrollan las herramientas no paramétricas que se sugieren como equivalentes a las pruebas tradicionales de las etapas MAIC, estas son:

Medición o MSA- Análisis de 2 factores (Two Way Layout). o MSA-Friedman, Kendall y Babington-Smith. o MSA-Comparaciones Múltiples de Tratamientos Basados en el

Procedimiento de Friedman. o Capacidad del Proceso – Curvas de Pearson.

Análisis o Pruebas de Hipótesis para Mediana – Wilcoxon. o Pruebas de Hipótesis para Medianas – Mann – Whitney, Kruskal –

Wallis, Análisis de un Factor para Alternativas con Forma Curva. o Prueba de Hipótesis para Medianas con Muestras Dependientes –

Rangos con Signo Wilcoxon. o Pruebas de Hipótesis para Varianza – Chi Cuadrada. o Pruebas de Hipótesis para Varianzas – Levene, Siegel–Tukey,

Moses, Rangos Cuadrados. o Pruebas para Proporciones - Cochran, Tablas de Contingencia. o Pruebas de Forma: Chi Cuadrada, Anderson–Darling,

Kolmogorov–Smirnov. Mejora

o Pruebas de Hipótesis para Medianas – Mann–Whitney, Kruskal–Wallis, Análisis de un Factor para Alternativas con Forma Curva.

o Pruebas de Hipótesis para Varianzas – Levene, Siegel–Tukey, Moses, Rangos Cuadrados.

o Pruebas para Proporciones - Cochran, Tablas de Contingencia. o Coeficiente de Correlación – Spearman.

Control o Gráficos de Control – EWMA.

La presentación de estas herramientas incluye el planteamiento de las hipótesis nula y alternativa, los supuestos bajo los cuales opera, sus requisitos, el procedimiento general para llevar a cabo la prueba y finalmente, la interpretación de los resultados. Debido a que puede dar pie a confusiones, cabe aclarar que la traducción de “rank” al español es rango, por ello, en los nombres de las herramientas se seguirá manejando este término en español, ya que es la manera en la que comúnmente se maneja, mientras que en el procedimiento se utilizarán términos como rank y rankeo.

Capítulo 3: Procedimientos Estadísticos No Paramétricos 27

Page 37: Alternativa de Herramientas Estadísticas para el ...

3.2.2 Medición 3.2.2.1 Capacidad del Sistema de Medición: Análisis de 2 Factores (Two Way

Layout) El Análisis de 2 Factores se refiere al análisis estadístico de datos recolectados generalmente bajo un diseño de experimentos que involucran dos factores, a dos o más niveles. Este tipo de estudio es útil para analizar la capacidad de un sistema de medición, ya que se enfoca en los efectos o medianas de los diferentes niveles de uno de estos factores, llamados tratamientos y de los niveles de un segundo factor, llamado bloque. Lo anterior puede ser representado en la Tabla 3.3:

Tratamientos Bloques 1 2 … k

1 x11 x12 … x1k

2 x21 x22 … x2k

N xn1 xn2 … xnk

Tabla 3.3: Modelo General de Tratamientos y Bloques Adaptada de Hollander y Wolfe 1999

La hipótesis nula básica para este tipo de análisis es la igualdad de los efectos (medianas) de los k tratamientos dentro de cada uno de los bloques. • Suposiciones

o Los N datos { , i = 1,…, n y j = 1,…, son mutuamente independientes.

),...,( 11 knxx }k

o Las funciones de distribución Fij tienen la relación expresada en la Ecuación 3.1:

∞<<∞−−−= uuFuF jiij ),()( τβ (3.1)

donde F es una función de distribución continua con mediana desconocida θ, βi es el efecto aditivo desconocido del bloque i, y τi es el efecto aditivo del tratamiento j.

Hipótesis nula

kH τττ === L210 : Hipótesis alternativa

:1H Al menos hay un par , tal que ji ττ ≠ ji ≠ .

Capítulo 3: Procedimientos Estadísticos No Paramétricos 28

Page 38: Alternativa de Herramientas Estadísticas para el ...

3.2.2.1.1 Prueba de Friedman, Kendall – Babington Smith • Procedimiento Dada una muestra de N datos, agrupados en la forma n bloques y k tratamientos: 1. Ordenar de menor a mayor las k observaciones de forma separada dentro de

cada uno de los n bloques. 2. Asignarle a la observación más pequeña el rank 1, a la segunda el rank 2 y así

sucesivamente. 3. Realizar la sumatoria de los ranks de cada bloque, como se muestra en la

Ecuación 3.2:

∑=

=n

iijj rR

1

(3.2)

donde rij es el rank de xij dentro del bloque i.

4. Calcular el rank promedio de cada bloque, utilizando la Ecuación 3.3:

nR

R jj =. (3.3)

5. Calcular el estadístico de prueba S de Friedman, dado por la Ecuación 3.4:

∑=

⋅ ⎟⎠⎞

⎜⎝⎛ +

−+

=k

jjkR

kknS

1

2

21

)1(12

(3.4)

• Interpretación de los Resultados Rechazar la hipótesis nula si el estadístico de prueba S de Friedman es mayor o igual al valor crítico de tablas sα en su respectivo nivel de significancia.

3.2.2.1.2 Comparaciones Múltiples de Tratamientos Basadas en el Procedimiento de Friedman

Este procedimiento de comparación múltiple, se basa en el modelo de Friedman desarrollado en el apartado anterior, y tiene el objetivo de dar al analista evidencia para tomar decisiones en base a las diferencias individuales entre pares de tratamientos (τi, τj), para i < j. Es empleado para datos agrupados en la forma de n bloques y k tratamientos, como se muestra en la Tabla 3.3, con un dato por celda. Su uso es válido después de rechazar la hipótesis nula del procedimiento de Friedman, que sostiene que las medianas de los tratamientos son iguales.

Capítulo 3: Procedimientos Estadísticos No Paramétricos 29

Page 39: Alternativa de Herramientas Estadísticas para el ...

• Procedimiento Dada una muestra de N datos, agrupados en la forma n bloques y k tratamientos, con un dato por celda: Siendo R1, …, Rk las sumas de los ranks dadas por 3.2, calcular las k(k-1)/2 diferencias absolutas, como se muestra en la Ecuación 3.5:

kvuRR vu ≤<≤− 1 (3.5) • Interpretación de los Resultados Concluir vu ττ ≠ si αrRR vu ≥− , donde rα es la constante elegida para que la tasa de error del experimento sea α. 3.2.2.2 Capacidad del Proceso: Curvas de Pearson El cálculo de la capacidad del proceso comúnmente utilizado tiene el supuesto básico de que los datos provienen de una distribución normal. Cuando este supuesto no se cumple se utilizada un método basado en las Curvas de Pearson. Éste puede ser utilizado para cualquier forma de distribución, es fácil de visualizar gráficamente y es relativamente fácil de calcular. Además, cuando la distribución resulta ser normal, los resultados arrojados son exactamente los mismos que en el método tradicional. En 1893, Karl Pearson publicó su familia de curvas. Este sistema incluye la curva normal y otras curvas estadísticas como casos especiales. Éstas sirven de base teórica para calcular los Índices de Capacidad de Proceso. En este método, al manejar datos no normales, se utiliza la mediana como medida de centralidad, para asegurar que el Cps y el Cpi midan la relación entre las mitades superior e inferior de la distribución de los datos y los límites de especificación. De esta manera, al igual que el método tradicional, el Cpk proporciona un índice para la “peor” mitad de los datos.

Figura 3.1: Representación del Cp con Distribuciones No Normales

Capítulo 3: Procedimientos Estadísticos No Paramétricos 30

Page 40: Alternativa de Herramientas Estadísticas para el ...

En la Figura 3.1 los símbolos tienen la siguiente notación:

LIE: Límite Inferior de Especificación. LSE: Límite Superior de Especificación. PI: Percentil Inferior (0.135). PS: Percentil Superior (99.865).

Los valores de los percentiles obedecen al nivel usual de confianza de 99.73%. Este nivel de confianza es el equivalente a tener cubiertos 3 sigmas de cada lado de la media, como se muestra en la Figura 3.2:

Figura 3.2: Nivel de Confianza del 99.73%

on esto, se pretende cubrir el 99.73% del área bajo la curvan sin importar el tipo

ara la aplicación de este método es necesario realizar el cálculo del sesgo y la

sesgo negativo. En la Figura 3.2 se muestran ambos tipos de sesgo.

Cde distribución con que se esté trabajando, como se presenta en la Figura 3.3.

Figura 3.3: Percentiles Estándar

Pcurtosis de la distribución de los datos bajo análisis. El sesgo es el grado de asimetría de una distribución: si la curva de frecuencias tiene una cola más larga a la derecha del máximo central que a la izquierda, se dice que la distribución tiene un sesgo positivo. Si sucede lo contrario, se dice que la distribución tiene un

Capítulo 3: Procedimientos Estadísticos No Paramétricos 31

Page 41: Alternativa de Herramientas Estadísticas para el ...

Figura 3.4: Tipos de Sesgo

Por otro lado, la curtosis es el nto de una distribución: si la istribución tiene un apuntamiento alto se dice que es leptocúrtica, mientras que na distribución más plana se llama platicúrtica. La distribución normal se

Procedimiento

. Calcular la media

grado de apuntamie

dudenomina mesocúrtica. La Figura 3.3 ilustra mejor lo anterior.

Figura 3.5: Tipos de Curtosis

x1 de los datos, utilizando la Ecuación 3.6:

n

xi

i∑x

n

= (3.6)

2. Calcular la desviación están ión 3.7:

= 1

dar σ de los datos, usando la Ecuac

n

xxi

i∑n

=

2

(3.7)

3. Calcular el coeficiente de sesgo, a3, con la Ecuación 3.8:

−= 12

)(σ

Capítulo 3: Procedimientos Estadísticos No Paramétricos 32

Page 42: Alternativa de Herramientas Estadísticas para el ...

3

3

3 σma = (3.8)

donde

n

xxi

i∑m

n

=3 .

4. Calcular el coeficiente de curt 4 :

−= 1

3)(

osis, a , utilizando la Ecuación 3.9

4

4

4 σma = (3.9)

nm i

xxn

i∑donde =

− 4)(.

2. Obtener el percentil estandarizado I’ tivo, utilizar la Tabla 1a; para sesgo negativo, utilizar la Tabla 1b.

3. r el percentil es , utilizar la

bla 1b; para sesgo negativo utilizar la Tabla 1a.

= 14 . En el método se utiliza la cantidad a4 – 3

0.135, P . Para sesgo posi

Obtene tandarizado 99.865, PS’. Para sesgo positivoTa

4. Obtener la mediana estandarizada M’, de la Tabla 2. Para sesgo positivo, cambiar el signo; para sesgo negativo, dejar el signo original.

5. Calcular el percentil 0.135 estimado, PI, con la Ecuación 3.10:

'II PxP σ−= (3.10) 6. Calcular el percentil 99.865 estimado, PS, usando la Ecuación 3.11:

'SS PxP σ−= (3.11) 7. Calcular la mediana estimada, M, utilizando la Ecuación 3.12:

MxM '− σ=

. Calcular los Índices de Habilidad del Proceso:

ot nc

(3.12)

8

Para la Capacidad P e ial

ISp PP

LIELSEC−−

= 3.13)

Para la Capacidad Real

(

Ipi PM

LIEMC−

−= (3.14)

Capítulo 3: Procedimientos Estadísticos No Paramétricos 33

Page 43: Alternativa de Herramientas Estadísticas para el ...

MPMLSEC

Sps −

−= (3.15)

{ }pspipk mínC = CC , (3.16)

3.2.3 Análisis 3.2.3.1 Prueba de Rangos con Signo de W

a Prueba de Rangos con Signo (Wilcoxon, 1945) es un procedimiento no aramétrico empleado en pruebas de hipótesis que involucran una sola muestra ara determinar si ésta se deriva o no de una población en la cual la mediana (θ)

a prueba arroja un resultado significativo, el vestigador puede concluir que existe evidencia suficiente de que la muestra

rente a θ (Sheskin, 004).

están en el formato de intervalo/proporción. o La distribución de la población es simétrica.

Hipótesis nula

ilcoxon (1 Mediana) Lppes igual a un valor específico. Si estinprocede de una población cuya media tiene un valor dife2 • Suposiciones

o La muestra ha sido seleccionada aleatoriamente de la población que representa.

o Los registros originales obtenidos para cada uno de los sujetos/objetos

0:0 θθ =H ótesis alterna Hip tiva

0:1 θθ ≠H ó

01 : θθ >H ó

01 : θθ <H

• Procedim to Dada ra de n observaciones: 1. Calcular las diferencias

ien

una muest0θ−= ixD .

2. Ordenar lo alores absolutos de las diferencias |D|. 3. as diferencias iguales a cero no se ordenan. Esto quiere decir que se elimina

er sujeto que arroje una diferencia de cero.

s v

el análisis cualquiLd

Capítulo 3: Procedimientos Estadísticos No Paramétricos 34

Page 44: Alternativa de Herramientas Estadísticas para el ...

4. Se debe utilizar el siguiente protocolo al ordenar los valores de las diferencias: con el valor absoluto más pequeño, el

con el se undo valor absoluto más pequeño y así do al valor absoluto más

6.

Se le asigna el rank 1 a la diferenciarank 2 a la diferencia gsucesivamente hasta que el rank más alto sea asignagrande. En caso de que exista un empate en dichos valores, se le asigna a cada uno de éstos el promedio de sus respectivos ranks.

5. Después de ordenar |D|, se coloca el signo de cada diferencia enfrente de su respectivo rank. Se registra la suma de los ranks con signo positivo +ΣR y la suma de los ranks con signo negativo −ΣR . La Ecuación 3.17 permite verificar la exactitud de estos valores. Si la relación expresada en esta ecuación no se obtiene, entonces se ha cometido un error al realizar los cálculos:

2)1( +

=Σ+Σ −+ nnRR (3.17)

Interpretación de los Resultados • Si el valor de +ΣR − es significativamente mayor que el valor ΣR , esto

procede de una pob indica que

hay una alta posibilidad de que la muestra lación cuya mediana es mayor que −ΣR es mayor que +ΣR0θ . Por otro lado si el valor , , esto

uie a viene de una población q re decir que existe alta posibilidad de que la muestrcuya mediana es menor que 0θ . El valor absoluto del más pequeño de los valores +ΣR y −ΣR se designa como el estadístico de prueba Wilcoxon T. El valor T es interpretado usando la Tabla de Valores T Críticos para la Prueba Wilcoxon (Tabla 5, Anexos). Para e sea significativo, el valor obtenido de T debe ser menor o igual que el valor crítico T de tablas, en su respectivo nivel de signi

qu

ficancia, es deci a si r, se rechaz 0H αTT ≤ .

involucran una la muestra, con el objetivo de determinar si dicha muestra con una varianza

stimada de s2 se deriva de una población con una varianza σ2. Esta prueba tiliza datos en forma de intervalo / proporción.

3.2.3.2 La Prueba Chi Cuadrada (1 Varianza) La Prueba Chi Cuadrada se utiliza en pruebas de hipótesis que soeu Suposiciones •

o La distribución de los datos de la población de la cual se deriva la muestra,

es normal. o La muestra ha sido seleccionada aleatoriamente de la población que

representa.

Capítulo 3: Procedimientos Estadísticos No Paramétricos 35

Page 45: Alternativa de Herramientas Estadísticas para el ...

• Requisito o La muestra debe ser n ≥ 5.

ip

Hip tiva σ

edimiento

ra de n observaciones:

obtener el estadístico de prueba es necesario utilizar los datos muestrales para calcular un estimado de la varianza poblacional, utilizando la Ecuación 3.18:

H ótesis nula

20

2: σσ =H ótesis alterna

0

20

21 :σ ≠H

ó2201

ó H : σσ >

20

21 : σσ <H

• Proc

Dada una muest1. Para

2~s ,

1−n

)(~

22

2

Σ−Σ

= nXX

s (3.18)

Donde 2XΣ es la sumatoria de los cuadrados de cada uno de los datos muestrales, mientras 2)( XΣ es el cuadrado de la sumatoria de los datos. Calcular el esta2. dístico de prueba chi-cuadrada utilizando la Ecuación 3.19:

2

22

~)1(σ

χ sn −= (3.19)

Donde σ2 es el valor hipotético de la

El estadístico de prueba es compar la Distribución Chi-Cuadrada (Tabla 4, Anexos). Est ón a los gra 3.20:

df= n – 1 (3.20)

esario usar los siguientes lineamientos: ) Si la hipótesis alternativa empleada es bidireccional, la hipótesis nula puede

poblacional mayor que el valor es en hipótesis n a puede ser rechazada si el estadístico de prueba es mayor o igual que el valor crítico de tablas, para

varianza poblacional.

• Interpretación de los Resultados

ado con el valor de tablas paraos valores están listados en relaci

dos de libertad, los cuales se calculan utilizando la Ecuación

Para evaluar la hipótesis nula, es neca

ser rechazada si valor obtenido de Chi-Cuadrada es mayor o igual que el valor de tablas, al nivel de significancia requerido, o menor o igual.

b) Si la hipótesis alternativa es unidireccional y predice una varianza tablecido la ula, ést

su respectivo nivel de significancia.

Capítulo 3: Procedimientos Estadísticos No Paramétricos 36

Page 46: Alternativa de Herramientas Estadísticas para el ...

c) En caso contrario al anterior, la hipótesis nula puede ser rechazada si el valor del estadístico de prueba es menor o igual que el valor crítico, en el nivel de significancia especificado.

3.3 Prueba de la χ

3.2. r x c (Tablas de Contingencia para

La r x c es una extensión de la Prueba de Bondad de

juste de la χ2 para tablas bidimensionales. Mientras que ésta puede ser mpleada únicamente con una sola muestra categorizdada en una dimensión, la rueba para Tablas r x c puede usarse para evaluar diseños que contienen datos

tablas stas de r renglones y c columnas. Los valores de r y c son úmeros enteros iguales o mayores a 2. La Tabla 3.4 es el modelo general de una

2 para TablasProporciones)

Prueba de la χ2 para Tablas Aepcategóricos en forma de una tabla, conocida como tabla de contingencia. Estas

están compuentabla de contingencia.

C1 C2 … Cj … Cc R1 O11 O12 … O1j … O1c O1.

R2 O21 O22 … O2j … O2c O2.

M M M M M Ri Oi1 Oi2 … Oij … Oic Oi.

M M M M M Rr r.Or1 Or2 … Orj … Orc O O.1 O.2 … O.j … O.c n

Ta 3 re e a C g a

Ext ída de Sheskin, 004.

Existe un total de n ob rv io e s ta . da elemento dentro de la tabla es identificado por dos notaci la p ndica el renglón y el segundo, la columna l u c a ld de tal manera que la notación Oij represent el io e se encuentra en el i renglón y en la j colu • Suposiciones

: m e la tabla r x c son iguales.

bla .4: Ar glo d una Tabl de ontin encira 2

se ac n s e n e ta bla Caones,

locarimera i ceen a q e se liza ad a,

a número de observac nes qumna.

o La muestra de n sujetos ha sido aleatoriamente elegida de la población que representa.

o El nivel de medición de los datos es nominal o categórica. o La frecuencia esperada de cada celda es igual o mayor a 5.

Hipótesis nula

H0 En las poblaciones representadas por la muestra, todas las proporciones en la isma columna d Hipótesis alternativa

Capítulo 3: Procedimientos Estadísticos No Paramétricos 37

Page 47: Alternativa de Herramientas Estadísticas para el ...

H1: En las poblaciones representadas por la muestra, todas las proporciones en la misma columna de la tabla r x c no son iguales para al menos una de las

n datos, agrupados en la forma de una tabla de con1.

n la cual la celda de interés aparece por la suma de las bservaciones de la columna de esa misma celda. Dividir entre el total de

. Esta operación se representa con la Ecuación 3.21:

columnas. Procedimiento

Dada una muestra detingencia r x c: Calcular las frecuencias esperadas: Multiplicar la suma de las observaciones en la fila eoobservaciones n

nE jiij

..= (3.21) OO ))((

2. Calcular el estadístico de prueba χ2, haciendo la sumatoria de las restas de la frecuencia observada menos la frecuencia esperada de cada celda entre la frecuencia esperada, como se puede observar en la Ecuación 3.22:

∑∑= = ⎥

⎥⎦ij

ij

E (3.22)

⎤−c EO 2)(

⎢⎢⎣

⎡=

r

i j

ij

1 1

El valor obtenido del estadístico de prueba la Tabla de la Distribución Chi-Cuadrada (Tabla 4, Anex ibertad

df= (r-1)(c-1) (3.23)

azada si valor obtenido de es mayor o vel de significancia predeterminado.

2.3.4 Prueba de Bondad de Ajuste Kolm gorov Smirnov para una muestra

La Kol ntre esta

rueba y la de bondad de ajuste para 2 muestras independientes de Smirnov . Ésta es usada para determinar si la distribución de los datos en una

uestra se ajusta a una distribución poblacional específica teórica o empírica, es tipo

specífico. Esta prueba está diseñada para trabajar con variables continuas.

Interpretación de los Resultados

2χ se compara con os), con grados de l

2χLa hipótesis nula puede ser rech

igual que el valor de tablas, al ni

3.

o –

Prueba de Bondad de Ajuste Kolmogorov – Smirnov fue desarrollda por mogorov en 1933, pero recibió este nombre debido a la similitud e

p(1939)mdecir, para demostrar si una muestra se deriva de una distribución de e • Suposiciones

Capítulo 3: Procedimientos Estadísticos No Paramétricos 38

Page 48: Alternativa de Herramientas Estadísticas para el ...

o La muestra de n sujetos ha sido aleatoriamente elegida de la población

que representa. o El nivel de medición de los datos es ordinal. o La variable bajo estudio es continua.

para todos los valores de X.

oc

Dada r1.

bución teórica que se está probando (i.e. la d

. Calcular la proporción acumulativa para cada dato en la distribución teórica que se obtiene con la función de probabilidad de la misma.

. Calcular la proporción acumulativa para cada dato dentro de la distribución ene dividiendo la frecuencia acumulada del dato

r el tamaño de muestra n.

Hipótesis nula

)(~)(: 00 XFXFH Hipótesis alternativa

)(~)(: XFXF p0H / ara al menos un valor de X. 1

Pr edimiento •

una muest a de n datos: de menor a mayor. Ordenar los datos

2. Estandarizar los datos de acuerdo a la distriistribución normal estándar).

3hipotética F0(Xi),

4muestral S(Xi), la cual se obtientre el número total de datos, es deci

5. Obtener el valor absoluto de la diferencia entre S(Xi) y F0(Xi), es decir )()( XFXS − , al cual llamaremos M. 0 ii

6. Obtener el valor absoluto de la resta )()( 01 ii XFXS −− , es decir, la diferencia entre la proporción acumulativa de la distribución muestral del dato i y la proporción acumulativa de la distribución hipotética del dato precedente, i – 1, al cual llamaremos M’.

7. Obtener el estadístico de prueba Kolmogorov – Smirnov, siendo éste el valor rande de las diferencias calabsoluto más g culadas en los pasos 5 y 6, es decir

ca la distanci

• El eSmiM’. valor crítico de las tablas correspondientes a

sta prueba (Tabla 7, Anexos). La hipótesis nula se rechaza si el valor del stadístico de prueba es mayor o igual que el valor crítico de tablas en su

el valor más grande entre M y M’. Se bus a vertical más grande en cualquier punto entre las dos distribuciones de probabilidad; sin embargo es posible que esta distancia tenga lugar en algún punto entre uno de los datos en la distribución muestral.

Interpretación de los Resultados

stadístico de prueba para la prueba de Bondad de Ajuste Kolmogorov -rnov, como ya se mencionó anteriormente, es el valor más grande entre M y Éste debe ser contrastado con el

eerespectivo nivel de significancia.

Capítulo 3: Procedimientos Estadísticos No Paramétricos 39

Page 49: Alternativa de Herramientas Estadísticas para el ...

3.2.3.5 Prueba de Bondad de Ajuste de la χ2 La Prueba de Bondad de Ajuste de la χ2 es empleada para pruebas de hipótesis que involucran una sola muestra. Esta muestra tiene que ser agrupada de tal forma que las N observaciones, aleatoriamente seleccionadas de una población, queden distribuidas en k categorías (intervalos) mutuamente excluyentes de

maño n. Los datos son concentrados en forma de una tabla de k celdas, cada la 3.6 representa el modelo general

e la prueba de bondad de ajuste de la Chi Cuadrada.

tacelda representando una categoría. La Tabd

Observaciones Totales Celdas/Categorías C1 C2 … Ci … Ck Frecuencia Observada O1 O2 … Oi … Ok N

Tabla 3.5: Modelo de la Prueba Chi Cuadrada Adaptada de Sheskin, 2004.

a hipótesis que se evalúa con esta prueba es la exiL

distencia o no de una

ferenci entre las frecuencias bservadas y las fre n cada una de l tervalos si los datos se ajustan o no a la distribuci a encia esper a de cada celda se determina a través l istribución que se está analizando) o mediante revia acerca de la variable

ajo estudio.

encia esperada de cada celda es igual o mayor a 5.

para todos los valores de X.

oc

1. nir las catego datos serán agrupados. 2. atos dentro de cada intervalo.

da categoría, utilizando la Ecuación 3.24:

a o cuencias esperadas eas k categorías o in , lo que indicaón que está siendo ex minada. La frecu ad

a d del uso de teorías de probabilidad (de información empírica p

b • Suposiciones

o La muestra de ni sujetos ha sido aleatoriamente elegida de la población que representa.

o El nivel de medición de los datos es nominal o categórica. o La frecu

Hipótesis nula

)(~)(: 00 XFXFH Hipótesis alternativa

)(~)(: XFXF p0H / ara al menos un valor de X. 1

Pr edimiento •

Defi k rías o intervalos en los que los

uencia observada ODeterminar la frec3. Determinar la frecue

i de los dncia esperada Ei para ca

ii NE π= (3.24) senta el número total de observaciones y πi representa la donde N repre

probabilidad de que una observación caiga dentro del intervalo i. 4. Calcular el estadístico de prueba utilizando la Ecuación 3.25:

Capítulo 3: Procedimientos Estadísticos No Paramétricos 40

Page 50: Alternativa de Herramientas Estadísticas para el ...

∑=

⎥⎦iE⎤⎡ −k

ii EO 22 )(

⎢⎣

=i 1

χ (3.25)

El valor obtenido del estadístico de prueb con la Tabla de la Distribución Chi-Cuadrada (Tabla 4, Anexos), con grados de libertad

df= k – 1 (3.26)

azada si valor obtenido de es mayor o igual que el valor de tablas, al nivel de significancia requerido.

.2.3.6 Prueba de Bondad de Ajuste Anderson - Darling para una muestra

La pa

na ón específica. sta es una modificación de la prueba Kolmogorov – Smirnov, dándole más peso las colas de la distribución. Anderson – Darling hace uso de la distribución

la hace

X para todos los valores de X. Hipótesis alternativa

Dada una muestra de manera ascendente, usando el siguiente protocolo: se le

asigna el rank i = k i = 2 al segundo valor más equeño y así sucesivamente hasta que el rank más alto sea asignado al valor

y , donde F es la distribución acumulada de la ando.

Interpretación de los Resultados •

a 2χ se compara

2χLa hipótesis nula puede ser rech

3

Prueba de Bondad de Ajuste Anderson – Darling es empleada ra evaluar si muestra de datos proviene de una población con una distribuciu

Éaespecífica que se está probando para calcular los valores críticos, lo cual

na prueba más sensible. u • Suposiciones

o La muestra de ni sujetos ha sido aleatoriamente elegida de la población que representa.

Hipótesis nula

~)(: 00 FXFH )(

)(~)(: 0 XFXFH / para al menos un valor de X. 1

• Procedimiento

N datos: 1. Ordenar los datos de

1 al valor más pequeño, el ranpmás grande.

. Calcular )( iYF )( 1 iNYF −+2distribución que se está evalu

3. Calcular el estadístico de prueba A2, con la Ecuación 3.27: SNA −−=2 (3.27)

Capítulo 3: Procedimientos Estadísticos No Paramétricos 41

Page 51: Alternativa de Herramientas Estadísticas para el ...

donde N es el número total de datos y S está dada por la Ecuación 3.28:

))](1(ln)([ln1i

i YFYFN

S=

−−= ∑ (3.28) )12(1 iN

N i−+

• terpretación de los Resultados Para rechazar la hipótesis nula, el valor obtenido de A debe ser m gual que el valor crítico de tablas de la distribución bajo prueba, el de

gnificancia.

a Prueba U de Mann-Whitney (1947) se emplea con datos ordinales en pruebas e hipótesis que involucran un diseño con dos muestras independientes. Si el

nificativo, éste indica que existe diferencia ificativa entre las medianas de las muestras, con lo cual el

posibilidad de que las muestras s.

aleatoria continua. ciones de las que derivan las muestras tienen una forma

In

ayor o i en su respectivo niv

si 3.2.4 Mejora 3.2.4.1 Prueba U de Mann-Whitney (2 medianas) Ldresultado de la

ualmente sign prueba es sig

iginvestigador puede concluir que existe una altaepresentan poblaciones con medianas diferenter

• Suposiciones

o Cada muestra ha sido seleccionada aleatoriamente de la población que representa.

o Ambas muestras son independientes una de la otra. o La variable original observada es una variableo Las distribu

idéntica.

Hipótesis nula 21:0 θθ =H

Hipótesis alter nativa 211 : θθ ≠H

ó 211 : θθ >H

ó 211 : θθ <H

Capítulo 3: Procedimientos Estadísticos No Paramétricos 42

Page 52: Alternativa de Herramientas Estadísticas para el ...

• Procedimiento Dadas dos muestras n1 y n2, de tal forma que n1 + n2 = N observaciones: 1. Todos los N datos se ordenan por magnitud, sin importar la muestra de la que

provienen, . A cada dato se le asigna un rank, dándole el rank 1 al valor más pequeño, el

do más pequeño y así sucesivamente hasta asignarle al valor ank N (en caso de que no haya empates).

ada uno

de menor a mayor.2

rank 2 al segunmás grande el r

3. En caso de que exista un empate en dichos valores, se le asigna a cde éstos el promedio de sus respectivos ranks.

4. Una vez que se ha ordenado todos los datos, se procede a realizar la suma de los ranks de cada grupo (muestra).

5. Se calculan los valores U1 y U2 utilizando las Ecuaciones 3.29 y 3.30:

1211 211 )1( RnnnnU Σ−

++= (3,29)

2212 2RnnU Σ−+= (3.30)

Es necesario notar que los valores

22 )1(nn + U y U no pueden ser negativos. Si se

l orden o en los cálculos.

6. La Ecuación 3.31 puede ser utilizada p calculado correctamente los valores U:

1 2

obtiene un valor negativo es porque se ha cometido un error en e

ara confirmar que se han

2121 UUnn += (

El vvalWh significativo, éste debe ser menor o igual al valor de tablas en su respectivo nivel de significancia, es decir, se

de Kruskal – Wallis (1952), se emplea con datos ordinales en pruebas is que invo cran un diseño con dos o más muestras independientes.

sta prueba es una extensión de la Prueba U de Mann – Whitney. Si el resultado de Prueba Kruskall – Wallis es significativo, indica que hay una diferencia entre al

to de k medianas.

3.31) Si esta relación no se da, tenemos un indicador de que se ha cometido un error en los cálculos o en el orden de los grupos.

• Interpretación de los Resultados

alor más pequeño de U1 y U2 se designa como el estadístico de prueba U. El or U se evalúa con la Tabla de Valores Críticos para el Estadístico U de Mann-

ney (Tabla 6, Anexos). Para que el valor U seait

rechaza 0H si αUU ≤ . 3.2.4.2 La Prueba de Kruskal – Wallis (≥ 2 medianas) La Prueba

e hipótes ludElamenos dos de las medianas muestrales en un conjun

Capítulo 3: Procedimientos Estadísticos No Paramétricos 43

Page 53: Alternativa de Herramientas Estadísticas para el ...

• Suposiciones

o Cada muestra ha sido seleccionada aleatoriamente de la población que representa.

o Las k muestras son independientes una de la otra. o La variable dependiente es aleatoria continua. o Las distribuciones de las cuales se derivan las muestras tienen formas

idénticas.

Hipótesis nula kH θθθθ == ...0

==: 321

Hipótesis alternativa : Al menos hay un par ji1H θθ ≠ tal que ji ≠ .

miento Procedi

Dada mu as, de tal fo ma que n1 = n2 = … =nk , donde N = n1 + n2 + … +nk. ordenan por magnitud, sin importar la muestra de la que

yor. 2. A ca n rank e en rank 1 al valor más pequeño, el

rank 2 al segundo más pequeño y así sucesivamente hasta asignarle al valor ank N (en caso de que no haya empates).

. En caso de que exista un empate en dichos valores, se le asigna a cada uno

ra).

s k estr r1. Todos los N datos se

provienen, de menor a mada dato se le asigna u , dándol

más grande el r3

de éstos el promedio de sus respectivos ranks. 4. Una vez que se ha ordenado todos los datos, se procede a realizar la suma de

los ranks de cada grupo (muest5. Se calcula el valor H, utilizando la Ecuación 3.32:

)1(3)(12 2

+−⎥⎤

⎢⎡

= ∑)1( 1 ⎥⎦⎢⎣+∑

= nNN j j

NR

Hk

j (3.32)

nexos) para aproximar el

estadístico de prueba Kruskal – Wallis. Para rechazar la hipótesis nula el valor debe ser igual o mayor al valor crítico d a en ctivo nivel de significancia.

Los proíficamente en las medianas de tres o más

oblaciones. La hipótesis nula de este tipo de procedimientos plantea que no xiste ninguna diferencia entre las medianas de las k poblaciones, por lo que

• Interpretación de los Resultados

Se utiliza la Distribución Chi Cuadrada (Tabla 4, A

2~ χH e la Distribución Chi Cuadradsu respe 3.2.4.3 Análisis de un Factor para Alternativas con Forma Curva o “Umbrella” (≥ 2

medianas)

cedimientos conocidos como Análisis de un Factor están diseñados para el análisis estadístico enfocado especpe

Capítulo 3: Procedimientos Estadísticos No Paramétricos 44

Page 54: Alternativa de Herramientas Estadísticas para el ...

pueden ser tratadas como una sola muestra de una población. La prueba Kruskal is entra en e– Wall sta categoría de métodos. Un caso especial es el conocido

omo “umbrella” (Mack y Wolfe, 1981) debido a la configuración que presentan

. o La variable dependiente es aleatoria continua. o Las distribuciones de las cuales se derivan las muestras tienen formas

=0

clas medianas en la hipótesis alternativa. Ésta presenta un pico localizado en la población p, el cual, para el procedimiento presentado a continuación, es conocido antes de realizarse la recolección de datos. • Suposiciones

o Cada muestra ha sido seleccionada aleatoriamente de la población que representa.

o Las k muestras son independientes una de la otra

idénticas.

Hipótesis nula μμ == L: k21

Hipótesis alternativa H μ

kpppH μμμμμμ ≥≥≥≤≤≤≤ +− ......: 1121

miento

1

Procedi

Dada una muestra de N os, agrupados en la forma k tratamientos: 1. os de manera que queden en la secuencia mostrada

ativa, alrededor del pico conocido p. 2. Calcular los p(p – 1) conteos Mann – Whi ey Uuv, presentados en la Ecuación

3.33, para cada par de tratamientos con valor menor o igual al pico p, de tal u < v ≤ p.

datntOrdenar los tratamie

por la hipótesis alterntn

manera que 1 ≤

∑∑= =

. Calcular los (k – p +1)(k – p)/2 conteos Mann – Whitney Uvu (en orden inverso)

para cada par de tratamientos con valor mayor o igual al pico p, de tal manera que p ≤ u < v ≤ k, utilizando la Ecuación

4. Calcular el estadístico de prueba Ap, usando la Ecuación 3.34:

+= vuuvp UUA (3.34)

≤<≤=i j

jviuuv kvuxxU1 1

1),(φ (3.33) u vn n

donde φ(a, b) = 1 si a < b y φ(a, b) = 0 si a > b.

3

3.34.

∑ ∑∑∑−− 11 v kv p

= +== = 11 2 pu pvu v

Capítulo 3: Procedimientos Estadísticos No Paramétricos 45

Page 55: Alternativa de Herramientas Estadísticas para el ...

• Interpretación de los Resultados Rechazar la hipótesis nula si el estadístico al valor crítico de tablas ap,α en el nivel de significancia seleccionado.

anzas)

. Esta prueba está iseñada para determinar si las varianzas de un grupo de k poblaciones son uales o no. Esta prueba es una alternativa de la Prueba de Bartlett. La prueba e Levene es menos sensible que la de Bartlett si se parte de una distribución

prueba no paramétrica. La prueba riginal de Levene proponía solamente usar la media dentro de los cálculos del

Hipótesis nula

de prueba Ap es mayor o igual

3.2.4.4 La Prueba de Levene (≥ 2 Vari La Prueba de Levene (Levene, 1960) se utiliza en pruebas de hipótesis que involucran un estudio con dos o más muestras independientesdigdnormal, por ello es concebida como unaoestadístico de prueba; sin embargo, Brown y Forsythe (1974) extendieron la prueba agregando también el uso de la mediana y de la media acotada. La opción de usar la media, la mediana o la media acotada determinan el poder y robustez de la prueba, es decir, la habilidad para detectar varianzas diferentes cuando éstas son diferentes en realidad. • Suposiciones

o Cada muestra ha sido seleccionada aleatoriamente de la población que representa.

o Las k muestras son independientes una de la otra.

2 22 kσ=L

ay un par tal que

210 :H σσ ==

Hipótesis alternativa :H Al menos h 22

1 ji σσ ≠ ji ≠ . Procedimiento

1. Dada una variable Y con tamaño de muestra N, dividida en k subgrupos muestra Ni, calcular el estadístico de prueba utilizando la

con tamaños de Ecuación 3.35:

∑∑=

−−= k Ni

iij

i

ZZkW

2.

1

)()1( (3.35)

= =

−−

i j

k

ii ZZNkN

1 1

2... )()(

Capítulo 3: Procedimientos Estadísticos No Paramétricos 46

Page 56: Alternativa de Herramientas Estadísticas para el ...

donde Zij puede tener una de las sigui ntes 3 definiciones:

a)

e

.iijij YYZ −= (3.36)

donde .iY es la media del subgrupo i.

b) .~iijij YYZ −= (3.37)

donde .~iY es la mediana del subgrupo i.

c) .iijij YYZ ′= (3.38) −

onde .iY ′d es el 10% de la media acotada del subgrupo i (la media de los datos ubicad y 90.

os entre los percentiles 10

.iZ son las m dias grupales de ijZ y e ..Z es la media total de .iZ .

dios de Bro an que la prueba arroja resultados má bdist

lación sigue una distribución

unque la opción óptima depende de la distribución subyacente de la

• terpretación de los Resultados El edistresp e significancia y grados de libertad k-1 y N-k, se rechaza la hip tesis nula.

.2.4.5 La Prueba de Siegel – Tukey (2 varianzas)

esta prueba es significativa, indica que existe una diferencia entre s varianzas muestrales, y por lo tanto, que existe una amplia posibilidad de que stas muestras representen poblaciones con varianzas diferentes.

Estu wn y Forsythe (1974) indics confia les utilizando la media acotada si la población sigue una ribución Cauchy; se trabaja mejor con la mediana si la distribución

te es una χ2 y con la media, si la pobsubyacensimétrica.

Apoblación, la definición basada en la mediana es altamente recomendada ya que provee un buen nivel de robustez y poder ante muchos tipos de datos no normales. In

stadístico de prueba debe ser comparado con el valor superior de tablas de la ribución F de Fisher. Si el valor del estadístico es mayor al de la F en el ectivo nivel d

ó

3 Desarrollada por Siegel y Tukey (1960), esta prueba es utilizada con datos ordinales en pruebas de hipótesis que involucran dos muestras independientes. Si el resultado de lae

Capítulo 3: Procedimientos Estadísticos No Paramétricos 47

Page 57: Alternativa de Herramientas Estadísticas para el ...

• Suposiciones

o Cada muestra ha sido seleccionada aleatoriamente de la población que representa.

o Las muestras son independientes una de la otra. o El nivel de medición de los datos es ordinal. o Las dos poblaciones de las que se derivan las muestras tienen medianas

iguales.

Hipótesis nula

22

p

21: σσ =H

ótesis alterna0

Hi tiva 2221: σσ ≠H 1

ó 22

ó

21: σσ >H1

22

• Procedimiento Este procedimie to es semejante al de la prueba U de Mann – Whitney (Tabla 6, Anexos diferenciándose solamente en el protocolo de ordenar. Dadas dos muest n1 y n2, de tal forma que n1 + n2 = N observaciones: 1. Todos los N datos se ordenan por magnitud, sin importar la muestra de la que

provienen, de menor a mayor. . A cada dato se le asigna un rank, siguiendo el siguiente protocolo: se le da el

ás pequeño, el rank 2 al más grande, el rank 3 al segundo más grande, el rank 4 al segundo más pequeño, el rank 5 al tercero más pequeño,

211 : σσ <H

n),

ras

2rank 1 al valor m

y así sucesivamente, alternando de un extremo de la distribución al otro, como se muestra en la Tabla 3.6:

Datos Rank 5 1 7 4 9 5

10 8

32 6 37 3 40 2

Tabla 3.6: Ejemplo de Asig ción de Ranks

na

Capítulo 3: Procedimientos Estadísticos No Paramétricos 48

Page 58: Alternativa de Herramientas Estadísticas para el ...

3. En caso de que exista un empa en dic s valores, se le asigna a cada uno de éstos el promedio de sus respec s ran

4. Una vez que se han ordenado os los tos, se procede a realizar la suma de los ranks de cada grupo (mu

5. Se calculan los valores U1 y U2 ut ndo la s 3.39 y 3.40:

te hotivo ks.

tod daestra). iliza s Ecuacione

1211 2RnnU Σ−+= (3.39) 11 )1(nn +

222

212 2RnnU Σ−+= (3.40) )1(nn +

. Al igual que en la prueba U, la Ecuación 3.41 puede ser uti6 lizada para

confirmar que se han calculado correctamente los valores U: 2121 UUnn +=

Si esta relación no se da, tenemos un indicador de que se ha cometido un error en los cálculos o en el orden de los grupos.

El valor más pequeño de U1 y U rueba U. El valWh significativo, éste debe ser menor o igual al valor de tablas en su respectivo nivel de significancia, es decir, se

chaza si .

e ser empleado en pruebas de hipótesis que involucran dos muestras dependientes. Si el resultado de esta prueba es significativo, indica que existe iferencia entre las varianzas de las muestras, por tanto, el investigador puede oncluir que existe una alta posibilidad de que las muestras representan

obtenidos en formato de proporción o intervalo.

dependiente es aleatoria continua.

(3.41)

• Interpretación de los Resultados

2 se designa como el estadístico de por U se evalúa con la Tabla de Valores Críticos para el Estadístico U de Mann-itney (Tabla 6, Anexos). Para que el valor U sea

0H αUU ≤re 3.2.4.6 La Prueba de Moses (2 varianzas) Desarrollada en 1963, la Prueba de Moses es un procedimiento no paramétrico que puedindcpoblaciones con diferentes varianzas. • Suposiciones

o Cada muestra ha sido seleccionada aleatoriamente de la población que representa.

o Las muestras son independientes una de la otra. o Los registros originales fueron

o La variable

Capítulo 3: Procedimientos Estadísticos No Paramétricos 49

Page 59: Alternativa de Herramientas Estadísticas para el ...

o Las distribuciones de las cuales se derivan las muestras tienen formas idénticas.

Hipótesis nula

22: σσ = 2H

1

Hipótesis alternativa 0

22

21: σσ ≠H

ó 1

22

ó

211 : σσ >H

22

• Procedimiento Dadas dos muestras n1 y n2, de tal forma que n1 + n2 = N observaciones: 1. El protocolo para esta muestra requiere que los registros originales sean

divididos en “submuestras”. Una submuestra es un conjunto de datos que se derivan de una muestra, siendo su número de registros menor que el número

entro de la muestra. . Se dividen los n1 datos de la primera muestra en m1 submuestras, donde m1> 1,

dividen

s submuestras.

n2 , esto no siempre es

ñalar que aquellos datos que no entren a ninguna submuestra

4. dia de las m1 muestras derivadas de la muestra 1. Dentro de

b) diferencia.

211 : σσ <H

total de datos d2

componiéndose cada submuestra de k datos. De la misma manera, se los n2 datos de la primera muestra en m2 submuestras, donde m2 > 1, componiéndose cada submuestra de k datos. La selección de dichos datos para cada submuestra debe ser aleatoria y sin reposición, es decir cada dato debe ser empleado en sólo una de la

3. Es importante mencionar que todas las submuestras deben estar compuestas por el mismo número de datos; sin embargo, el número de submuestras no tiene que ser el mismo, es decir, m1 y m2 pueden no ser equivalentes. El número de registros en cada submuestra debe estar compuesto de tal forma que los productos (m1)(k) y(m2)(k) incluyan tantos datos como sea posible. Aunque la situación óptima sería que (m1)(k) = n1 y (m2)(k) =posible. Shorack (1969) recomienda los siguientes criterios para determinar los valores de k, m1 y m2: a) k debe ser tan grande como sea posible, pero no mayor a 10. b) Los valores de m1 y m2 deben ser lo suficientemente grandes para arrojar

resultados significativos. Cabe sequedarán sin ser usados para los cálculos posteriores. Calcular la mecada submuestra es necesario hacer lo siguiente: a) Sustraer la media de la submuestra a cada uno de los k datos.

Elevar al cuadrado dichac) Obtener la suma de los cuadrados de las diferencias.

Capítulo 3: Procedimientos Estadísticos No Paramétricos 50

Page 60: Alternativa de Herramientas Estadísticas para el ...

5. A partir de este punto se utiliza el protocolo de la Prueba U de Mann – Whitney para obtener el estadístico de prueba U. Específicamente dentro de esta

adradas se eba anteriormente mencionada.

• El v . El

alor U se evalúa con la Tabla de Valores Críticos para el Estadístico U de Mann-Whi ney (Tabla 6, Anexos). Para que el valor U sea significativo, éste debe ser

u respectivo nivel de significancia, es decir, se chaza H si .

Esta prueba es un procedimiento no paramétrico que puede ser empleado en ruebas de hipótesis que involucran dos muestras independientes. Si el resultado e esta prueba es significativo, indica que existe diferencia entre las varianzas de

ncluir que existe una alta osibilidad de que las muestras representan poblaciones con diferentes varianzas.

o Los datos fueron obtenidos en formato de intervalo.

prueba, cada una de las m1 sumas de las diferencias cuconceptualiza como un dato n1 de la pru

Interpretación de los Resultados

alor más pequeño de U1 y U2 se designa como el estadístico de prueba Uv

tmenor o igual al valor de tablas en sre 0

3.2.4.7 La Prueba de Rangos Cuadrados (2 varianzas)

αUU ≤

pddos muestras, por lo que el investigador puede cop • Suposiciones

o Cada muestra ha sido seleccionada aleatoriamente de la población que representa.

o Las muestras son independientes una de la otra.

Hipótesis nula

22: σσ = 2H

11

• Procedimiento Dadas dos muestras n1 y n2, de tal forma que n1 + n2 = N observaciones:

. Convertir los datos de cada muestra en su desviación absoluta a la media, utilizando las siguientes ecuaciones:

1

Hipótesis alternativa 0

22: σσ ≠H 2

ó 22

211 : σσ >H

ó 22

211 : σσ <H

1

Capítulo 3: Procedimientos Estadísticos No Paramétricos 51

Page 61: Alternativa de Herramientas Estadísticas para el ...

1ii μ−= XU i= 1, … , n (3.42) 1

2μ−= ii XV i= 1, … , n2 (3.43)

Donde μ1 y μ2 son las medias de las Poblaciones 1 y 2 respectivamente. Si μ1 y μ2 son desconocidas las medias e de adas.

2. Todos los N datos convertidos se ordenan p ud, portar la muestra de la que provienen, de menor m

3. A cada dato se le asigna un rank, dándole en rank 1 al valor más pequeño, el r

nks.

6.

co de prueba.

d las muestras pue n ser usor magnit sin im

a ayor.

rank 2 al segundo más pequeño y así sucesivamente hasta asignarle al valomás grande el rank N (en caso de que no haya empates).

4. En caso de que exista un empate en dichos valores, se le asigna a cada uno de éstos el promedio de sus respectivos ra

5. Una vez que se ha ordenado todos los datos, se procede a elevar al cuadrado cada uno de ellos. Se suman los ranks cuadrados de la muestra 1.

7. Si no existieron empates, esta suma de los ranks cuadrados asignados a la muestra 1 pueden ser usados como el estadístiSi hay empates, la Ecuación 3.44 deberá ser utilizada como estadístico de prueba:

( ) 21

2221421

1

⎤⎡=

nnnnT

N

(3.44)

1 1)1( ⎥⎦

⎢⎣ −

−− ∑

2− RnT

=

Donde

RN

RNN i

i

2R representa el promedio de los ranks cuadrados bas muestras, y representa la suma de los ranks elevados a la cuarta potencia.

Para cia α si T es menor que el valor de tablas para α/2 o mayor que el de 1 - α/2.

) Para la prueba de la cola derecha, se rechaza H0 a un nivel de ue el valor de tablas de 1 – α.

c) Para la prueba de la cola izquierda, se rechaza H0 a un nivel de

3.2.

La Prueba de Rangos con Signo para Muestras Pareadas (Wilcoxon, 1945) es un procedimiento no paramétrico empleado en pruebas de hipótesis que involucran un diseño con dos muestras dependientes. Esta prueba es una extensión de la

de am∑ 4

iR

Interpretación de los Resultados

a) la prueba de dos colas, se rechaza H0 con un nivel de significan

bsignificancia α si T es mayor q

significancia α si T es menor que el valor de tablas de α.

4.8 Prueba de Rangos con Signo de Wilcoxon para Muestras Pareadas (Dependientes)

Capítulo 3: Procedimientos Estadísticos No Paramétricos 52

Page 62: Alternativa de Herramientas Estadísticas para el ...

Prueba de Rangos con Signo de Wilcoxon en su forma simple. Para emplear esta es necesario quprueba e cada uno de los n sujetos tengan dos registros en forma

e intervalo o proporción, habiendo sido cada dato obtenido bajo una de dos ddiferentes condiciones experimentales. La hipótesis evaluada por esta prueba es si en las poblaciones representadas por las muestras/condiciones experimentales, la mediana de la diferencia de los datos (representada por la notación Dθ ) es igual a cero. • Suposiciones

o La muestra de n sujetos ha sido aleatoriamente seleccionada de la población que representa.

o Los resultados originales obtenidos para cada uno de los sujetos están en el formato de intervalo o proporción.

ión de las diferencias en las poblaciones representadas por las muestras es simétrica alrededor de la mediana.

• eq

o nes experimentales debe ser aleatoria

o uno de los sujetos debe ser asignado aleatoriamente a una de las dos condiciones experimentales.

Hipótesis nula

o La distribuc

R uisitos

La presentación de las dos condicioo, si es apropiado, contrabalanceada. Dentro de cada par de sujetos pareados, cada

0: =DH θ ótesis alternativa

0

pHi0: ≠DH θ

ó 1

0:1 >DH θ ó

0:1 <DH θ

• Procedimie to Dadas una mu tra de n observaciones pareadas: 1. alcular las diferencias

n

es21 xxD −=C .

2. rdenar los valores absolutos de las diferencias |D|. 3. iguales a cero no se ordenan. Esto quiere decir que se elimina

quier sujeto que arroje una diferencia de cero. alores de las diferencias:

lor absoluto más pequeño, el con el se undo valor absoluto más pequeño y así

do al valor absoluto más

OLas diferencias del análisis cual

4. Se debe utilizar el siguiente protocolo al ordenar los vSe le asigna el rank 1 a la diferencia con el varank 2 a la diferencia gsucesivamente hasta que el rank más alto sea asigna

Capítulo 3: Procedimientos Estadísticos No Paramétricos 53

Page 63: Alternativa de Herramientas Estadísticas para el ...

grande. En caso de que exista un empate en dichos valores, se le asigna a cada uno de éstos el promedio de sus respectivos ranks.

5. Después de ordenar |D|, se coloca el signo de cada diferencia enfrente de su respectivo rank. Se registra la suma de los ranks con signo positivo +6. ΣR y la suma de los ranks con signo negativo −ΣR . La Ecuación 3.45 permite verificar la exactitud de estos valores. Si la relación expresada en esta ecuación no se obtiene, entonces se ha cometido un error al realizar los cálculos:

2)1( +

=Σ+ R (3.45)

• Si e

Σ −+ nnR

Interpretación de los Resultados

l valor de +ΣR es significativamente mayor que el valor −ΣR , esto indica que hay una alta bilidad de que la Condició blación con resultados (registros) más altos que la población representada por la Condición 2.

r

posi n 1 represente una po

−ΣR +ΣR ,Po otro lado, si el valor es mayor que esto quiere decir que existe alta 2 represente una población con resultados

egistros) más altos que la población representada por la Condición 1. posibilidad de que la Condición (r El valor absoluto del más pequeño de los valores +ΣR y −ΣR se designa como el estadístico de prueba Wilcoxon T (Tabla 5, Anexos). El valor T es interpretado usando la Tabla de Valores T Críticos para la Prueba Wilcoxon. Para que sea significativo, el valor obtenido de T debe ser menor o igual que el valor crítico T de tablas, en su respectivo nivel de significancia, es decir, se rechaza 0H si αTT ≤ .

ric ara d os ategóricos/nominales que se emplea en pruebas de hipótesis que involucran un iseño con k = 2 ó más muestras dependientes. Esta prueba se utiliza para analizar n experimento en el cual una muestra de n sujetos (o n conjuntos de sujetos

ndiente, es decir, los sultados en la variable dependiente deben caer dentro de una de dos

3.2.4.9 Prueba Q de Cochran (Proporciones Dependientes) La Prueba Q de Cochran (1950) es un procedimiento no paramét o p atcdupareados) es evaluada en una variable dicotómica deperecategorías mutuamente excluyentes). La prueba de hipótesis evalúa la proporción de respuestas de Tipo 1 en la población representada por las diferentes condiciones experimentales (por ejemplo, la proporción de respuestas “Sí” a una pregunta). • Suposiciones

o La muestra de n sujetos ha sido aleatoriamente elegida de la población que representa.

Capítulo 3: Procedimientos Estadísticos No Paramétricos 54

Page 64: Alternativa de Herramientas Estadísticas para el ...

o Los datos están en forma de una medida categórica dicotómica que os categorías mutuamente excluyentes.

o Si se emplean muestras pareadas, dentro de cada par de sujetos, cada los éstos debe ser asignado aleatoriamente a una de las k

condiciones experimentales. ip

involucra d

Requisitos

o La presentación de las dos condiciones experimentales debe ser aleatoria o, si es apropiado, contrabalanceada.

uno de

H ótesis nula kH ππππ ==== ...: 321

ótesis alternativa : Al menos hay un par

0

Hip1H qp ππ ≠

• m

aciones: Los valo s para representar las dos categorías mutuamente excluyentes en las que puede caer la respuesta de un individuo.

toria , donde Cj representa el número de respuestas Tipo 1

Procedi iento

Dadas k muestras de n observ

res 0 y 1 son empleado

jCΣ1. Realizar la sumaen la Condición j.

2. Elevar al cuadrado cada una de las sumatorias anteriores: ( )jCΣ .

3. Sumar los k ( )2CΣ datos:

2

( )∑ Σ 2C . j j

4. Sumar el número de puestas Tipo 1 del sujeto i: R . Realizar la sumatoria

∑R (El valor de ∑res i

( )∑ Σi iR deberá ser igual al valor de jC ).

ado una de las respuestas Tipo 1 del sujeto i: . Realizar

co

2iR5. Elevar al cuadr cada

2la sumatoria ∑ iR . 6. La Ecuación 3.46 es utilizada para calcular el estadísti de prueba Q:

RTkQ

−=

))(( (3.46)

donde C = ∑ 2

TCk − ])())()[(1 2k −(

Σ jC ;

T = ; R = .

( )∑ iR ∑ 2

iR

Capítulo 3: Procedimientos Estadísticos No Paramétricos 55

Page 65: Alternativa de Herramientas Estadísticas para el ...

• Interpretación de los Resultados

ara rechazar la hipótesis nula, el valor obtenido Q = χ2 debe ser mayor o igual ue el valor crítico de tablas de la distribución Chi Cuadrada (Tabla 4, Anexos), en respectivo nivel de significancia. Los grados de libertad utilizados deberán ser =

l Coeficiente Rho de Spearman (Spearman, 1904) es una medida de asociación ue se emplea con datos ordenados. Éste es una caso especial del Coeficiente e Pearson, una medida paramétrica. Aunque el Coeficiente de Correlación ρ

rma edida de stadística descriptiva que representa el nivel de relación entre dos o más

iones debe ser cierta: Los datos para ambas variables están en un formato ordenado. Los datos para una variable están en formato ordenado, para la otra están en

intervalo o proporción. Los datos para ambas variables están en un formato de intervalo o proporción.

Pqsudf k – 1. 3.2.4.10 Coeficiente de Correlación de Spearman (ρ de Spearman) Eqdde Spea n no es una prueba de estadística inferencial, es una mevariables (comúnmente X y Y). Con este coeficiente es posible hacer varias pruebas posteriores para evaluar una o más hipótesis que involucran la correlación de variables. El rango de valores para rs comprende desde -1 hasta 1 (-1 ≤ rs ≤ 1). Mientras el valor absoluto de rs se aproxima más a 1, la relación entre las variables es más fuerte. • Suposiciones Una de las siguientes suposic

un formato de

Hipótesis nula

0: =H 0 sρ

Hipótesis alternativa 0:1 =sH ρ

ó H 0:1 >sρ

ó 0:1 <sH ρ

• Procedimie Dadas dos muestras X y Y (variable independiente y variable de respuesta, respectivamente) de tamaño n:

nto

Capítulo 3: Procedimientos Estadísticos No Paramétricos 56

Page 66: Alternativa de Herramientas Estadísticas para el ...

1. os n datos de ambas variables se ordenan por magnitud, por separado. le asigna un rank, dándole en rank 1 al valor más pequeño, el

rank 2 al segundo más pequeño y así sucesivamente hasta asignarle al valor

es, se le asigna a cada uno el promedio de sus

L2. A cada dato se

más grande el rank n (en caso de que no haya empates). En caso de que exista un empate en estos valorrespectivos ranks.

3. Una vez que se han ordenado y asignado los ranks a los datos de las variables, se procede a restar cada uno ellos, como se muestra en la Ecuación 3.47:

yx RRd −= (3.47) Cabe señalar que la suma de estas diferencias (Σd) debe ser igual a cero. Elevar al cuadrado4. cada diferencia de rank. Sumar estos valores (Ecuación 3.48):

∑ 2d (3.48) 5. Calcular la Rho de Spearman, utilizando la Ecuación 3.49:

)1(6

12

−= 2 −∑nns

El valor obtenido de rs se compara con la Tabla de Valores Críticos para la Rho de Spearman, para una o dos colas ie hipótesis alternativa establecida. La hipótesis nula puede ser rechazada si valor absoluto obtenido de rs es mayor o igual que el valor de tablas, al nivel de significancia deseado.

3.2 .2.5.1 Gráficas de Control EWMA (Promedio Móvil Ponderado Exponencialmente)

a Gráfica de Control de Promedio Móvil Ponderado Exponencialmente c glas en inglés), introducida por Roberts (1958), es

na alternativa muy usada para las Gráficas de Control de Shewhart, cuando se

tilizada para observaciones individuales, además, al ser considerada como un

. Definir los parámetros de la gráfica EWMA:

os parámetros de diseño del gráfico EWMA son el múltiplo de sigma usado en los i L) y el valor de λ. Se eligen ambos parámetros con el objetivo

dr (3.49)

• Interpretación de los Resultados

, depend ndo de la

.5 Control

3 L(cono ido como EWMA, por sus siutiene especial interés en detectar pequeños cambios. La EWMA generalmente esupromedio ponderado de todas las observaciones pasadas y las actuales, es altamente insensible al supuesto de normalidad (Montgomery, 2004). • Procedimiento 1

Llím tes de control (

Capítulo 3: Procedimientos Estadísticos No Paramétricos 57

Page 67: Alternativa de Herramientas Estadísticas para el ...

de obtener un desempeño de la ARL para detectar cambios pequeños. La ARL o o promedio de puntos que deben

grafi antes de que un punto indique una condición fuera de control.

MA. El rocedimiento de diseño óptimo sería especificar las ARL’s bajo control y fuera de

n de manera adecuada, particularmente con el valor más rande de λ. Cuando λ es pequeña (≤ 0.1) es más adeudado reducir la anchura

na ARL ≅ 500 y para detectar cambios de una desviación estándar en la media,

Longitud Promedio de la Corrida es el númercarse

Existen diversos estudios teóricos de la longitud promedio de la corrida y sus propiedades con respecto a la EWMA. En éstos se presentan las tablas o gráficas de la ARL para cierto rango de valores de L y λ. En la Tabla 3 en los Anexos, se muestra el desempeño de la ARL para varios esquemas de control de la EWpcontrol, así como la magnitud del cambio en el proceso anticipada, para, de esta manera, seleccionar la combinación de ambos parámetros que proporcione la ARL deseado. Se ha encontrado que los valores de λ que se encuentran dentro del intervalo 0.05 ≤ λ ≤ 0.25 funcionan bien en la práctica. Las más utilizadas son λ = 0.05, λ = 0.10 y λ = 0.20. Por otra parte, L = 3, los límites 3 sigma comúnmente usados, funcionan tambiégde los límites, usando un valor de L entre 2.6 y 2.8 (Montgomery, 2004). Lo que se espera con la selección de estos parámetros es, bajo control, una ARL ≅ 500 y, para detectar cambios de una desviación estándar en la media, una ARL1 ≅ 10.3. Hunter (Montgomery, 2004) ha sugerido escoger una λ de tal manera que la ponderación otorgada a las observaciones actuales y anteriores coincida con las ponderaciones en una gráfica de Shewhart con las reglas de Western Electric. Por tanto, los valores recomendados serían λ = 0.4 y L = 3.054, con lo que se tendríauuna ARL1 ≅ 14.3. 2. Obtener el promedio móvil ponderado exponencialmente, que se define por

la Ecuación 3.50:

1)1( −−+= iii zxz λλ (3.50)

u l objetivo del proceso, de tal forma que

donde 0 < λ ≤ 1 es una constante, y su valor inicial, requerido con la primer

estra en i = 1, es e 00 μ=zm . También es lizar el promedio de datos prelim res c lor inicial de la EWMA,

or tanto quedaría como común uti ina omo va

xz =0p .

u c Al sustituir recursivamente para jiz − , j= 2, 3, … t, se obtiene la Ec a ión 3.51:

∑−

=0ji

ab za σ2, entonces la varianza de zi está dada por la Ecuación 3.52:

− −+−=1

0

)1()1(i

j

iji zxz λλλ (3.51)

Si las observaciones xi son vari les aleatorias independientes con varian

Capítulo 3: Procedimientos Estadísticos No Paramétricos 58

Page 68: Alternativa de Herramientas Estadísticas para el ...

[ ]izi222 )1(1

λλσσ −−⎟

⎠⎞

⎜⎝⎛

−=

El gráfico EWMA se construye graficando i, o contra el tiempo. La línea central está d control está dado por la Ecuación 3.53:

(3.52)

3. Establecer los límites de control:

zi contra el número de muestra ada por μ0. El límite superior de

[ ]iLLSC 20 2

⎜⎝ −

)11 λλ

λσμ −−⎟⎠⎞⎛+= (3.53) (

El límite inferior de control se obtiene mediante la Ecuación 3.54:

[ ]iLLIC 20 )1(1

λλσμ −−⎟

⎠⎞

⎜⎝⎛

−−= (3.54)

onde L es la anchura de los límites de control.

El término

d

[ ]i2)1(1 λ−− en las Ecuaciones 3.53 y 3.5 a i crece. Esto significa que después de que la gráfica ha est e varios periodos de tiempo, los límites de control tenderán al estado estable, cuyos

4 tiende a 1 conforme lado operando durant

valores están dados por:

⎟⎠

⎜⎝ −

+=λ

σμ20 LC (3.55)

⎞⎛ λLS

⎟⎠⎞⎛=

λLIC ⎜⎝ −

−λ

σμ20 L (3.56)

Como se mencionó anteriormente, la gráfica EWMA se usa comúnmente con mediciones individuales. Sin embargo, si onales de tamaño n > 1, se sustituye con

se utilizan subgrupos raci σ con nσσ = en las ix ix y x ecuaciones

nteriores.

a 3.3 Síntesis del Capítulo Como se mencionó en el Capítulo 2, es importante recordar que mientras en la

stadística paramétrica se prueban medias, en la no paramétrica se manejan edianas. Así, en la Tabla 3.7 se hace una breve síntesis de algunos de los

ún el tipo de prueba a realizar.

emprocedimientos expuestos, seg

Capítulo 3: Procedimientos Estadísticos No Paramétricos 59

Page 69: Alternativa de Herramientas Estadísticas para el ...

Tabla 3.7: Síntesis de Pruebas No Paramétricas

Después de presentar los procedimientos para diversas pruebas no paramétricas, es posible apreciar la simplicidad de los cálculos, ya que solamente se realizan operaciones como sumatorias y rankeo de los datos. Cabe señalar que existe una gran variedad de ionales a las aquí

ropuestas; sin embargo, fueron seleccionadas aquéllas cuya aplicabilidad y

herramientas no paramétricas adic

prestricciones son más sencillas de poner en práctica.

Capítulo 3: Procedimientos Estadísticos No Paramétricos 60

Page 70: Alternativa de Herramientas Estadísticas para el ...

CAPÍTULO 4

APLICACIÓN Este capítulo en particular tiene el objetivo de aplicar a una situación real, tomada de una empresa, algunos de los procedimientos no paramétricos presentados en el Capítulo 3 de esta tesis. De la misma manera, se hace una comparación de las herramientas no paramétricas utilizadas y sus equivalentes paramétricos para marcar la diferencia entre los resultados obtenidos. Por razones de confidencialidad, se omiten tanto la identidad de la empresa, como los datos originales, recolectados directamente de sus procesos. Para llevar a cabo el análisis se utilizó un paquete computacional especializado en estadística, Minitab®, así como hojas de cálculo en Excel®. Debido a la naturaleza de la problemática tratada, y siendo el tiempo un limitante, se presentan únicamente las fases de Definición, Medición y Análisis. Cabe señalar que, a pesar de que los datos empleados no cumplían con el requisito de normalidad, ni pudieron ser transformados, se decidió también utilizar para su análisis los procedimientos paramétricos estándar, con el objetivo de contrastar los resultados obtenidos. La información recolectada para la realización de este análisis fue tomada de los procesos de una organización de clase mundial, dedicada al desarrollo, fabricación y comercialización de productos de acero recubierto. Éstos son utilizados como materia prima para productos de línea blanca, teniendo como clientes a empresas reconocidas internacionalmente (Cabriales & González, 2006). El problema se encuentra en la Línea de Pintado 1, donde la mayoría de los procesos cuentan con sensores que registran su desempeño, conectados a un equipo de instrumentación que a la vez se conectan a un PLC central, donde se captura la información. Otros datos son capturados manualmente por el personal que trabaja directamente en el proceso. Por estudios previos, existe la teoría de que la adherencia de la pintura está relacionada con la variable brillo, por lo que ésta se considera una variable importante.

Capítulo 4: Aplicación 61

Page 71: Alternativa de Herramientas Estadísticas para el ...

4.1 Definición 4.1.1 Introducción a la Problemática Debido a que la producción de la Línea de Pintado 1 está destinada a clientes que producen artículos de línea blanca, se tiene un especial interés en cumplir las especificaciones. Actualmente se tiene como problemática el bloqueo (desprendimiento de pintura) en el Producto X, que se presenta en forma de despostille o imperfección en la superficie anterior de la lámina (Cabriales & González, 2006), como se muestra en la Figura 4.1:

Figura 4.1: Lámina con Bloqueo en la Parte Posterior Adaptada de Cabriales & González, 2006

Para corregir estas fallas, la lámina es reprocesada, generando desvío de material, desperdicios y costos adicionales. 4.1.2 Definición • Problema:

¿Qué? Alto número de kilogramos de lámina rechazados por bloqueo. ¿Cuándo? Todo el tiempo. ¿Dónde? En el área de pintado (Línea de Pintado 1). ¿Qué tanto? Aproximadamente 157 kilogramos. ¿Cómo lo sé? Según reportes de producción.

Alto número de kilogramos de lámina rechazados por bloqueo, en la Línea de Pintado 1. Actualmente se tienen 157 kilogramos rechazados, según los reportes de producción, cuando la meta del departamento es de 78 kilogramos.

Capítulo 4: Aplicación 62

Page 72: Alternativa de Herramientas Estadísticas para el ...

• Objetivo: Identificar las variables críticas que incrementan la cantidad de kilogramos rechazados.*

• Macromapa:

Figura 4.2: Macro mapa, Línea de Pintado 1 4.2 Medición con Procedimientos No Paramétricos 4.2.1 Proceso El proceso bajo análisis se lleva a cabo en la Línea de Pintado 1, un sistema continuo de producción donde se aplican los esmaltes a las láminas de acero a lo largo de operaciones intermedias, como se observa en la Figura 4.3.

Figura 4.3: Proceso de Producción Láminas

* Por cuestiones de confidencialidad, los datos financieros han sido omitidos.

Capítulo 4: Aplicación 63

Page 73: Alternativa de Herramientas Estadísticas para el ...

Desenrollado l proceso comienza con la recepción del rollo de acero galvanizado, el cual se

montándolo en el desenrrollador. Con el objetivo de no

ara asegurar una buena aplicación y adherencia de la pintura, la lámina se proceso de lavado, donde se eliminan residuos, aceite, polvo u otro

na vez limpia, la lámina pasa por el proceso de cromatado. Éste es un mico por medio de ácido crómico, aplicado al hacer contacto

l proceso de pintado se lleva a cabo en dos etapas, la pintura base y la pintura .

tapa se aplica una pintura base o fondo. La lámina pasa a través e la pintadora, por un sistema de rodillos impregnados del color primario con un

orno, que genera calor a avés de lámparas infrarrojas distribuidas en su interior. La lámina es conducida en

lámina otra capa de esmalte, ahora en la intadora de acabado, de acuerdo a las especificaciones del cliente. Este

ad que asegure una buena aplicación; ésta ide el grado de resistencia a fluir de la pintura. Se utiliza la copa Zhan como

Eintroduce a la líneainterrumpir el flujo continuo de lámina, el final de un rollo en proceso se engrapa con la punta inicial de otro. Lavado

Psomete a uncontaminante presente. Esto se hace a lo largo de una serie de tanques que dispersan el agua caliente a presión en ambas paredes de la lámina. Cromatado

Utratamiento quícon un sistema de rodillos. El secado se realiza enseguida con un soplador de aire caliente. Este ácido actúa como agente adherente de la pintura en la lámina, de no ser así el esmalte se desprendería al ejercer la mínima presión sobre ésta. Pintado

Ede acabado En la primera edtubo dosificador. Esta dosificación garantiza que los rodillos siempre tengan pintura cuando el producto está en contacto con ellos. Una vez aplicada la pintura primaria, ésta se seca en el htrel interior del horno, donde recibe el calor para producir el curado de la pintura. La especificación de la temperatura está dada por el proveedor de pintura y es medida a la salida del horno, utilizando un termómetro. De esta manera, si se requiere mayor temperatura dentro del horno, se incrementa el voltaje en las lámparas y viceversa. Para enfriar la lámina a la salida del horno, se le dispersa agua fría dentro del tanque quench. En la segunda etapa se aplica a la pproceso es igual al anterior. El secado se lleva a cabo en el horno de acabado que opera de la misma forma que el horno de pintado base. Enseguida se enfría en el tanque quench de acabado. La pintura debe tener cierta viscosidmmedidor, un dispositivo en forma de copa con un orificio en la parte inferior, ésta se sumerge en el depósito de pintura, se llena y se retira del depósito con el fin de

Capítulo 4: Aplicación 64

Page 74: Alternativa de Herramientas Estadísticas para el ...

cronometrar el tiempo en que se vacía la pintura contenida. Los segundos registrados equivalen a la viscosidad de la pintura (Cabriales & González, 2006) Inspección

da en ambas etapas avanza a la salida de la Línea de Pintura1,

pintura. Tomándose una

entro del proceso, en cada corrida se miden, entre otros: ierdo, centro y lado

b)

da.

ilésimas de pulgada.

.2.2 Pruebas de Normalidad

tilizando Minitab, se llevó a cabo la prueba de bondad de ajuste Anderson –

La lámina pintadonde vuelve a ser enrollada. En esta parte del proceso se realiza un muestreo de lámina, con el objetivo de realizar las pruebas de calidad pertinentes para verificar que se cumplan los requerimientos del cliente. Algunas pruebas de calidad verifican el brillo de la muestra de lámina pintada, se detecta la reflectancia de la pintura ante un haz de luz emitido. Otra prueba consiste en medir la capa de acabado de la pintura, para ello se toma la lámina muestra y se mide su espesor con un micrómetro, posteriormente se decapa en un punto hasta dejar el acero galvanizado y se mide la diferencia de espesor de la capa. Para pasar esta prueba, no deberá existir diferencia entre la capa de acabado y la decapa. Da) El brillo, medido en tres puntos diferentes: lado izqu

derecho. Se mide tanto la cara superior (CS) como la cara inferior (CI). La temperatura del metal, en grados centígrados.

c) La velocidad de la línea, en pies / minuto. d) El espesor del acero, en milésimas de pulgae) Viscosidad, en segundos. f) Espesor de la pintura, en mg) Kilogramos rechazados. 4 UDarling, para la variable de respuesta y las variables independientes bajo análisis. Ésta se lleva a cabo en el menú de Stat/Basic Statistics/Normality Test, desplegando la pantalla mostrada en la Figura 4.4:

Figura 4.4: Diálogo de Prueba de Normalidad

Capítulo 4: Aplicación 65

Page 75: Alternativa de Herramientas Estadísticas para el ...

En ésta es necesario especificar las variables a analizar y la prueba deseada. Las

Hipótesis nula 2σμ para todos los valores de X.

Hipótesis alternativa para al menos un valor de X.

os resultados arrojados fueron los siguientes:

Figura 4.5: Resultados Prueba de Normalidad Variables bajo Análisis

hipótesis que maneja esta prueba son:

~)(:0 NXFH ),(

),(~)(: 21 σμNXFH /

L

Temp. Metal

Perc

ent

270260250240230

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

250.9StDev 6.922N 302AD 28.268P-Value

Probability Plot of Temp. MetalNormal

Kilos Rechazados

Perc

ent

225200175150125100

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

156.8StDev 23.16N 302AD 46.990P-Value

Probability Plot of Kilos RechazadosNormal

viscosidad (segundos)

Perc

ent

3025201510

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

21.06StDev 3.177N 302AD 5.197P-Value

Probability Plot of Viscosidad (segundos)Normal

Capítulo 4: Aplicación 66

Page 76: Alternativa de Herramientas Estadísticas para el ...

Figura 4.5: Resultados Prueba de Normalidad Variables bajo Análisis (Continuación) Como nor al

ivel de significancia, por lo que se rechazó la hipótesis nula, concluyendo que los nor al

ivel de significancia, por lo que se rechazó la hipótesis nula, concluyendo que los

Figura 4.6: Resultados de la Prueba de Normalidad para Brillo

puede observarse en la Figura 4.5, en todos los casos el p-valor es me todos los casos el p-valor es mennkilogramos rechazados, la temperatura del metal, la viscosidad, el espesor de la pintura, el espesor del acero y la velocidad de la línea no se distribuyen normalmente. Lo mismo sucede con la variable brillo, en sus seis mediciones, como puede observarse en la Figura 4.6.

kilogramos rechazados, la temperatura del metal, la viscosidad, el espesor de la pintura, el espesor del acero y la velocidad de la línea no se distribuyen normalmente. Lo mismo sucede con la variable brillo, en sus seis mediciones, como puede observarse en la Figura 4.6.

Figura 4.6: Resultados de la Prueba de Normalidad para Brillo brillo-ci3

Perc

ent

1009590858075

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

86.47StDev 3.881N 302AD 10.055P-Value

Probability Plot of brillo-ci3Normal

brillo-ci2

Perc

ent

1009590858075

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

86.50StDev 3.827N 302AD 9.393P-Value

Probability Plot of brillo-ci2Normal

brillo-ci1

Perc

ent

1009590858075

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

86.37StDev 4.061N 302AD 11.457P-Value

Probability Plot of brillo-ci1Normal

brillo-cs3

Perc

ent

10095908580

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

91.75StDev 3.275N 302AD 8.303P-Value

Probability Plot of brillo-cs3Normal

brillo-cs2

Perc

ent

10510095908580

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

91.74StDev 3.302N 302AD 8.006P-Value

of brillo-cs2Normal

Probability Plot

brillo-cs1

Perc

ent

10510095908580

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

92.04StDev 3.427N 302AD 7.871P-Value

Normal Probability Plot of brillo-cs1

Vel.Linea (ft/min)

Perc

ent

11511010510095908580

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

97.40StDev 4.869N 302AD 42.476P-Value

Probability Plot of Vel.Linea (ft/min)Normal

Espesor Pintura (milesimas de p

Perc

ent

0.850.800.750.700.650.60

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

0.7278StDev 0.04083N 302AD 41.845P-Value

Probability Plot of Espesor Pintura (milesimas de pNormal

Espesor Acero (milesimas de pul

Perc

ent

0.0250.0240.0230.0220.0210.020

99.9

99

9590

80706050403020

10

5

1

0.1

Mean

<0.005

0.02248StDev 0.0006957N 302AD 17.303P-Value

Probability Plot of Espesor Acero (milesimas de pulNormal

Capítulo 4: Aplicación 67

Page 77: Alternativa de Herramientas Estadísticas para el ...

Debido a que t normales, y las

omo se mencionó en el principio de este capítulo, el brillo es considerado un

os límites de especificación para el brillo son:

niendo esto en cuenta, se procedió a calcular la media, desviación estándar,

odas las variables bajo estudio resultaron ser no opciones para normalizarlos no funcionaron, la forma adecuada de proceder es realizar las pruebas pertinentes aplicando procedimientos no paramétricos. 4.2.3 Capacidad del Proceso en la Variable Brillo Cfactor importante en la adherencia de la pintura, por lo que la capacidad de este proceso fue analizada. El procedimiento no paramétrico para obtener la habilidad de un proceso es el desarrollado a partir de las Curvas de Pearson. Este método no se encuentra en Minitab, pero en realidad es sencillo de aplicar, por lo que puede emplearse cualquier hoja de cálculo, como Excel. L Cara superior: 85 – 100. Cara inferior: 90 – 100.

Tesesgo y curtosis de los datos, así como la localización de los percentiles estandarizados inferior y superior y la mediana estandarizada en la Tablas 1a, 1b y 2 de las Curvas de Pearson, en la sección de Anexos.

Datos BCS BCI M 2edia 91.84 86.447 Desv. Std. 3.290 3.881 Sesgo -0.970 0.092 Curtosis 1.348 -1.018 PI' 4.290 1.840 PS' 1.713 2.065 M' 0.169 0.031

Tabla 4.1: Información Preliminar para lo de acidad del Proceso

na vez obtenidos los datos de la Tabla 4.1, se procedió al cálculo de los

el Cálcu la Cap

Upercentiles estimados inferior y superior y la mediana estimada, utilizando las Ecuaciones 3.10, 3.11 y 3.12, respectivamente. Los resultados se presentan en la Tabla 4.2, además de los límites de especificación inferior y superior.

Datos BCS BCI P 9I 77.72 79.306 PS 97.477 94.462 M 92.398 86.567 LIE 85.000 90.000 LSE 100.000 100.000

Tabla 4.2: Datos Previos al Cálculo de la C del Proceso apacidad

Capítulo 4: Aplicación 68

Page 78: Alternativa de Herramientas Estadísticas para el ...

Empleando las Ecuaciones 3.13, 3.14, 3.15 y 3.16, se obtienen la Capacidad Potencial y Real del Proceso.

Capacidad del BCS BCI

Proceso Cp 0.760 0.660 Cpi 0.504 -0.473 Cps 1.497 1.702 Cpk 0.504 -0.473

Tabla 4.3: C ad Rea nc roceso

bservando la información presentada en la Tabla 4.3, se puede concluir que el

apacid l y Pote ial del P

Oproceso tiene un desempeño pobre en lo que se refiere al cumplimiento de las especificaciones del cliente, ya que, tanto para la cara superior como para la inferior, la capacidad real e incluso la potencial tienen un valor menor a 1. 4.3 Análisis con Procedimientos No Paramétricos 4.3.1 Gráficos de Dispersión

n primer lugar, se realizaron las gráficas de dispersión de las variables contra los Ekilogramos rechazados, para conocer el comportamiento de los datos.

Capítulo 4: Aplicación 69

Page 79: Alternativa de Herramientas Estadísticas para el ...

Ancho (pulgadas)

Kilo

s R

echa

zado

s

36.436.236.035.835.635.435.235.0

230

220

210

200

190

180

170

160

150

140

Scatterplot of Kilos Rechazados vs Ancho (pulgadas)

Vel.Linea (ft/min)

Kilo

s R

echa

zado

s

1061041021009896949290

230

220

210

200

190

180

170

160

150

140

Scatterplot of Kilos Rechazados vs Vel.Linea (ft/min)

Espesor Acero (milesimas de pul

Kilo

s R

echa

zado

s

0.0250.0240.0230.0220.021

230

220

210

200

190

180

170

160

150

140

Scatterplot of Kilos Rechazados vs Espesor Acero (milesimas de pul

Temp.Metal (°C)Ki

los

Rec

haza

dos

260255250245240235230

230

220

210

200

190

180

170

160

150

140

Scatterplot of Kilos Rechazados vs Temp.Metal (°C)

viscosidad (segundos)

Kilo

s R

echa

zado

s

30.027.525.022.520.017.515.0

230

220

210

200

190

180

170

160

150

140

Scatterplot of Kilos Rechazados vs viscosidad (segundos)

brillo-cs1

Kilo

s R

echa

zado

s

100959085

230

220

210

200

190

180

170

160

150

140

Scatterplot of Kilos Rechazados vs brillo-cs1

brillo-cs2

Kilo

s R

echa

zado

s

100959085

230

220

210

200

190

180

170

160

150

140

Scatterplot of Kilos Rechazados vs brillo-cs2

brillo-cs3

Kilo

s R

echa

zado

s

989694929088868482

230

220

210

200

190

180

170

160

150

140

Scatterplot of Kilos Rechazados vs brillo-cs3

Figura 4.7: Gráficas de Dispersión Variables vs Kilogramos Rechazados

Capítulo 4: Aplicación 70

Page 80: Alternativa de Herramientas Estadísticas para el ...

Scatterplot of Kilos Rechazados vs brillo-ci2Scatterplot of Kilos Rechazados vs brillo-ci1

Figura 4.7: Gráficas de Dispersión Variables vs Kilogramos Rechazados (Continuación) Debido a que todas las variables presentan un comportamiento lineal respecto a los kilogramos rechazados, es conveniente obtener el coeficiente de correlación, para conocer el grado de relación entre dichas variables. 4.3.2 Correlación Utilizando Minitab, en el menú de Stat/Basic Statistics/Correlation, encontramos la pantalla que se muestra en la Figura 4.8.

Figura 4.8: Pantalla Coeficiente de Correlación en Minitab

En ella se especifican las variables de las cuales se desea conocer el coeficiente de correlación. Los resultados obtenidos se muestran en la Tabla 4.4.

brillo-ci1

Kilo

s R

echa

zado

s

98969492908886848280

230

220

210

200

190

180

170

160

150

140

brillo-ci2

Kilo

s R

echa

zado

s

230

220

210

200

190

180

170

160

150

140

98969492908886848280

Scatterplot of Kilos Rechazados vs brillo-ci3

brillo-ci3

Kilo

s R

echa

zado

s

230

220

210

200

190

180

170

160

150

140

98969492908886848280

Capítulo 4: Aplicación 71

Page 81: Alternativa de Herramientas Estadísticas para el ...

Variable Correlación

Kg Rechazados

Ancho 0.038 Vel. Línea 0.096 Espesor Acero -0.118 Temp. Metal -0.898 Viscosidad 0.293 Espesor Pintura 0.173 Brillo-cs1 -0.287 Brillo-cs2 -0.294 Brillo-cs3 -0.306 Brillo-ci1 0.009 Brillo-ci2 -0.030 Brillo-ci3 -0.015

Tabla 4.4: Correlación de Kilogramos Rechazados vs Variables Lámina Como puede observarse en esta tabla, la variable que presenta una relación estrecha con los kilogramos rechazados, de acuerdo al coeficiente de correlación, es la temperatura del metal, con un valor de 0.898. Las variables de brillo en la cara superior tienen una correlación relativamente fuerte en comparación con las otras variables, alrededor de 0.3, al igual que la variable viscosidad. Por el contrario, la variable brillo en la cara inferior presenta correlaciones pequeñas, alrededor de 0.02; sin embargo, debido a la teoría que sostiene que la variable brillo influye en los kilogramos de producto rechazados, el análisis se llevó a cabo revisando ésta, además de la temperatura y viscosidad. El proceso a seguir en este análisis fue el siguiente:

a) Verificar si el nivel de brillo en la cara superior y en la cara inferior presenta diferencias significativas.

b) Verificar la estabilidad del proceso, con respecto a la variable brillo, a

través de gráficas de control, obteniendo así los puntos que están fuera de los límites.

c) Si existen puntos fuera de control con la variable brillo, evaluar si hay una

diferencia significativa entre los kilogramos rechazados en estos puntos, y los kilogramos rechazados en los puntos dentro de control, para ambas caras de la lámina.

d) Verificar si existe diferencia significativa entre los kilogramos rechazados en

los puntos fuera de control en las caras superior e inferior.

e) Evaluar si existe diferencia entre los kilogramos rechazados a diferentes niveles de temperatura.

Capítulo 4: Aplicación 72

Page 82: Alternativa de Herramientas Estadísticas para el ...

f) Evaluar si existe diferencia entre los kilogramos rechazados a diferentes

niveles de viscosidad.

g) Finalmente, verificar si los kilogramos rechazados a diversas temperaturas y viscosidades interactúan entres sí.

4.3.3 Comparación de Medianas de la Variable Brillo En esta parte del análisis, se compararon las medianas de los niveles de brillo en la cara superior y en la inferior. Las hipótesis fueron: Hipótesis nula

BCIBCSH θθ =:0 Hipótesis alternativa

BCIBCSH θθ ≠:1 El procedimiento para comparar dos medianas es la prueba Mann – Whitney, la cual podemos encontrar en Minitab, en el menú de Stat/Nonparametrics/Mann-Whitney. La Figura 4.9 es el cuadro de diálogo de esta prueba, en el cual deben especificarse las muestras que desean evaluarse. Para este caso, la primer muestra fue la media de las tres mediciones de brillo en la cara superior, y la segunda, la media de las tres mediciones en la cara inferior.

Figura 4.9: Pantalla de la Prueba Mann - Whitney

Los resultados arrojados por la prueba se muestran a continuación:

Capítulo 4: Aplicación 73

Page 83: Alternativa de Herramientas Estadísticas para el ...

Mann-Whitney Test and CI: prom cs, prom ci N Median prom cs 302 92.000 prom ci 302 86.000 Point estimate for ETA1-ETA2 is 5.667 95.0 Percent CI for ETA1-ETA2 is (5.000,6.333) W = 124987.0 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0000The test is significant at 0.0000 (adjusted for ties)

Figura 4.10: Resultados de la Prueba Mann – Whitney Como puede observarse en la Figura 4.10, el p-value es menor al nivel de significancia del 5%, por lo que se rechaza la hipótesis nula. Hay evidencia estadística para concluir que existe una diferencia importante entre los niveles de brillo de la cara superior y la cara inferior de la lámina. 4.3.4 Gráfico de Control EWMA Este procedimiento no paramétrico tampoco está incluido en Minitab, pero, al igual que la capacidad del proceso, es sencillo de calcular. Tomando como parámetros de la EWMA una λ = 0.2 y una L = 3 (valores recomendados por Montgomery, 2004), como μ0 la media los datos recolectados y empleando las Ecuaciones 3.50, 3.52, 3.53 y 3.54 para obtener la zi (variable a ser graficada), la varianza de cada observación y los límites de control, se obtuvieron los siguientes resultados para cada variable:

Capítulo 4: Aplicación 74

Page 84: Alternativa de Herramientas Estadísticas para el ...

Tabla 4.5: Resultados de los Cálculos para EWMA Brillo Cara Superior∗

Tabla 4.6: Resultados de los Cálculos para EWMA Brillo Cara Inferior∗

∗ Se incluyen solamente 20 observaciones, por razones de confidencialidad.

Capítulo 4: Aplicación 75

Page 85: Alternativa de Herramientas Estadísticas para el ...

Como puede observarse en las Tablas 4.5 y 4.6, para la observación 15 ya los límites superior e inferior de control se han estabilizado. Graficando la zi de cada cara, se obtuvieron las siguientes gráficas:

EWMA para Brillo Cara Superior

82.00

84.00

86.00

88.00

90.00

92.00

94.00

96.00

98.00

0 50 100 150 200 250 300 350

Datos

Límite

s de

Con

trol

Figura 4.11: EWMA para Cara Superior

EWMA para Brillo Cara Inferior

78.00

80.00

82.00

84.00

86.00

88.00

90.00

92.00

94.00

96.00

0 50 100 150 200 250 300 350

Datos

Límite

s de

Con

trol

Figura 4.12: EWMA para Cara Inferior

Tanto en la Figura 4.11 como en la 4.12, se puede apreciar la gran cantidad de puntos fuera de control. En la Tabla 4.7 se especifican el número de puntos fuera y dentro de control para cada caso.

Capítulo 4: Aplicación 76

Page 86: Alternativa de Herramientas Estadísticas para el ...

Control Fuera Dentro

BCS 152 150 BCI 240 62

Tabla 4.7: Puntos Fuera y Dentro de Control, Variable Brillo Con lo anterior, se tiene evidencia suficiente para concluir que el proceso es altamente inestable en cuanto al nivel de brillo en la lámina, para ambas caras, encontrándose fuera de control. 4.3.5 Comparación de Kilogramos Rechazados en Puntos Dentro y Fuera

de Control en la Variable Brillo Para la realización esta prueba de hipótesis, se clasificó cada observación de brillo como fuera o dentro de los límites de control, asignándole a cada una los kilogramos rechazados que le correspondían. De esta manera, para la cara superior, se establecieron las siguientes hipótesis: Hipótesis nula

KgCSDKgCSFH θθ =:0 Hipótesis alternativa

KgCSDKgCSFH θθ ≠:1 En Minitab se condujo una prueba de medianas Mann – Whitney, teniendo los siguientes resultados: Mann-Whitney Test and CI: Dentro CS, Fuera CS N Median Dentro CS 150 148.00 Fuera CS 152 149.00 Point estimate for ETA1-ETA2 is -2.00 95.0 Percent CI for ETA1-ETA2 is (-4.00,0.00) W = 20685.0 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0072The test is significant at 0.0069 (adjusted for ties)

Figura 4.13: Resultados Mann – Whitney Kilogramos Dentro y Fuera, Cara Superior El p-value es menor que el nivel de significancia de 5%, por lo que se rechaza la hipótesis nula, es decir, hay evidencia de que existe una diferencia significativa entre los kilogramos rechazados en los puntos fuera de control y los puntos dentro de control para la variable brillo. Esto indica que el brillo en la cara superior es un factor que influye en el rechazo del producto. Ahora bien, para la cara inferior, se establecieron las siguientes hipótesis:

Capítulo 4: Aplicación 77

Page 87: Alternativa de Herramientas Estadísticas para el ...

Hipótesis nula

KgCIDKgCIFH θθ =:0 Hipótesis alternativa

KgCIDKgCIFH θθ ≠:1 Al correr la prueba Mann – Whitney en Minitab se obtuvo: Mann-Whitney Test and CI: Dentro CI, Fuera CI N Median Dentro CI 62 148.00 Fuera CI 240 149.00 Point estimate for ETA1-ETA2 is -1.00 95.0 Percent CI for ETA1-ETA2 is (-3.00,-0.00) W = 8605.5 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.1992The test is significant at 0.1973 (adjusted for ties)

Figura 4.14: Resultados Mann – Whitney Kilogramos Dentro y Fuera, Cara Inferior El p-value es mayor al 0.05 del nivel de significancia, por lo que no se rechaza la hipótesis nula. Esto significa que no existe diferencia entre los kilogramos rechazados en los puntos fuera de control y los puntos dentro de control en la variable brillo para la cara inferior, por lo que ésta puede considerarse como un factor que no afecta en el rechazo de las láminas. 4.3.6 Comparación de Kilogramos Rechazados en Puntos Fuera de Control

para la Variable Brillo en la Cara Superior y Cara Inferior Ahora se procedió a comparar los kilogramos rechazados pertenecientes a los puntos fuera de control en la variable brillo, para ambas caras, estableciendo las hipótesis como Hipótesis nula

KgCIFKgCSFH θθ =:0 Hipótesis alternativa

KgCIFKgCSFH θθ ≠:1 El resultado arrojado por la prueba Mann – Whitney fue:

Capítulo 4: Aplicación 78

Page 88: Alternativa de Herramientas Estadísticas para el ...

Mann-Whitney Test and CI: Fuera CS 1, Fuera CI 1 N Median Fuera CS 1 152 149.00 Fuera CI 1 240 149.00 Point estimate for ETA1-ETA2 is 0.00 95.0 Percent CI for ETA1-ETA2 is (-0.00,2.00) W = 31076.0 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.2693The test is significant at 0.2674 (adjusted for ties)

Figura 4.15: Resultados Mann – Whitney Kilogramos con Brillo Fuera de Control, Ambas Caras El p-valor, resaltado en la Figura 4.15, es mayor al nivel de significancia, por lo que la hipótesis nula no se rechaza. Esto da pie para concluir que el comportamiento de los kilogramos de producto rechazado debido al brillo, por ambas caras, no tienen diferencia laguna cuando está fuera de especificación. 4.3.7 Comparación de Kilogramos Rechazados a Diferentes Temperaturas Para llevar a cabo este análisis, fue necesario clasificar el rango de temperaturas en cuartiles, quedando de la siguiente manera:

Cuartiles Rangos Q1 232 – 250° Q2 250 – 253° Q3 253 – 255° Q4 255 – 260°

Tabla 4.8: Cuartiles de Temperatura Una vez hecho esto, a cada observación (kilogramos rechazados) se le asignó su cuartil correspondiente. Para hacer esta comparación, es necesario utilizar la prueba Kruskal – Wallis, incluida en Minitab. Las hipótesis establecidas fueron: Hipótesis nula

43210 : KgTKgTKgTKgTH θθθθ === Hipótesis alternativa

:1H Al menos hay un par ji θθ ≠ , tal que i ≠ j. Para realizar esta prueba, se sigue el menú Stat/Nonparametrics/Kruskal-Wallis, en donde se introducen tanto los datos como el factor al que pertenece cada uno de ellos, de acuerdo al cuadro de diálogo que se muestra en la Figura 4.16.

Capítulo 4: Aplicación 79

Page 89: Alternativa de Herramientas Estadísticas para el ...

Figura 4.16: Pantalla de la Prueba Kruskal - Wallis

Los resultados obtenidos fueron los siguientes: Kruskal-Wallis Test: Kilos versus TempCuartil_1 Kruskal-Wallis Test on Kilos TempCuartil_1 N Median Ave Rank Z 1 95 154.0 211.2 8.05 2 77 147.0 112.4 -4.55 3 81 148.0 133.4 -2.18 4 49 147.0 127.1 -2.14 Overall 302 151.5 H = 67.17 DF = 3 P = 0.000H = 67.73 DF = 3 P = 0.000 (adjusted for ties)

Figura 4.17: Resultados de la Prueba Kruskal - Wallis El p-value es menor al nivel de significancia del 5%, por lo que se rechaza la hipótesis nula. Esto indica que hay una diferencia entre al menos 2 de las medianas de los kilogramos rechazados en cada nivel de temperatura, por lo que ésta puede ser considerada una variable de influencia en el proceso. 4.3.8 Comparación de Kilogramos Rechazados a Diferentes Viscosidades Para esta prueba, semejante a la anterior, también fue necesario dividir a los datos de viscosidad en cuartiles, como se presenta en la Tabla 4.9:

Cuartiles Rangos V1 14 – 19 s V2 19 – 21 s V3 21 – 23 s V4 23 – 30 s

Tabla 4.9: Cuartiles de Viscosidad

Capítulo 4: Aplicación 80

Page 90: Alternativa de Herramientas Estadísticas para el ...

Para poder llevar a cabo la prueba de Kruskal – Wallis, se asignó a cada observación (kilogramos rechazados) su correspondiente cuartil de viscosidd. Las hipótesis establecidas fueron: Hipótesis nula

43210 : KgVKgVKgVKgVH θθθθ === Hipótesis alternativa

:1H Al menos hay un par KgVjKgVi θθ ≠ , tal que i ≠ j. Los resultados obtenidos se despliegan en la Figura 4.18: Kruskal-Wallis Test: Kilos Rechazados versus Cuartiles V Kruskal-Wallis Test on Kilos Rechazados Cuartiles V N Median Ave Rank Z 1 101 147.0 131.1 -2.88 2 96 149.0 152.5 0.14 3 42 150.0 178.1 2.13 4 63 149.0 165.0 1.38 Overall 302 151.5 H = 10.92 DF = 3 P = 0.012H = 11.01 DF = 3 P = 0.012 (adjusted for ties)

Figura 4.18: Resultados Prueba Kruskal – Wallis, Kilogramos Rechazados vs Viscosidad En la figura anterior podemos notar que el p-valor es menor al nivel de significancia, por lo que se rechazó la hipótesis nula. Con esto se puede concluir que al menos 2 de las medianas de los kilogramos rechazados, en los diversos cuartiles de viscosidad, son diferentes, por lo que ésta es una variable que influye en la cantidad de producto rechazado. 4.3.9 Comprobación de la Interacción entre las Variables Temperatura,

Viscosidad y Kilogramos Rechazados Para la realización de esta parte del análisis se utilizó una herramienta gráfica, el diagrama de dispersión. Se graficó en el eje horizontal la viscosidad y en el eje vertical los kilogramos rechazados, agrupándolos por cuartiles de temperatura. Esto se hizo con la ayuda de Minitab, siguiendo el menú Graph/Scatterplot/With Groups. La pantalla que se despliega es la que se muestra en la Figura 4.19:

Capítulo 4: Aplicación 81

Page 91: Alternativa de Herramientas Estadísticas para el ...

Figura 4.19: Pantalla del Diagrama de Dispersión en Minitab

En esta parte es necesario especificar la variable en el eje de las X’s, la que irá en el eje de las Y’s, y la variable por la que serán agrupados estos datos. El resultado obtenido fue el siguiente:

Viscosidad (segundos)

Kilo

s R

echa

zado

s

30.027.525.022.520.017.515.0

230

220

210

200

190

180

170

160

150

140

CuartilesT1234

Scatterplot of Kilos Rechazados vs Viscosidad (segundos)

Figura 4.20: Diagrama de Dispersión de Kilogramos Rechazados y Viscosidad, agrupados por

Cuartiles de Temperatura Con este gráfico se comprueba la interacción existente entre viscosidad y temperatura. Se puede observar claramente cómo la viscosidad de la pintura, a bajas temperaturas (232 – 250° C) producen una mayor cantidad de kilogramos rechazados. 4.3.10 Resultados Obtenidos Con la variedad de procedimientos no paramétricos, aplicados en los apartados anteriores, se pudo llegar a la siguiente conclusión con respecto al proceso de producción de láminas:

Capítulo 4: Aplicación 82

Page 92: Alternativa de Herramientas Estadísticas para el ...

• Las variables que influyen en los kilogramos de producto rechazado son: Brillo en la cara superior. Temperatura. Viscosidad.

• Existe una fuerte interacción entre la temperatura y la viscosidad, cuestión

que no había sido considerada por la gente involucrada en el proceso. • Es necesario validar los límites de especificación para el brillo en la cara

inferior. A pesar de que se encontró que los datos no se distribuyen normalmente, se realizó el mismo procedimiento (tanto en la fase de medición, como en la de análisis) con métodos paramétricos, con el objetivo de contrastar los resultados. Erróneamente, los analistas en ocasiones utilizan los métodos estándar con datos no normales aunque hayan encontrado ausencia de normalidad, porque son los únicos procedimientos que conocen y ninguna transformación tuvo éxito; o bien, los aplican ignorando que no se cumple con este requisito fundamental para su validez. Enseguida se presentan los resultados de estos procedimientos. 4.4 Medición con Procedimientos Paramétricos Una ventaja de la aplicación de este tipo de procedimientos, es que están incluidos en la mayoría de los paquetes estadísticos, si no es que en todos. Minitab tiene disponibles todas las pruebas que se presentan a continuación. 4.4.1 Capacidad del Proceso en la Variable Brillo Para el cálculo de la capacidad del proceso se utilizó a la vez la transformación de Box – Cox, dentro del menú de Stat/Quality Tools/Capability Analysis/Normal. El cuadro de diálogo se despliega en la Figura 4.21:

Figura 4.21: Pantalla del Análisis de Capacidad del Proceso

Capítulo 4: Aplicación 83

Page 93: Alternativa de Herramientas Estadísticas para el ...

Dentro de este cuadro de diálogo, deben especificarse los datos a analizar, así como la transformación deseada. Las opciones se encuentran en el botón Box – Cox. Los resultados se presentan en la Figura 4.22:

0.01280.01240.01200.01160.01120.01080.01040.0100

Process Capability of prom ciUsing Box-Cox Transformation With Lambda = -1

Process Capability of prom csUsing Box-Cox Transformation With Lambda = -0.5

LSL*USL*LSL*USL*

Figura 4.22: Resultados Análisis de Capacidad de Proceso para Brillo Cara Superior y Cara Inferior

Capacidad del Proceso BCS BCI

Cp 1.670 1.940 Cpi 0.620 -1.670 Cps 2.710 5.550 Cpk 0.620 -1.670

Tabla 4.10: Comparación Análisis de Capacidad de Proceso para Brillo Cara Superior y Cara Inferior Observando la Tabla 4.10, es posible concluir que la capacidad potencial es muy buena, con un valor superior al 1.5, tanto para la cara superior como para la inferior; sin embargo, la capacidad real del proceso en la variable brillo para ambas caras es muy pobre, ya que tiene valores por debajo de 1. 4.5 Análisis con Procedimientos Paramétricos 4.5.1 Comparación de Medias de la Variable Brillo La prueba paramétrica aplicable a este caso es la t para dos muestras, que puede ser ejecutada siguiendo la ruta Stat/Basic Statistics/2 Sample t. Antes de llevar a cabo este procedimiento, es necesario verificar la igualdad de las

transformed dataProcess Data

Sample N 302StDev (Within) 0.714718StDev (O v erall) 3.88434

A fter Transformation

LSL* 0.0111111Target*

LSL

*USL* 0.01Sample Mean* 0.011591StDev (Within)* 9.56365e-005StDev (O v erall)* 0.000520168

90Target *USL 100Sample Mean 86.447

Potential (Within) C apability

C C pk 1.94

O v erall C apabilityPp 0.36PPL -0.31PPU 1.02Ppk

C p

-0.31C pm *

1.94C PL -1.67C PU 5.55C pk -1.67

O bserv ed PerformancePPM < LSL 645695.36PPM > USL 0.00PPM Total 645695.36

Exp. Within PerformancePPM > LSL* 999999.74PPM < USL* 0.00PPM Total 999999.74

Exp. O v erall PerformancePPM > LSL* 821889.96PPM < USL* 1111.67PPM Total 823001.64

WithinO v erall

0.10950.10800.10650.10500.10350.10200.1005

transformed dataProcess Data

Sample N 302StDev (Within) 0.951321StDev (O v erall) 3.29244

A fter Transformation

LSL* 0.105409Target*

LSL

*USL* 0.1Sample Mean* 0.104398StDev (Within)* 0.000540159StDev (O v erall)* 0.00192734

90Target *USL 100Sample Mean 91.8422

WithinO v erall

Potential (Within) C apability

C C pk 1.67

O v erall C apability

Pp 0.47PPL 0.17PPU 0.76Ppk

C p

0.17C pm *

1.67C PL 0.62C PU 2.71C pk 0.62

O bserv ed PerformancePPM < LSL 145695.36PPM > USL 0.00PPM Total 145695.36

Exp. Within PerformancePPM > LSL* 30650.57PPM < USL* 0.00PPM Total 30650.57

Exp. O v erall PerformancePPM > LSL* 299980.15PPM < USL* 11240.76PPM Total 311220.91

Capítulo 4: Aplicación 84

Page 94: Alternativa de Herramientas Estadísticas para el ...

varianzas, a través de una prueba F, cuya ruta es Stat/Basic Statistics/2 Variances. Las hipótesis para esta prueba son: Hipótesis nula

220 : CICSH σσ =

Hipótesis alternativa 22

1 : CICSH σσ ≠ El cuadro de diálogo se presenta en la Figura 4.23. Existen diferentes formas de introducir los datos a esta pantalla, la más común es introduciendo por separado ambas muestras.

Figura 4.23: Pantalla de la Prueba F para 2 Varianzas

Los resultados de esta prueba fueron: Test for Equal Variances: Prom CS, Prom CI 95% Bonferroni confidence intervals for standard deviations N Lower StDev Upper Prom CS 302 3.01371 3.28971 3.61907 Prom CI 302 3.55551 3.88112 4.26969 F-Test (normal distribution) Test statistic = 0.72, p-value = 0.004 Levene's Test (any continuous distribution) Test statistic = 44.34, p-value = 0.000

Figura 4.24: Resultados de la Prueba F para el Brillo en Cara Superior e Inferior El p-valor es menor al nivel de significancia del 5%, por lo que se rechazó la hipótesis nula, concluyendo que las varianzas de la variable brillo de la cara superior y de la cara inferior son diferentes. Es importante notar que debajo de la

Capítulo 4: Aplicación 85

Page 95: Alternativa de Herramientas Estadísticas para el ...

prueba F, están los resultados de la prueba de Levene, el sustituto no paramétrico para ésta y para la prueba de Bartlett. Posteriormente se realizó la prueba t, cuya pantalla es semejante a la de la prueba de varianzas, como se puede observar en la Figura 4.25. Las hipótesis establecidas son: Hipótesis nula

BCIBCSH μμ =:0 Hipótesis alternativa

BCIBCSH μμ ≠:1

Figura 4.25: Pantalla de la Prueba t para 2 Medias∗

Los resultados se muestran en la Figura 4.26. Two-Sample T-Test and CI: Prom CS, Prom CI Two-sample T for Prom CS vs Prom CI N Mean StDev SE Mean Prom CS 302 91.84 3.29 0.19 Prom CI 302 86.45 3.88 0.22 Difference = mu (Prom CS) - mu (Prom CI) Estimate for difference: 5.39514 95% CI for difference: (4.82014, 5.97014) T-Test of difference = 0 (vs not =): T-Value = 18.43 P-Value = 0.000 DF = 586

Figura 4.26: Resultados de la Prueba t en el Brillo, Cara Superior e Inferior El p-valor es menor que el 5% de nivel de significancia, por lo que se rechaza la hipótesis nula. Hay evidencia de que la media del nivel de brillo en la cara superior es diferente a la del brillo en la cara inferior. ∗ En caso de que las varianzas sean iguales, la opción de “Assume equal variantes” debe ser seleccionada en el cuadro de diálogo de la prueba t.

Capítulo 4: Aplicación 86

Page 96: Alternativa de Herramientas Estadísticas para el ...

4.5.2 Gráfico de Control X - R Éste es uno de los gráficos de control de Shewhart para variables. Se encuentra en el menú de Stat/Control Charts/Variables Charts for Subgroups/Xbar-R. Su cuadro de diálogo se ve de la siguiente manera:

Figura 4.27: Pantalla de la Gráfica de Control X – R

En esta pantalla es necesario introducir los datos a ser graficados, ya sea por subgrupos o en una sola columna. Entre otras cosas, es posible realizar todas las pruebas sugeridas por Western Electric; para este análisis sólo se eligió la opción de detectar los puntos que caigan más allá de 3 sigmas de la línea central, es decir, que salgan fuera de los límites de control.

Capítulo 4: Aplicación 87

Page 97: Alternativa de Herramientas Estadísticas para el ...

Las gráficas resultantes se muestran en la Figura 4.28:

Sample

Sa

mp

le M

ea

n

3012712412111811511219161311

100

95

90

85

__X=91.84UC L=93.04

LC L=90.64

Sample

Sa

mp

le R

an

ge

3012712412111811511219161311

4

3

2

1

0

_R=1.174

UC L=3.021

LC L=0

11

1

11

1111

111111

11

111111111

1

11111111111111111

1111

1

11

11

111

111

1

111111111111

1111111111111

1111111

11111111111111111111

11

1111

1

1111111111

111

111

1

1

1

1

111

1

111

1

111

1111111

1

111

1

1111

1

111111111111

Xbar-R Chart of brillo-cs1, ..., brillo-cs3

Sample

Sa

mp

le M

ea

n

3012712412111811511219161311

96

92

88

84

80

__X=86.45UC L=87.68

LC L=85.21

Sample

Sa

mp

le R

an

ge

3012712412111811511219161311

8

6

4

2

0

_R=1.209

UC L=3.113

LC L=0

11

11111

111

1

111

1

111

1111

111111

11

11111111

11111111

11

111111111111111

111

1

1

1111

1

1111

1

1111

111111111

11111111

111

1

1

1

1111

11

1111

1

111

111

111111111

1

1111111111

11111

111

11

11111111111111111111

1111111111111111111111

1111

1111111111111111111111111

111

1111111111111111111111111111111111111111111111111

1111

11

11

Xbar-R Chart of brillo-ci1, ..., brillo-ci3

Figura 4.28: Gráficas de Control X-R para el Brillo, Cara Superior y Cara Inferior

En la Figura 4.28 se puede notar la existencia de una gran cantidad de observaciones fuera de control. Minitab arroja qué puntos se salieron de los límites, tanto en la parte de los promedios como en la de los rangos, como se despliega en la Figura 4.29.

Capítulo 4: Aplicación 88

Page 98: Alternativa de Herramientas Estadísticas para el ...

Xbar-R Chart of brillo-cs1, ..., brillo-cs3 Test Results for Xbar Chart of brillo-cs1, ..., brillo-cs3 TEST 1. One point more than 3.00 standard deviations from center line. Test Failed at points: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 21, 22, 23, 24, 25, 34, 36, 37, 40, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 162, 166, 174, 176, 179, 181, 182, 185, 191, 198, 207, 217, 219, 221, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 276, 277, 281, 301, 302 Test Results for R Chart of brillo-cs1, ..., brillo-cs3 TEST 1. One point more than 3.00 standard deviations from center line. Test Failed at points: 159, 162, 166, 169, 170, 173, 187, 208, 214, 215, 216, 220 * WARNING * If graph is updated with new data, the results above may no * longer be correct. Xbar-R Chart of brillo-ci1, ..., brillo-ci3 Test Results for Xbar Chart of brillo-ci1, ..., brillo-ci3 TEST 1. One point more than 3.00 standard deviations from center line. Test Failed at points: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 158, 159, 161, 163, 165, 167, 168, 169, 170, 172, 175, 176, 177, 178, 179, 180, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 280, 281, 282, 286, 287, 288, 289, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302 Test Results for R Chart of brillo-ci1, ..., brillo-ci3 TEST 1. One point more than 3.00 standard deviations from center line. Test Failed at points: 157, 160, 163, 166, 172, 215, 216, 266 * WARNING * If graph is updated with new data, the results above may no * longer be correct.

Figura 4.29: Resultados de las Gráficas de Control X-R para el Brillo, Cara Superior y Cara Inferior

Capítulo 4: Aplicación 89

Page 99: Alternativa de Herramientas Estadísticas para el ...

Control Fuera Dentro

BCS 167 135 BCI 276 26

Tabla 4.11: Puntos Fuera y Dentro de Control, Gráfica X - R Observando en conjunto la Figura 4.26 y la Tabla 4.11 podemos concluir que el proceso se encuentra altamente inestable en cuanto al brillo en ambas caras, debido a que la cantidad de puntos fuera de control supera por mucho a los que sí están en control. 4.5.3 Comparación de Kilogramos Rechazados en Puntos Dentro y Fuera

de Control en la Variable Brillo Al igual que en la sección de procedimientos no paramétricos, con estas pruebas se buscó evaluar la existencia de diferencias significativas entre los kilogramos rechazados pertenecientes a los puntos fuera y dentro de control respectivamente, para la variable brillo en la cara superior e inferior de la lámina. Para la cara superior las hipótesis establecidas respecto a las varianzas fueron: Hipótesis nula

220 : KgCSDKgCSFH σσ =

Hipótesis alternativa 22

1 : KgCSDKgCSFH σσ ≠

Dando como resultado: Test for Equal Variances: Dentro CS, Fuera CS 95% Bonferroni confidence intervals for standard deviations N Lower StDev Upper Dentro CS 135 14.3725 16.3467 18.9212 Fuera CS 167 23.7529 26.6838 30.4035 F-Test (normal distribution) Test statistic = 0.38, p-value = 0.000 Levene's Test (any continuous distribution) Test statistic = 15.42, p-value = 0.000

Figura 4.30: Resultados de la Prueba de Varianzas, Cara Superior

Capítulo 4: Aplicación 90

Page 100: Alternativa de Herramientas Estadísticas para el ...

El p-valor es menor que el nivel de significancia del 5%, por lo que se puede concluir que las varianzas son diferentes para los kilogramos rechazados fuera y dentro de control en la variable brillo en la cara superior.

Posteriormente se realizó la prueba de hipótesis para las medias: Hipótesis nula

KgCSDKgCSFH μμ =:0 Hipótesis alternativa

KgCSDKgCSFH μμ ≠:1 Los resultados arrojados por Minitab fueron:

Two-Sample T-Test and CI: Dentro CS, Fuera CS Two-sample T for Dentro CS vs Fuera CS N Mean StDev SE Mean Dentro CS 135 151.2 16.3 1.4 Fuera CS 167 161.2 26.7 2.1 Difference = mu (Dentro CS) - mu (Fuera CS) Estimate for difference: -9.97112 95% CI for difference: (-14.88955, -5.05270) T-Test of difference = 0 (vs not =): T-Value = -3.99 P-Value = 0.000 DF = 280

Figura 4.31: Resultados de la Prueba de Medias, Cara Superior

En la Figura 4.31 podemos notar que el p-valor es menor al nivel de significancia, por lo que se rechaza la hipótesis nula, concluyendo que las medias no son iguales. Así podemos llegar a la conclusión de que controlar la variable brillo en la cara superior dentro de especificación tiene influencia en los kilogramos de producto rechazado. Este mismo análisis fue realizado con la cara inferior. Las hipótesis para sus varianzas fueron: Hipótesis nula

220 : KgCIDKgCIFH σσ =

Hipótesis alternativa 22

1 : KgCIDKgCIFH σσ ≠ El resultado de esta prueba fue el siguiente:

Capítulo 4: Aplicación 91

Page 101: Alternativa de Herramientas Estadísticas para el ...

Test for Equal Variances: Dentro CI, Fuera CI 95% Bonferroni confidence intervals for standard deviations N Lower StDev Upper Dentro CI 26 3.5456 4.6740 6.7800 Fuera CI 276 21.8705 23.9661 26.4875 F-Test (normal distribution) Test statistic = 0.04, p-value = 0.000 Levene's Test (any continuous distribution) Test statistic = 5.67, p-value = 0.018

Figura 4.32: Resultados de la Prueba de Varianzas, Cara Inferior

El p-valor es menor que el nivel de significancia, por lo que las varianzas de los kilogramos dentro y fuera de control con respecto a la variable brillo, no son iguales. Posteriormente se realizó la prueba de hipótesis para las medias: Hipótesis nula

KgCIDKgCIFH μμ =:0 Hipótesis alternativa

KgCIDKgCIFH μμ ≠:1 Los resultados fueron los siguientes:

Two-Sample T-Test and CI: Dentro CI, Fuera CI Two-sample T for Dentro CI vs Fuera CI N Mean StDev SE Mean Dentro CI 26 146.62 4.67 0.92 Fuera CI 276 157.7 24.0 1.4 Difference = mu (Dentro CI) - mu (Fuera CI) Estimate for difference: -11.0984 95% CI for difference: (-14.4693, -7.7274) T-Test of difference = 0 (vs not =): T-Value = -6.49 P-Value = 0.000 DF = 194

Figura 4.33: Resultados de la Prueba de Medias, Cara Inferior

El p-valor arrojado por esta prueba también es menor al 5% de significancia, por lo que se rechazó la hipótesis nula, concluyendo la cantidad de kilogramos rechazados a consecuencia de puntos fuera de especificación en el brillo (cara inferior) se incrementa significativamente a aquellos rechazados cuando los puntos están dentro de especificación.

Capítulo 4: Aplicación 92

Page 102: Alternativa de Herramientas Estadísticas para el ...

4.5.4 Comparación de Kilogramos Rechazados en Puntos Fuera de Control para la Variable Brillo en la Cara Superior y Cara Inferior

En este punto, se procedió a comparar los kilogramos rechazados pertenecientes a los puntos fuera de control en la variable brillo, para ambas caras, quedando las hipótesis para las varianzas como: Hipótesis nula

220 : KgCIFKgCSFH σσ =

Hipótesis alternativa 22

1 : KgCIFKgCSFH σσ ≠ Test for Equal Variances: Fuera CS 1, Fuera CI 1 95% Bonferroni confidence intervals for standard deviations N Lower StDev Upper Fuera CS 1 167 23.7529 26.6838 30.4035 Fuera CI 1 276 21.8705 23.9661 26.4875 F-Test (normal distribution) Test statistic = 1.24, p-value = 0.117 Levene's Test (any continuous distribution) Test statistic = 2.19, p-value = 0.139

Figura 4.34: Resultados de la Prueba de Varianzas, Cara Superior e Inferior, Puntos Fuera de Control El p-valor es mayor al nivel de significancia, por lo que se acepta la hipótesis nula, es decir, se puede concluir que las varianzas son iguales. Para la prueba de medias, las hipótesis fueron: Hipótesis nula

KgCIFKgCSFH μμ =:0 Hipótesis alternativa

KgCIFKgCSFH μμ ≠:1

El resultado arrojado por Minitab, fue el siguiente:

Capítulo 4: Aplicación 93

Page 103: Alternativa de Herramientas Estadísticas para el ...

Two-Sample T-Test and CI: Fuera CS 1, Fuera CI 1 Two-sample T for Fuera CS 1 vs Fuera CI 1 N Mean StDev SE Mean Fuera CS 1 167 161.2 26.7 2.1 Fuera CI 1 276 157.7 24.0 1.4 Difference = mu (Fuera CS 1) - mu (Fuera CI 1) Estimate for difference: 3.50180 95% CI for difference: (-1.31971, 8.32331) T-Test of difference = 0 (vs not =): T-Value = 1.43 P-Value = 0.154 DF = 441 Both use Pooled StDev = 25.0237

Figura 4.35: Resultados de la Prueba de Medias, Cara Superior e Inferior, Puntos Fuera de Control El p-valor es mayor al nivel de significancia, por lo que se aceptó la hipótesis nula. Esto quiere decir que las medias de los kilogramos rechazados son iguales, tanto en los puntos fuera de control, como en los puntos dentro de control; por tanto, se puede concluir que su comportamiento es el mismo para ambos casos. 4.5.5 Comparación de Kilogramos Rechazados a Diferentes Temperaturas La prueba adecuada para realizar esta comparación es la ANOVA (Análisis de Varianza), que es posible encontrar en Minitab siguiendo la ruta Stat/ANOVA/One- Way. La pantalla que se despliega se presenta en la Figura 4.36:

Figura 4.36: Pantalla del ANOVA en Minitab

En ésta es necesario introducir los valores a ser analizados, en este caso, los kilogramos rechazados y el factor o grupo al que pertenecen, los cuartiles de temperatura. Las hipótesis establecidas fueron:

Capítulo 4: Aplicación 94

Page 104: Alternativa de Herramientas Estadísticas para el ...

Hipótesis nula 43210 : KgTKgTKgTKgTH μμμμ ===

Hipótesis alternativa :1H Al menos hay un par KgTjKgTi μμ ≠ , tal que i ≠ j.

La prueba arrojó los resultados presentados en la Figura 4.35: One-way ANOVA: Kilos versus TempCuartil_1 Source DF SS MS F P TempCuartil_1 3 59704 19901 58.30 0.000 Error 298 101721 341 Total 301 161425 S = 18.48 R-Sq = 36.99% R-Sq(adj) = 36.35%

Figura 4.37: Resultados del ANOVA para Kilogramos Rechazados vs Cuartiles de Temperatura El p-valor es menor al nivel de significancia del 5%, por lo que se rechaza la hipótesis nula, es decir, al menos dos medias de kilogramos rechazados a dos niveles de temperatura, son diferentes. Con esto se puede concluir que la temperatura sí es un factor de influencia para el rechazo del producto.

Residual

Per

cent

50250-25-50

99.9

99

90

50

10

1

0.1

N 302AD 10.179P-Value <0.005

Fitted Value

Res

idua

l

180170160150

50

25

0

-25

-50

Residual

Freq

uenc

y

4530150-15-30

80

60

40

20

0

Observation Order

Res

idua

l

300

280

260

240

220

200

180

160

140

120

100806040201

50

25

0

-25

-50

Normal Probability Plot Residuals Versus the Fitted Values

Histogram of the Residuals Residuals Versus the Order of the Data

Residual Plots for Kilos

Figura 4.38: Gráfica de los Residuales, ANOVA para Kilogramos y Temperatura

Sin embargo, al observar la Figura 4.36, se puede apreciar con facilidad la tendencia en los gráficos de los residuales. Tanto el requisito de homocedasticidad (varianzas iguales) en los residuos, la normalidad, y la independencia de éstos han sido violados, por lo que los resultados obtenidos con este ANOVA no pueden ser considerados válidos.

Capítulo 4: Aplicación 95

Page 105: Alternativa de Herramientas Estadísticas para el ...

4.5.6 Comparación de Kilogramos Rechazados a Diferentes Viscosidades Al igual que en el apartado anterior, la prueba adecuada para este análisis es el ANOVA, comparando las medias de los kilogramos rechazados a los cuatro niveles de viscosidad. Las hipótesis establecidas fueron: Hipótesis nula

43210 : KgVKgVKgVKgVH μμμμ === Hipótesis alternativa

:1H Al menos hay un par KgVjKgVi μμ ≠ , tal que i ≠ j. Los resultados obtenidos se presentan en la Figura 4.39: One-way ANOVA: Kilos Rechazados versus Cuartiles V Source DF SS MS F P Cuartiles V 3 15080 5027 10.24 0.000 Error 298 146345 491 Total 301 161425 S = 22.16 R-Sq = 9.34% R-Sq(adj) = 8.43%

Figura 4.39: Resultados del ANOVA para Kilogramos Rechazados vs Cuartiles de Viscosidad El p-valor es menor al 5% del nivel de significancia, por lo que se rechazó la hipótesis nula. Esto indica que hay una diferencia en al menos dos medias de los kilogramos rechazados a dos niveles de viscosidad, por lo que ésta puede ser considerada un factor importante para el proceso.

Residual

Per

cent

80400-40-80

99.9

99

90

50

10

1

0.1

N 302AD 23.583P-Value <0.005

Fitted Value

Res

idua

l

165160155150

60

40

20

0

-20

Residual

Freq

uenc

y

604530150-15-30

60

45

30

15

0

Observation Order

Res

idua

l

300

280

260

240

220

200

180

160

140

120

100806040201

60

40

20

0

-20

Normal Probability Plot Residuals Versus the Fitted Values

Histogram of the Residuals Residuals Versus the Order of the Data

Residual Plots for Kilos Rechazados

Figura 4.40: Gráfica de los Residuos, ANOVA Kilogramos Rechazados y Viscosidad

Como podemos observar en la Figura 4.40, se tiene la misma situación que en el apartado anterior respecto a la heterocedasticidad, la no normalidad y

Capítulo 4: Aplicación 96

Page 106: Alternativa de Herramientas Estadísticas para el ...

dependencia de los residuos, por lo que los resultados obtenidos no pueden ser considerados válidos. 4.5.7 Resultados Obtenidos Con los procedimientos paramétricos aplicados en los apartados anteriores, se pudo llegar a la siguiente conclusión con respecto al proceso de producción de láminas: • Las variables que influyen en los kilogramos de producto rechazado son:

Brillo en la cara superior. Brillo en la cara inferior. Temperatura. Viscosidad.

4.6 Conclusión sobre los Resultados Obtenidos En los apartados anteriores se aplicaron procedimientos paramétricos y no paramétricos a la misma problemática. A continuación se presenta una síntesis de los resultados obtenidos: • Procedimientos No Paramétricos

o Brillo Cara Superior: 0 < Cpk < 1 Brillo Cara Inferior: Cpk < 0

o Brillo Cara Superior ≠ Brillo Cara Inferior

o Proceso Inestable para Brillo.

o Se requiere controlar el Brillo en la Cara Superior, ya que la cantidad de

kilogramos rechazados a consecuencia de puntos fuera de especificación en esta variable se incrementa significativamente en comparación a aquellos rechazados cuando está dentro. No es necesario controlar el Brillo en la Cara Inferior dentro de las especificaciones de 90 – 100.

o KgBCSFE = KgBCIFE o La temperatura es un factor muy importante. Mientras más baja esté la

temperatura se producen más kilogramos rechazados. o La viscosidad es una variable importante. Mientras más baja esté la

viscosidad se producen más kilogramos rechazados.

Capítulo 4: Aplicación 97

Page 107: Alternativa de Herramientas Estadísticas para el ...

• Procedimientos Paramétricos

o Brillo Cara Superior: 0 < Cpk < 1 Brillo Cara Inferior: Cpk < 0

o Brillo Cara Superior ≠ Brillo Cara Inferior

o Proceso Inestable para Brillo.

o Se requiere controlar el Brillo en la Cara Superior y el Brillo en la Cara Inferior,

ya que la cantidad de kilogramos rechazados aumenta cuando esta variable está fuera de especificación.

o KgBCSFE = KgBCIFE o La temperatura es un factor de influencia para los kilogramos rechazados.

o La viscosidad es una variable de influencia en los kilogramos de producto

rechazado. Debido a la naturaleza de la muestra recopilada, los resultados numéricos fueron similares, pero no así la interpretación de los mismos.

Variables Significativas Paramétricos No paramétricos BCS X X BCI X Temperatura X X Viscosidad X X Interacción T & V X

Tabla 4.12: Resumen de Resultados Obtenidos En la Tabla 4.12 es posible observar las variables que resultaron significativas con la implementación de ambas metodologías. Mientras que en el análisis paramétrico todas las variables fueron consideradas de importancia para el proceso, el análisis no paramétrico arrojó que en realidad las variables que sí es necesario controlar para disminuir la cantidad de kilogramos de producto rechazados son:

a) El brillo en la cara superior. b) La temperatura del metal. c) La viscosidad.

Además de esto, se encontró la existencia de una interacción entre la temperatura y la viscosidad, posibilidad que no había sido considerada por ninguna de las personas involucradas directamente en el proceso de producción.

Capítulo 4: Aplicación 98

Page 108: Alternativa de Herramientas Estadísticas para el ...

Por otra parte, la capacidad del proceso obtenida con el análisis paramétrico fue mucho mayor que la no paramétrica, lo cual brinda información falsa al analista acerca de la habilidad de sus procedimientos para cumplir con los requerimientos del cliente. Otra diferencia importante es apreciable en los gráficos de control, en los que los puntos fuera de control fueron significativamente mayores aplicando los gráficos de Shewhart a los identificados en la EWMA. Esto nos da una clara evidencia de la invalidez de la aplicación de los procedimientos estándar cuando se tienen datos no normales, y de la conveniencia e información relevante que los procedimientos no paramétricos dan al analista.

Capítulo 4: Aplicación 99

Page 109: Alternativa de Herramientas Estadísticas para el ...

CAPÍTULO 5

CONCLUSIONES 5.1 De la Investigación Esta investigación resultó ser una experiencia muy enriquecedora, no sólo en lo profesional, sino también en lo personal. Al llevarla a cabo me topé con el obstáculo de la escasez de información. La literatura que trata sobre Seis Sigma es extensa; sin embargo, sucede lo contrario con aquella que se refiere a la Estadística No Parámetrica, sus herramientas y cómo aplicarlas. Cabe resaltar que no fue posible encontrar en las diversas fuentes consultadas, algún artículo, paper o incluso alguna discusión que pretendiera conjugar los conceptos de Seis Sigma y los procedimientos no paramétricos cuando se tienen datos no normales. Esta situación creó incertidumbre, pero a la vez, y sobre todo, me dio la satisfacción de saber que esta tesis es una propuesta completamente nueva que puede convertirse en una aportación importante para los analistas que se topen con este “inconveniente”. De igual manera, la realización de este documento me permitió seguir fomentando la capacidad de análisis y síntesis de la información, aspecto que siempre se ha buscado inculcar en los estudiantes en esta institución, mi Alma Mater, el Tecnológico de Monterrey. Además de lo anterior, también se fomentó la habilidad para indagar en fuentes especializadas, discriminar lo inservible, estructurar lo útil, y finalmente darle forma a esta tesis. 5.2 Del Contenido Satisfactoriamente puedo decir que se cumplió con el objetivo de esta tesis, y la hipótesis que sostenía que “es posible identificar y describir el procedimiento de herramientas estadísticas no paramétricas equivalentes a las existentes en el modelo DMAIC” ha sido aceptada, ambos conforme a la documentación y evidencia teórica y práctica presentada a lo largo de los capítulos anteriores. De esta manera, se investigaron y analizaron los aspectos más relevantes del programa de calidad Seis Sigma, sus componentes, sus participantes, las etapas de implementación, así como las herramientas y resultados esperados en cada una de éstas. Asimismo, se recopiló información acerca de la Estadística No Paramétrica, sus procedimientos básicos, su aplicación y los supuestos y requisitos bajo los cuales operan. Conjuntamente, se investigaron las herramientas estadísticas paramétricas estándar utilizadas por Seis Sigma y sus sustitutos no paramétricos para trabajar

Capítulo 5: Conclusiones 100

Page 110: Alternativa de Herramientas Estadísticas para el ...

con datos que no cumplen con el supuesto de normalidad, desarrollando cada uno de éstos. Esta parte fue la propuesta principal de la tesis. Además, algunos de estos procedimientos fueron implementados a una situación problemática real, presentada en una empresa de la localidad. Con ello fue posible llegar a la validación de la contribución de esta tesis: la inclusión de herramientas estadísticas no paramétricas al modelo DMAIC en un proyecto de mejora Seis Sigma. Lo anterior resulta de gran utilidad, ya que no sólo se hizo una integración de la información, sino también se ejemplificó y comprobó su aplicabilidad. Debido a la gran aceptación y éxito que la metodología Seis Sigma ha tenido desde sus orígenes, resulta imperativo que su aplicación en las diferentes industrias esté fundamentada en los procedimientos estadísticos adecuados para cada situación. Cuando a partir de cierto proceso se obtienen datos que no se ajustan a la forma normal o no cumplen con los supuestos requeridos, el uso de las técnicas no paramétricas es válido y necesario. En el Capítulo 3 se mencionaron los pasos principales para tomar la decisión de usar herramientas paramétricas o no paramétricas: si aún eliminando puntos atípicos, manejando promedios y transformando las variables, los datos no se normalizan, la propuesta presentada es de gran ayuda. Como ya se expuso en este documento, si bien, los procedimientos no paramétricos poseen ciertas limitaciones, es también cierto que son tan eficientes como los paramétricos y además poseen ventajas sobre los mismos, lo cual permite al analista tomar decisiones en base a evidencia estadística bien cimentada. Es por esto que la aplicación de la Estadística No Paramétrica debe ser contemplada dentro las diferentes etapas de la metodología Seis Sigma. Es en este punto donde se encuentra en valor metodológico de esta tesis. 5.3 De la Aplicabilidad de la Herramienta En la actualidad Seis Sigma es uno de los programas de calidad más implementados en el mundo por empresas reconocidas internacionalmente y líderes en su industria. Desde sus orígenes fue concebida para trabajar con herramientas estadísticas que tienen como base la normalidad de los datos. Un aspecto importante a mencionar, es que lo más común es que los datos de los procesos reales no se comporten de esta manera. De hecho, el uso de la distribución normal se da debido a su simplicidad y a que sus parámetros están bien definidos; ésta es la razón por la que muchos de los procedimientos estadísticos tengan su fundamento en ella. La gran mayoría de los programas de certificación de Green Belts y Black Belts, incluidos los del Tecnológico de Monterrey, no cubren la aplicación de herramientas no paramétricas. Esto puede ser debido a la existencia de métodos (como las transformaciones) que permiten convertir en normales a datos que no lo son. Sin embargo, en ocasiones ninguno de éstos funciona y no hay manera de

Capítulo 5: Conclusiones 101

Page 111: Alternativa de Herramientas Estadísticas para el ...

hacer que los datos sean ajustados. Cuando los equipos que trabajan en proyectos de mejora Seis Sigma se ven en esta encrucijada no saben qué acciones tomar: existe una ignorancia generalizada de los procedimientos no paramétricos adecuados para esta situación. La Estadística No Paramétrica es en realidad útil y sencilla de usar. Al basar sus procedimientos en cálculos simples, como rankeo, medianas, sumatorias, y tener los supuestos y requisitos estándar de otras pruebas, su grado de aplicabilidad es altísimo. Esto se probó a lo largo del Capítulo 4, al utilizar dichos procedimientos con datos reales de una organización que se enfrenta a la “problemática” de tener datos no normales. Otro punto importante a mencionar, observable en la aplicación, es que pueden llegarse a resultados diferentes utilizando ambos métodos; sin embargo, el uso de la estadística paramétrica con datos no normales puede llevar al investigador a tomar decisiones basadas en resultados que carecen de validez, por tanto, esas decisiones pueden ser erróneas. El hecho es que existe la necesidad, para este tipo de casos, de conocer qué herramientas hay disponibles, cómo se utilizan y qué resultados arrojan, necesidad que esta tesis ha cubierto en buena medida. 5.3 De Futuras Investigaciones En la sección anterior, se mencionó que la presente tesis ha cubierto la necesidad de adaptar algunas de las herramientas no paramétricas disponibles al modelo MAIC. Digo esto debido a que el universo de la Estadística No Paramétrica es tan grande como el de la Paramétrica, por lo que no se han incluido todas las herramientas existentes que pueden ser de utilidad. Por ello, se recomienda para investigaciones futuras, hacer una extensión de las pruebas aplicables a datos no normales, ya que las mencionadas en este documento son sólo algunas que pueden ser consideradas como básicas, debido a que el tiempo llegó a ser un limitante; por ejemplo, el Diseño de Experimentos para datos no normales. Otra posible línea de investigación, es el desarrollo de herramientas diferentes a las estadísticas que puedan ser útiles cuando la situación de no normalidad se presenta.

Capítulo 5: Conclusiones 102

Page 112: Alternativa de Herramientas Estadísticas para el ...

REFERENCIAS

American Statistcial Association (2006). http://www.amstat.org/

Azzimonti, J.C. (2000). Estadística No Paramétrica. Argentina: Estadística

Aplicada a Bioquímica y Farmacia. Breakthrough Management Group (2004). Programa de Certificación

Internacional en Seis Sigma: Manual de Análisis. México: BMG - Tecnológico de Monterrey.

Cabriales, Valeria y González, Monserrat (2006). Proyecto presentado en la

Clase de Sistemas de Control de Procesos, Maestría en Ciencias con Especialidad en Sistemas de Calidad y Productividad. México: Tecnológico de Monterrey, Campus Monterrey.

Cantú, Humberto (1999). Desarrollo de una Cultura de Calidad. México:

McGraw-Hill.

Centro de Calidad (1992). Manual de Habilidad del Proceso. México: Tecnológico de Monterrey, Campus Monterrey.

Clements, John (1989). Process Capability Calculations for Non Normal

Distributions. EUA: Quality Progress, Septiembre.

Conover, W.J. (1980). Practical Nonparametric Statistics. EUA: Wiley.

Deshpnade, J.V. (1995). Statistical Analysis of Nonnormal Data. India: Wiley Eastern Limited.

Evans, James (2005). The Management and Control of Quality. EUA:

Thomson.

Freund, John (1971). Mathematical Statistics. EUA: Prentice Hall.

Hernández, Alberto (2005). Material de Apoyo para la Clase de Sistemas de Control de Procesos. Maestría en Ciencias con Especialidad en Sistemas de Calidad y Productividad. México: Tecnológico de Monterrey, Campus Monterrey.

Hernández, Roberto (2002). Metodología de la Investigación. México:

McGraw-Hill.

Referencias 103

Page 113: Alternativa de Herramientas Estadísticas para el ...

Hollander, Myles y Wolfe, Douglas (1999). Nonparametric Statistical Methods. EUA: Wiley – Interscience.

Manual de Estadística para Ingeniería del National Institute of Standards

and Technology, NIST. http://www.itl.nist.gov/div898/handbook/index.htm

Montgomery, Douglas (2002). Probabilidad y Estadística aplicadas a la

Ingeniería. México: Limusa Wiley.

Montgomery, Douglas (2004). Control Estadístico de la Calidad. México: Limusa Wiley.

Padnis, Shree (2006). Handling Non Normal Data. EUA: I Six Sigma.

http://www.isixsigma.com/library/content/c020121a.asp

Pande, Peter (2002). Las Claves de Seis Sigma. La implantación con éxito de una cultura que revoluciona el mundo empresarial. México: McGraw – Hill.

PPG Consultores, (2000). Gestión y Cambio Organizacional. Chile: PPG. http://www.ppg.cl/Articulos/SeisSigma.pdf

Salkind, Neil (1998). Métodos de Investigación. México: Prentice Hall.

Sheskin, David (2004). Handbook of Parametric and Nonparametric

Statistical Procedures. EUA: Chapman & Hall.

Snee, Ronald (2001). Dealing with the Achilles' Heel of Six Sigma Initiatives. Project Selection is Key to Success. EUA: Quality Progress. Marzo.

Stamatis, D.H. (2002). Six Sigma and Beyond. Foundations of Excellent

Performance. EUA: St. Lucie Press.

Stevens, S. S. (1946). On the Theory of Scales of Measurement. EUA: Science. Vol. 103.

Taylor, Wayne (1991). Optimization and Variation Reduction in Quality. EUA:

McGraw – Hill.

Temblador, María del Carmen (2005). Material de Apoyo para la Clase de Sistemas de Control de Procesos. Maestría en Ciencias con Especialidad en Sistemas de Calidad y Productividad. México: Tecnológico de Monterrey, Campus Monterrey.

Referencias 104

Page 114: Alternativa de Herramientas Estadísticas para el ...

LISTA DE FIGURAS

Figura 2.1: Modelo General DMAIC 12 Figura 3.1: Representación del Cp con Distribuciones No Normales 29 Figura 3.2: Nivel de Confianza del 99.73% 30 Figura 3.3: Percentiles Estándar 30 Figura 3.4: Tipos de Sesgo 31 Figura 3.5: Tipos de Curtosis 31 Figura 4.1: Lámina con Bloqueo en la Parte Posterior

Adaptada de Cabriales & González, 2006 61 Figura 4.2: Macro mapa, Línea de Pintado 1 62 Figura 4.3: Proceso de Producción Láminas 62 Figura 4.4: Diálogo de Prueba de Normalidad 64 Figura 4.5: Resultados Prueba de Normalidad Variables bajo Análisis 65 Figura 4.6: Resultados de la Prueba de Normalidad para Brillo 66 Figura 4.7: Gráficas de Dispersión Variables vs Kilogramos Rechazados 69 Figura 4.8: Pantalla Coeficiente de Correlación en Minitab 70 Figura 4.9: Pantalla de la Prueba Mann – Whitney 72 Figura 4.10: Resultados de la Prueba Mann – Whitney 73 Figura 4.11: EWMA para Cara Superior 74 Figura 4.12: EWMA para Cara Inferior 74 Figura 4.13: Resultados Mann – Whitney

Kilogramos Dentro y Fuera, Cara Superior 76 Figura 4.14: Resultados Mann – Whitney

Kilogramos Dentro y Fuera, Cara Inferior 77 Figura 4.15: Resultados Mann – Whitney

Kilogramos con Brillo Fuera de Control, Ambas Caras 78 Figura 4.16: Pantalla de la Prueba Kruskal – Wallis 79 Figura 4.17: Resultados de la Prueba Kruskal – Wallis 79 Figura 4.18: Resultados Prueba Kruskal – Wallis,

Kilogramos Rechazados vs Viscosidad 80 Figura 4.19: Pantalla del Diagrama de Dispersión en Minitab 81 Figura 4.20: Diagrama de Dispersión de Kilogramos Rechazados

y Viscosidad, agrupados por Cuartiles de Temperatura 81 Figura 4.21: Pantalla del Análisis de Capacidad del Proceso 82 Figura 4.22: Resultados Análisis de Capacidad de Proceso

para Brillo Cara Superior y Cara Inferior 83 Figura 4.23: Pantalla de la Prueba F para 2 Varianzas 84 Figura 4.24: Resultados de la Prueba F para el Brillo en

Cara Superior e Inferior 84 Figura 4.25: Pantalla de la Prueba t para 2 Medias 85 Figura 4.26: Resultados de la Prueba t en el Brillo, Cara Superior e Inferior 85 Figura 4.27: Pantalla de la Gráfica de Control X – R 86 Figura 4.28: Gráficas de Control X-R para el Brillo,

Cara Superior y Cara Inferior 87 Figura 4.29: Resultados de las Gráficas de Control X-R para el Brillo,

Cara Superior y Cara Inferior 88 Figura 4.30: Resultados de la Prueba de Varianzas, Cara Superior 89 Figura 4.31: Resultados de la Prueba de Medias, Cara Superior 90 Figura 4.32: Resultados de la Prueba de Varianzas, Cara Inferior 91 Figura 4.33: Resultados de la Prueba de Medias, Cara Inferior 91 Figura 4.34: Resultados de la Prueba de Varianzas,

Cara Superior e Inferior, Puntos Fuera de Control 92 Figura 4.35: Resultados de la Prueba de Medias,

Cara Superior e Inferior, Puntos Fuera de Control 93 Figura 4.36: Pantalla del ANOVA en Minitab 93

105

Page 115: Alternativa de Herramientas Estadísticas para el ...

Figura 4.37: Resultados del ANOVA para Kilogramos Rechazados vs Cuartiles de Temperatura 94

Figura 4.38: Gráfica de los Residuales, ANOVA para Kilogramos y Temperatura 94

Figura 4.39: Resultados del ANOVA para Kilogramos Rechazados vs Cuartiles de Viscosidad 95

Figura 4.40: Gráfica de los Residuos, ANOVA Kilogramos Rechazados y Viscosidad 95

LISTA DE TABLAS

Tabla 1.1: El Costo de Calidad. Extraída de PPG Consultores, 2003 05 Tabla 2.1: Niveles Sigma con un desplazamiento de ± 1.5σ.

Extraída de Stamatis, D.H., 2002 11 Tabla 2.2: Comparación de Estándares.

Adaptada de Stamatis, D.H., 2002 11 Tabla 3.1: Errores Tipo I y Tipo II 22 Tabla 3.2: Procedimientos Paramétricos vs

Procedimientos No Paramétricos Propuestos 24 Tabla 3.3: Modelo General de Tratamientos y Bloques.

Adaptada de Hollander y Wolfe 1999 27 Tabla 3.4: Arreglo de una Tabla de Contingencia.

Extraída de Sheskin, 2004 36 Tabla 3.5: Modelo de la Prueba Chi Cuadrada.

Adaptada de Sheskin, 2004 39 Tabla 3.6: Ejemplo de Asignación de Ranks 47 Tabla 3.7: Síntesis de Pruebas No Paramétricas 59 Tabla 4.1: Información Preliminar para el Cálculo de la

Capacidad del Proceso 67 Tabla 4.2: Datos Previos al Cálculo de la Capacidad del Proceso 67 Tabla 4.3: Capacidad Real y Potencial del Proceso 68 Tabla 4.4: Correlación de Kilogramos Rechazados vs Variables Lámina 71 Tabla 4.5: Resultados de los Cálculos para EWMA Brillo Cara Superior 74 Tabla 4.6: Resultados de los Cálculos para EWMA Brillo Cara Inferior 74 Tabla 4.7: Puntos Fuera y Dentro de Control, Variable Brillo 76 Tabla 4.8: Cuartiles de Temperatura 78 Tabla 4.9: Cuartiles de Viscosidad 79 Tabla 4.10: Comparación Análisis de Capacidad de Proceso

para Brillo Cara Superior y Cara Inferior 83 Tabla 4.11: Puntos Fuera y Dentro de Control, Gráfica X – R 89 Tabla 4.12: Resumen de Resultados Obtenidos 97

ANEXOS Tabla 1a. Curvas de Pearson 106 Tabla 1b. Curvas de Pearson 107 Tabla 2. Curvas de Pearson 108 Tabla 3. Longitudes Promedio de la Corrida para la EWMA 109 Tabla 4. Distribución Chi Cuadrada 110 Tabla 5. Tablas para la Prueba de Wilcoxon 111 Tabla 6. Tablas para la Prueba U de Mann – Whitney 112

106

Page 116: Alternativa de Herramientas Estadísticas para el ...

ANEXOS

Tabla 1a. Curvas de Pearson.

107

Page 117: Alternativa de Herramientas Estadísticas para el ...

Tabla 1b. Curvas de Pearson.

108

Page 118: Alternativa de Herramientas Estadísticas para el ...

Tabla 2. Curvas de Pearson.

109

Page 119: Alternativa de Herramientas Estadísticas para el ...

Tabla 3. Longitudes Promedio de la Corrida para la EWMA.

Tomada de Montgomery, 2004.

110

Page 120: Alternativa de Herramientas Estadísticas para el ...

Tabla 4. Distribución Chi Cuadrada.

Tomada de kin, 2004. Shes

111

Page 121: Alternativa de Herramientas Estadísticas para el ...

Tabla 5. Tablas para la Prueba de Wilcoxon.

Tomada de Sheskin, 2004.

112

Page 122: Alternativa de Herramientas Estadísticas para el ...

Tabla 6. Tablas para la Prueba U Mann - Whitney. de

Tomada de Sheskin, 2004.

113

Page 123: Alternativa de Herramientas Estadísticas para el ...

Tabla 7. Tablas para la Prueba de Bondad de Ajuste Kolmogorov –

Smirnov.

Tomada de Sheskin, 2004.

114