Distribución de Weibull

download Distribución de Weibull

of 14

Transcript of Distribución de Weibull

  • Clculo de los Parmetros de la Distribucin

    de Weibull

    por Luis Hernando Palacio Palacio

    http://confiabilidad.net/articulos/calculo-de-los-parametros-de-la-distribucion-de-weibull/

    El presente artculo presenta, paso a paso, el mtodo de los Mnimos Cuadrados para calcular los

    parmetros de forma y escala de la distribucin de Weibull. Para el clculo del parmetro de

    localizacin se emplea el complemento Solver de Excel.

    Tambin se presentan dos ecuaciones para calcular el estimador Rango de mediana (ecuaciones 5 y

    6), siendo esta ltima una forma aproximada y la que generalmente se usa en la literatura tcnica.

    Ya que la ecuacin (5) es ms exacta, sta es la que se emplea; para ello, y debido a su complejidad,

    se presenta el cdigo fuente en el lenguaje VBA (Visual Basic para Aplicaciones) para crear una funcin definida por el usuario en Excel. Igualmente se usan las funciones PENDIENTE e

    INTERSECCIN.EJE, de Excel, para calcular la pendiente y el intercepto de la lnea de regresin.

    1. INTRODUCCIN

    La distribucin de Weibull es una distribucin continua y triparamtrica, es decir, est

    completamente definida por tres parmetros y es la ms empleada en el campo de la confiabilidad.

    A pesar de la popularidad de esta distribucin, en la revisin bibliogrfica efectuada, la mayora de

    los artculos y literatura tcnica consultados se remiten a una distribucin biparamtrica y, ms an,

    los ejemplos all desarrollados presentan como datos conocidos los dos parmetros, generndose,

    as, las siguientes preguntas: Cmo se calculan los parmetros? y por qu se omite el clculo del

    tercer parmetro? El tercer parmetro es el parmetro de localizacin, es decir, el parmetro que

    localiza la abscisa a partir del cual se inicia la distribucin.

    El objetivo del presente artculo es responder a las dos preguntas anteriores, presentando una de las

    cinco metodologas analticas existentes para el clculo de los parmetros y algunos criterios para determinar si es necesario tener en cuenta el tercer parmetro.

    El mtodo que se presenta es el mtodo de los Mnimos Cuadrados, por tres razones: la primera, es

    un mtodo simple y expedito de aplicar; la segunda, la grfica de los datos sirven como una prueba

    de bondad de ajuste de la distribucin y, la tercera, da un indicio sobre si se debe calcular o no el

    parmetro de localizacin.

    Para una metodologa grfica, la cual hace uso del papel especial llamado papel de probabilidad de

    Weibull, vanse las referencias [5], [6]

  • 2. EXPRESIN MATEMTICA DE LA DISTRIBUCIN

    La funcin de densidad de la distribucin de Weibull para la variable aleatoria t est dada por la

    siguiente expresin:

    Donde

    t: Variable aleatoria que, para el caso de la confiabilidad, representa el tiempo entre fallas.

    : Parmetro de forma (0

  • Para ampliar la imagen haga clic sobre ella, regrese utilizando su navegador.

    3. DETERMINACIN DE LOS PARMETROS POR EL MTODO DE LOS MNIMOS

    CUADRADOS

    Como se mencion en el numeral uno, existen cinco mtodos para calcular los parmetros de la

    distribucin de Weibull. Ellos son:

    Mnimos cuadrados.

    Grfico de la funcin tasa de falla.

    Mxima similitud.

    Estimacin de momentos.

    Estimadores lineales.

    Para ilustrar el mtodo de los mnimos cuadrados, se desarrollar paso a paso un ejemplo.

    El mtodo de los mnimos cuadrados permite calcular los parmetros de forma y escala, mediante la

    transformacin doble logartmica de la funcin de distribucin acumulativa (ecuacin 3). El clculo

    del parmetro de localizacin es ms complejo, emplendose para ello rutinas de clculo, como el

    programa Solver de Excel.

    La transformacin doble logartmica permite transformar la funcin de distribucin acumulativa en

    una ecuacin lineal de regresin.

  • 3.1 Deduccin de la ecuacin lineal de regresin

    Funcin acumulativa de Weibull.

    Aplicando logaritmos naturales.

    Propiedad exponencial de los logaritmos.

    Aplicando logaritmos naturales.

    La expresin (*) representa una ecuacin lineal de la forma

    La cual es una recta de regresin, con:

    De la expresin (**) se concluye que el parmetro de forma, , es la pendiente de la recta de regresin.

    De la expresin (***) se observa que el parmetro de escala, , est en funcin del intercepto b de la recta de regresin y del parmetro de escala; por lo tanto:

    (4) Definicin de logaritmo.

  • 3.2 Rango de mediana

    Para poder trazar la recta de regresin, se debe calcular un estimador para la funcin de distribucin

    acumulativa F(x). Este estimador, llamado Rango de mediana, es un estimador no paramtrico

    basado en el orden de las fallas. Este aspecto implica que la muestra de datos se debe organizar de

    menor a mayor (en forma ascendente).

    La expresin matemtica para este estimador es:

    Donde:

    W (i): Rango de mediana para un nivel de confianza (1-), donde es el nivel de significancia y toma el valor de 0.5 para este estimador.

    i: Orden de la falla.

    n: Nmero total de datos de la muestra.

    F, v1, v2: Valor crtico de la distribucin F, evaluada en el nivel de significancia y con grados de libertad v1 y v2.

    Dada la complejidad de la ecuacin (5), generalmente el rango de mediana se aproxima mediante la

    siguiente expresin, exacta dentro de 0.005 [1]:

    Donde:

    RM(xi): Rango de mediana.

    i: Orden de falla.

    n: Nmero total de datos de la muestra.

    Dado que la ecuacin (5) es ms exacta, en los clculos se empelar sta. Para facilitar su empleo, a

    continuacin se presenta el cdigo fuente para crear una funcin definida por el usuario en Excel.

    Para crear la funcin, sganse los siguientes pasos:

    Abra Excel.

    Hgase la combinacin de teclas Alt +F11. Esta accin abrir el editor de Visual Basic.

    En el men insertar de VB, seleccinese la opcin Mdulo.

    En el panel derecho, cpiese el siguiente cdigo fuente:

  • Public Function RangoMediana(alfa As Single, n As Long, i As Long) As Double

    *****************************************************************************

    *Esta funcin calcula el rango de mediana en funcin de la distribucin F. *

    *alfa representa el nivel de significancia con el que se calcula la dist. F.*

    *n es el nmero de puntos de la muestra. *

    *i es el orden de falla. *

    *****************************************************************************

    Dim a As Double, f As Double

    On Error GoTo ManejarError

    a = i / (n - i + 1)

    f = Application.WorksheetFunction.FInv(alfa, 2 * (n - i + 1), 2 * i)

    RangoMediana = a / (f + a)

    Salir:

    Exit Function

    ManejarError:

    Select Case Err.Number

    Case 1004

    MsgBox Los argumentos (n) o (i) no pueden ser cero., vbCritical + vbOKOnly

    Case Else

    MsgBox Se ha generado el error & Err.Number & _

    Err.Description, vbCritical + vbOKOnly

    End Select

    Resume Salir

    End Function

    Hgase clic en guardar del men Archivo del editor de VB para guardar la funcin.

    Hgase clic en Cerrar y volver a Excel del editor de VB. Esta accin cierra el editor de VB.

    Para usar la funcin creada, seleccinese Funcin del men Insertar de Excel. Se abre la

    ventana Insertar funcin.

    En la ventana Insertar funcin, en la lista desplegable O seleccionar una categora,

    seleccinese la categora Definidas por el usuario.

    En el cuadro de lista Seleccionar una funcin, hgase clic en RangoMediana.

    Hgase clic en el botn Aceptar.

    En la ventana Argumentos de funcin, digtese los valores de los argumentos. Tngase en

    cuenta que el valor del argumento alfa siempre es 0.5.

  • 3.3 Pasos

    1.- A continuacin se presenta la secuencia que se debe seguir en la

    aplicacin del mtodo de los Mnimos Cuadrados.1. Asuma (parmetro de localizacin) igual cero y ordene los datos de menor a mayor. El criterio de

    ordenacin debe ser el tiempo entre fallas. Vase la tabla 1.

    2. Calcule el rango de mediana para cada observacin usando la ecuacin (5)

    (6).

    En nuestro caso se usar la ecuacin (5), empleando la funcin definida por el

    usuario RangoMediana. Vase la figura 2.

    Los argumentos de la funcin RangoMediana toman los siguientes valores:

    Alfa=0.5; n=140 (total de puntos de la muestra); i= toma el valor

    indicado en la columna A. Los valores calculados se muestran en

    la tabla 2.

  • 3. Calcule el logaritmo natural del tiempo entre fallas para cada observacin.

    Vase la figura 3.

    Obsrvese que en la funcin LN(nmero) de la columna D,

    el parmetro de localizacin, el cual se obtiene de la celda

    L8, vale cero. Esto es importante, ya que la celda que

    contiene el parmetro de localizacin ser la celda

    cambiante de Solver, en el caso que sea necesario calcular

    este parmetro. Los valores de la abscisa x se muestran en

    la tabla 3.

    4. Calcule el valor de la ordenada y, es decir, el logaritmo del logaritmo del inverso de uno menos el

    rango de mediana para cada uno de las observaciones de la muestra. Vase la figura 4.

    Obsrvese la anidacin de la funcin logaritmo. El valor del rango de mediana se obtiene de los

    datos calculados en la columna C. Los valores de la ordenada y se muestran en la tabla 4.

  • 5. Genere un grfico con los datos de las columna D y E.

    Al trazar estos puntos, se genera la recta de regresin. Para ello seleccinese Grfico del men

    Insertar de Excel; aparece la ventana Asistente para grficos. En sta, escjase la opcin XY

    (Dispersin) en la lista Tipo de grfico y sganse las instrucciones en pantalla. Vase la figura 5

    Para hallar la ecuacin de la recta de regresin, emplense las funciones: PENDIENTE

    (conocido_y; conocido_x) donde: conocido_y son los valores dependientes (valores de la columna

    E) y conocido_x son los valores independientes (valores de la columna D) para estimar la pendiente

    de la recta; INTERSECCIN.EJE (conocido_y; conocido_x) para estimar el intercepto de la

    recta. Para determinar el grado de correlacin lineal de los puntos, emplense las funciones:

    PEARSON (matriz1; matriz2) donde matriz1 son los valores dependientes (columna E) y matriz2

    son los valores independientes (columna D). Esta funcin devuelve el coeficiente de correlacin r.

    COEFICIENTE.R2 (conocido_y; conocido_x) devuelve el cuadrado del coeficiente de correlacin.

    Estos valores, en s, representan una especie de prueba de bondad de ajuste de la recta de regresin.

    El coeficiente de correlacin est indicando que tan fuerte o dbil es la relacin lineal entre los

    datos; si este valor es ms cercano a uno, hay una fuerte dependencia lineal. Por otro lado, el

    coeficiente de determinacin, r2, est indicando el porcentaje de los puntos que estn relacionados

    linealmente.

    Aplicando las anteriores funciones de Excel, se obtiene la siguiente recta de regresin:

    y=0.6995x-1.9514 (7)

    De donde:

  • El coeficiente de correlacin, r, indica que hay una excelente relacin (dependencia) lineal de los

    datos, ya que su valor est muy prximo a uno. El coeficiente de determinacin, r2, indica que el

    94.64% de los datos estn relacionados linealmente. En conclusin, estos valores indican que la

    muestra se comporta conforme a la funcin de densidad de Weibull.

    6. Estime el valor del parmetro de forma y de escala.

    Dado que el parmetro de forma es la pendiente de la recta de regresin, de la ecuacin (7) se

    obtiene:

    De la ecuacin (4), numeral 3.1, se obtiene el valor del parmetro de escala:

    3.4 Consideraciones sobre el parmetro de localizacin

    Las siguientes consideraciones se deben tener en cuanta al momento de analizar un parmetro de

    localizacin diferente de cero. Vanse las referencias bibliogrficas [1], [6]

    a) Si al graficar los puntos de la muestra aparece una cola de puntos hacia arriba o hacia abajo, es

    un indicativo de que el parmetro de localizacin debe ser calculado.

    b) Una cola hacia abajo o una reduccin sbita de la pendiente son indicativos de que un parmetro

    de localizacin positivo est presente. Vase la figura 5.

    c) Una cola hacia arriba o un incremento sbito de la pendiente son indicativos de que un parmetro

    de localizacin negativo est presente. Este punto est de acuerdo con el intervalo de validez de . Vase el numeral 2.

    Un parmetro de localizacin negativo se presenta cuando hay unidades con fallas en servicio, o

    unidades en servicio con defectos que causarn fallas. Ejemplos:

    Defectos originados durante el ensamble.

    Defectos originados durante el transporte.

    Defectos originados durante la instalacin o montaje.

    Defectos originados durante el almacenamiento.

    d) Valores grandes del parmetro de forma (>10) son otro indicativo de que el parmetro de localizacin debe ser calculado.

    Teniendo en cuanta las consideraciones anteriores, y analizando la figura 5, se proceder a calcular

    el parmetro de localizacin.

    3.5 Clculo del parmetro de localizacin

    Para el clculo del parmetro se usar el complemento Solver de Excel, ya que debe ser

    determinado por ensayo y error.

  • Para empezar, se debe definir la celda cambiante que, como se mencion en el paso 3 del numeral

    3.3, debe ser la celda donde se asign el valor cero. Esta celda debe estar involucrada en una

    funcin. Vase la figura 3.

    El mejor estimador de es el valor de que proporcione el mejor ajuste de la lnea de regresin de los datos mustrales. El coeficiente de determinacin, r2, proporciona esta medida [1], ya que

    ste mide la cantidad de puntos que estn relacionados linealmente y, por lo tanto, la celda que

    contenga este valor ser la celda objetivo a maximizar pues el objetivo es mejorar el ajuste de la recta de regresin. Para iniciar el clculo se debe indicar al programa un punto de inicio, o punto

    semilla, en la celda cambiante. El mejor valor de inicio de es un valor ligeramente inferior al

    valor ms bajo del tiempo entre fallas de la muestra. Para el ejemplo, el punto semilla sera 0.166

    (es ligeramente inferior al valor ms bajo del tiempo entre fallas de la muestra, el cual corresponde

    al dato de orden uno 0.167. Vase la tabla 1). Este constituye la restriccin en Solver. Vase la figura 6.

    Es importante tener en cuenta que la celda objetivo debe contener una formula que relacione directa

    o indirectamente el valor de la celda cambiante. Para el ejemplo la formula sera

    COEFICIENTE.R2 (E3:E142, D3:D142). Obsrvese que el rango del segundo argumento involucra

    la celda cambiante L8. Vase la figura 3.

    Al hacer clic en el botn Resolver de la ventana Parmetros de Solver, el programa genera la

    solucin 0.161, siendo este el valor del parmetro de localizacin, y el coeficiente de correlacin se

    maximiza a 0.9886; es decir, al tener en cuenta el parmetro de localizacin se mejora el ajuste de la

    recta de regresin. De igual manera, los parmetros de forma y escala, y los valores de las abscisas

    (Xi) y ordenadas (Yi) se actualizan. Vase la figura 7.

  • Para que los valores se actualicen automticamente, stos deben estar relacionados por frmulas, tal y como se muestra en la figura 8.

    Ntese que el valor del parmetro de localizacin es positivo, corroborando lo dicho en la parte b)

    del numeral 3.4. La figura 9 muestra el trazo de la nueva recta de regresin, siendo notable la

    agrupacin de los puntos en forma de lnea. Comparece esta figura con la figura 5.

    En la figura 10 se muestra el grfico de la funcin de densidad de Weibull para los parmetros

    calculados. Reemplazndolos en la ecuacin (1) se obtiene la siguiente ecuacin:

  • CONCLUSIONES

    1. El mtodo de los mnimos cuadrados facilita el clculo de los parmetros de la distribucin de

    Weibull cuando se emplean programas informticos como Excel.

    2. El anlisis del grfico de la recta de regresin sirve de criterio para determinar si es necesario

    calcular el parmetro de localizacin.

    3. El parmetro de localizacin tiene un gran efecto en la recta de regresin; sin embargo, se debe

    analizar concienzudamente si un diferente de cero es necesario.

    4. El coeficiente de correlacin, r, y el coeficiente de determinacin, r2, se constituyen en una

    prueba de bondad de ajuste para la recta de regresin.

  • REFERENCIAS BIBLIOGRFICAS

    1. Dodson, Bryan. The Weibull Analysis Handbook. 2da ed. Milwaukee, Wisconsin: ASQ Quality Press, 2006.

    2. Abernethy, Robert B. The New Weibull Handbook. 5ta ed. North Palm Beach, Florida. 2006

    3. Walpole, Ronald E y Raymond Meyers. Probabilidad y estadstica para ingenieros. 3ra ed. Mxico: Interamericana, 1990

    4. Cspedes Zapata, Lucas y Santiago Meja Isaza. Implementacin de un Sistema de Indicadores para la gestin de Mantenimiento de una empresa textilera. Medelln,

    2005,194p. Trabajo de grado Ingeniera Mecnica. Universidad EAFIT. Departamento de

    Ingeniera Mecnica. rea de mantenimiento.

    5. Tamborero del Pino, Jos Mara. NPT 331: Fiabilidad: La distribucin de Weibull [En lnea] Disponible en:

    http://www.insht.es/InshtWeb/Contenidos/Documentacion/FichasTecnicas/NTP/Ficheros/30

    1a400/ntp_331.pdf [Consulta: 22 de julio de 2010]

    6. Estimation of the Weibull parameters [En lnea] Disponible en: http://www.weibull.com/LifeDataWeb/lifedataweb.htm [Consulta. 26 de julio de 2010]

    7. Yez, Medardo; Perdomo, Jos L y Gmez de la Vega, Hernando. Ingeniera de Confiabilidad: Pilar fundamental del mantenimiento [En lnea] Disponible en:

    http://confiabilidad.net/articulos/ingenieria-de-confiabilidad-pilar-fundamental-del-

    mantenimiento/#comment-list [Consulta: 28 de julio de 2010]

    8. Duarte Holgun, Juan Carlos. Mantenimiento centrado en confiabilidad usando mtodos de simulacin del ciclo de vida [En lnea] Disponible en:

    http://www.noria.com/sp/rwla/conferencias/mem/Duarte-paper.pdf [Consulta: 28 de julio de

    2010]

    9. Garca Palencia, Oliverio. Optimizacin estadstica del mantenimiento industrial [En lnea] Disponible en:

    http://www.aciem.org/bancoconocimiento/O/Optimizacionestadisticadelmantenimientoindus

    tr/Optimizacionestadisticadelmantenimientoindustr.asp [Consulta: 28 de julio de 2010]

    10. Luna, Ana Eugenia. Teora de la confiabilidad [En lnea] Disponible en: http://focuslab.lfp.uba.ar/public/CursoTErrores2k4/Monografias2005/Ana_E_Luna.pdf

    [Consulta: 22 de julio de 2010]