Pt2 a2 e1_pelm

27
“Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF mediante el Método de Regresión por Mínimos Cuadrados.” Elaboró: C. Pedro Lara Maldonado SEGUNDO AVANCE DEL PROYECTO TERMINAL

Transcript of Pt2 a2 e1_pelm

Page 1: Pt2 a2 e1_pelm

“Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF mediante el

Método de Regresión por Mínimos Cuadrados.”Elaboró: C. Pedro Lara Maldonado

SEGUNDO AVANCE DEL PROYECTO TERMINAL

Page 2: Pt2 a2 e1_pelm

INTEGRACIÓN DE LOS RESULTADOS PARA EL AJUSTE CUADRÁTICO

• Se procede a realizar manualmente la tabla de este ajuste, para poder aplicar la relación de variables en el método de mínimos cuadrados:

Suma por columna

Page 3: Pt2 a2 e1_pelm

LAS SUMATORIAS DE LA TABLA DEL AJUSTE DETERMINA LOS COEFICIENTES DE LA FUNCIÓN

CUADRÁTICA PARA LA DEPENDENCIA

• Se procede a encontrar los coeficientes: a través del siguiente sistema matricial para este ajuste cuadrático:

Page 4: Pt2 a2 e1_pelm

EL SISTEMA MATRICIAL SE PUEDE EXPRESAR COMO UN SISTEMA DE ECUACIONES.

• Realizando operaciones elementales en el sistema matricial, se obtiene el siguiente sistema de ecuaciones:

Page 5: Pt2 a2 e1_pelm

EMPLEANDO SOFTWARE MATEMÁTICO COMO ALTERNATIVA DE RESOLVER UN SISTEMA DE ECUACIONES DE TRES

INCÓGNITAS O COEFICIENTES A ENCONTRAR.

• Por lo que aquí se emplea el software matemático de Matrixcalc que este se localiza en la siguiente página electrónica: https://matrixcalc.org/es/slu.html cuya indicación a ejecutar es resolver el sistema de ecuaciones a través del Método de la Matriz Inversa que se define en este caso como:

Page 6: Pt2 a2 e1_pelm

DETERMINACIÓN DE LOS COEFICIENTES DEL AJUSTE POLINOMIAL CUADRÁTICO

• Por lo tanto los valores de los coeficientes, para este ajuste polinomial cuadrático, son:

• Estos coeficientes encontrados se sustituyen en la función de ajuste polinomial cuadrático:

Page 7: Pt2 a2 e1_pelm

INTEGRACIÓN DE RESULTADOS PARA LOS INTERVALOS DE PREDICCIÓN

• Considerando el ajuste polinomial cuadrático, conduce a estimar los probables intervalos de predicción al 95% de la deserción estudiantil, dada por la siguiente fórmula:

• Esto implica, sustituir los valores respectivos del percentil de una t Student y del error estándar de estimación para esta fórmula que define el ajuste polinomial cuadrático:

Page 8: Pt2 a2 e1_pelm

DETERMINANDO EL VALOR DEL PERCENTIL DE LA T STUDENT MEDIANTE SOFTWARE DE WOLFRAM ALPHA

• Para encontrar el percentil de la distribución t Student de se utiliza el software de wólfram alpha: http://www.wolframalpha.com/ de la siguiente manera:97.5 Percentile Student´s t distribution degrees of freedom 9

• Esta sintaxis a ejecutar, da el valor correspondiente de:

Page 9: Pt2 a2 e1_pelm

DEFINIR LOS ELEMENTOS MATRICIALES PARA REALIZAR OPERACIONES EN EL INTERVALO DE PREDICCIÓN.

• Para la matriz de parámetros, se consideran los valores de los coeficientes de la función polinomial cuadrática:

Page 10: Pt2 a2 e1_pelm

DEFINIR LOS ELEMENTOS MATRICIALES PARA REALIZAR OPERACIONES EN EL INTERVALO DE PREDICCIÓN.

• Para la matriz de diseño del ajuste polinomial:

Page 11: Pt2 a2 e1_pelm

DEFINIR LOS ELEMENTOS MATRICIALES PARA REALIZAR OPERACIONES EN EL INTERVALO DE PREDICCIÓN.

• Para la matriz de respuesta del modelo ajustado a los datos:

Page 12: Pt2 a2 e1_pelm

PARA CALCULAR EL ERROR DE LA ESTIMACIÓN

• Se procede a sustituir los elementos matriciales mencionados, para poder efectuar la operación matricial de la formula definida del numerador con el software de Matrixcalc https://matrixcalc.org/es/slu.html de la siguiente manera:

Page 13: Pt2 a2 e1_pelm

UN INTERVALO DE PREDICCIÓN GENERALIZADO QUE PUEDE ESTIMAR EL PDG ESTUDIANTIL.

• Por lo tanto, se sustituye los valores del percentil de la distribución t Student y del error de estimación en la fórmula generalizada del intervalo de predicción:

Para estimar la generación 2013:

Para estimar la generación 2014:

Page 14: Pt2 a2 e1_pelm

DEFINIENDO EL VALOR IZQUIERDO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE PARÁMETROS

EN LOS RESPECTIVOS INTERVALOS DE PREDICCIÓN

En la generación 2013, se sustituyen las matrices correspondientes al lado izquierdo de la bivalencia, para efectuar su operación:

Luego se ocupa el software de wólfram alpha: http://www.wolframalpha.com/ para efectuar la operación matricial del lado izquierdo de la bivalencia, considerando la siguiente instrucción:

{{1,13,169}}*{{91.42409},{-5.69021},{0.37881}} Por lo tanto, el valor del lado izquierdo de la bivalencia es:

Page 15: Pt2 a2 e1_pelm

DEFINIENDO EL VALOR IZQUIERDO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE PARÁMETROS

EN LOS RESPECTIVOS INTERVALOS DE PREDICCIÓN

En la generación 2014, se sustituyen las matrices correspondientes al lado izquierdo de la bivalencia, para efectuar su operación:

Luego se ocupa el software de wólfram alpha: http://www.wolframalpha.com/ para efectuar la operación matricial del lado izquierdo de la bivalencia, considerando la siguiente instrucción:

{{1,14,196}}*{{91.42409},{-5.69021},{0.37881}} Por lo tanto, el valor del lado izquierdo de la bivalencia es:

Page 16: Pt2 a2 e1_pelm

DEFINIENDO EL VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS

RESPECTIVOS INTERVALOS DE PREDICCIÓN

En la generación 2013, se sustituyen las matrices correspondientes al lado derecho de la bivalencia, para efectuar su operación:

Luego se ocupa el software de matrixcalc: https://matrixcalc.org/es/slu.html para encontrar la operación matricial del lado derecho de la bivalencia, por lo tanto, resulta:

Page 17: Pt2 a2 e1_pelm

DEFINIENDO EL VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS

RESPECTIVOS INTERVALOS DE PREDICCIÓN Luego se ocupa el software de wólfram alpha:

http://www.wolframalpha.com/ para efectuar la operación matricial del lado derecho de la bivalencia, considerando la siguiente instrucción:

{{1,13,169}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{13},{169}}

Esta sintaxis da el resultado de la operación matricial y por lo tanto este valor resultante se sustituye en la fórmula de intervalo de predicción:

Realizando operaciones elementales del lado derecho de la bivalencia , implica encontrar su valor respectivo, es decir:

Page 18: Pt2 a2 e1_pelm

DEFINIENDO EL VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS

RESPECTIVOS INTERVALOS DE PREDICCIÓN

En la generación 2014, se sustituyen las matrices correspondientes al lado derecho de la bivalencia, para efectuar su operación:

Luego se ocupa el software de matrixcalc: https://matrixcalc.org/es/slu.html para encontrar la operación matricial del lado derecho de la bivalencia, por lo tanto, resulta:

Page 19: Pt2 a2 e1_pelm

DEFINIENDO EL VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS

RESPECTIVOS INTERVALOS DE PREDICCIÓN Luego se ocupa el software de wólfram alpha:

http://www.wolframalpha.com/ para efectuar la operación matricial del lado derecho de la bivalencia, considerando la siguiente instrucción:

{{1,14,196}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{14},{196}}

Esta sintaxis da el resultado de la operación matricial y por lo tanto este valor resultante se sustituye en la fórmula de intervalo de predicción:

Realizando operaciones elementales del lado derecho de la bivalencia , implica encontrar su valor respectivo, es decir:

Page 20: Pt2 a2 e1_pelm

CORROBORANDO LOS LÍMITES DEL INTERVALO DE PREDICCIÓN MEDIANTE EL SOFTWARE DE OCTAVE-MATLAB

Estos límites encontrados de cada intervalo predictivo, se corrobora mediante el software de Octave-MATLAB: http://octave-online.net/ donde se consideran las siguientes instrucciones a ejecutar:

• [p,S] = polyfit(x,y,n): Da los coeficientes del polinomio p de grado n que se encontró manualmente en la ecuación de la mejor función polinomial que ajusta los puntos (x,y) por mínimos cuadrados, con errores estimados S

• [Y,D] = polyconf(p,X,S,alpha): Predicción polinómica con intervalos de confianza Y±D de la salida S dada por polyfit con nivel de confianza alpha (considerando la ecuación del intervalo de predicción, se menciona que es del 95%, es decir 0.05)

Page 21: Pt2 a2 e1_pelm

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Estas instrucciones definidas, implica introducir las variables de los puntos del ajuste considerado, es decir (x,y)=(Generacion,Desercion) con el siguiente orden fundamental:

octave:1>Desercion=[88.60,82.68,73.51,75.39, 70.57,68.13,69.89,73.59,73.78,74.13,74.34,74.87];

octave:2>Generacion=[1,2,3,4,5,6,7,8,9,10,11, 12];

Page 22: Pt2 a2 e1_pelm

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Luego, se agrega la instrucción polyfit definida en este caso, como:

octave:3>[p,S]=polyfit(Generacion,Desercion,2)p =

0.37881 -5.69021 91.42409

S =scalar structure containing the fields: yf =

Columns 1 through 8:86.113 81.559 77.763 74.724 72.443 70.92070.154 70.146

Columns 9 through 12:70.896 72.403 74.668 77.690

Page 23: Pt2 a2 e1_pelm

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

X = 1 1 1 4 2 1 9 3 1 16 4 1 25 5 1 36 6 1 49 7 1 64 8 1 81 9 1 100 10 1 121 11 1 144 12 1

• En efecto, estos resultados concuerdan con los que se obtuvieron manualmente.

Page 24: Pt2 a2 e1_pelm

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Por lo tanto, se corroboran los predichos intervalos estudiantiles de la generación 2013 y 2014 de desertores, esto implica considerar lo que se obtuvo de la implementación polyfit para que se encuentra la última instrucción definida:

octave:4> [Y,D] = polyconf(p,13,S,0.05)

Y = 81.470D = 8.978 octave:5> [Y,D] = polyconf(p,14,S,0.05)

Y = 86.008D = 10.722

• Esta sintaxis ejecutada da certeza de nuestros resultados obtenidos.

Page 25: Pt2 a2 e1_pelm

ANÁLISIS DE RESULTADOS • Estos límites predictivos de cada intervalo corroborado, se

puede expresar de la siguiente manera:

Para la generación 2013:

Para la generación 2014:

Page 26: Pt2 a2 e1_pelm

INTERPRETACIÓN DE RESULTADOS • En estos dos avances se ha partido de la premisa de que un modelo estadístico

paramétrico se encuentra por medio del grado que determina el óptimo ajuste funcional polinomial, que dependen principalmente del nivel de confianza al 95% y de su vía asociada al percentil de la distribución de Student cuyos límites involucra qué para tamaños de muestras grandes, varía los resultados de la siguiente manera:

Para la generación 2013 su intervalo predictivo porcentual de su ecuación, se compara con el último valor obtenido en los datos del ajuste, es decir con el porcentaje de la generación 2012; por lo tanto, se menciona que para su límite inferior el valor se considera optimista a razón de que es proporcional y en su límite superior el valor es fatalista por que incrementa significativamente

Para la generación 2014 su intervalo predictivo porcentual de su ecuación se compara en los respectivos límites del intervalo obtenido en la ecuación de la generación 2013 por lo tanto, se menciona que para su límite inferior el valor aumenta sustancialmente y en su límite superior el valor es catastrófico porque sigue incrementando la deserción estudiantil.

• Esto refleja el error de muestreo de deserción estudiantil inherente al cálculo del error estándar de su dispersión generacional.

Page 27: Pt2 a2 e1_pelm

VIDEO DE EXPOSICIÓN DE SU SERVIDOR. • El link correspondiente se localiza en:https://www.youtube.com/watch?v=w0Xnhd9Etp4https://www.youtube.com/watch?v=w0Xnhd9Etp4

Gracias por su atención