Pt2 a3 e1_pelm

42
“Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF mediante el Método de Regresión por Mínimos Cuadrados.” Elaboró: C. Pedro Lara Maldonado PRESENTACIÓN DEL PROYECTO TERMINAL (3ER. AVANCE)

Transcript of Pt2 a3 e1_pelm

Page 1: Pt2 a3 e1_pelm

“Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF mediante el

Método de Regresión por Mínimos Cuadrados.”Elaboró: C. Pedro Lara Maldonado

PRESENTACIÓN DEL PROYECTO TERMINAL(3ER. AVANCE)

Page 2: Pt2 a3 e1_pelm

INTRODUCCIÓN

• La deserción escolar en esta dependencia es un grave problema para los habitantes capitalinos, por que genera consecuencias de desarrollo sustentable en las oportunidades de conseguir un buen empleo (Díaz, 2015).

• Para analizar cuantitativamente este evento a lo largo del tiempo y determinar la predicción certera de esta problemática de deserción en el IEMSDF, se considera el Modelo Estadístico del Ajuste de Funciones mediante el Método de Regresión por mínimos cuadrados (Gujarati, 2012).

Page 3: Pt2 a3 e1_pelm

OBJETIVO

• Realizar predicciones de la deserción estudiantil en las últimas generaciones que no se realizado el cohorte de registro en la Subdirección de Administración Escolar que comprenden del año 2013 hasta el 2014:

Para plantear una magnitud de aproximación de este fenómeno. Para construir una estimación muestral. Para definir cuál de los posibles valores futuros de la variable

objetivo es más probable.

Page 4: Pt2 a3 e1_pelm

METODOLOGÍA • Se tomó del registro de la base de datos del Sistema de Información Mexicana

del Distrito Federal (INFOMEXDF) que nos proporciona la dependencia paraestatal por parte de la Subdirección de Administración Escolar.

Page 5: Pt2 a3 e1_pelm

DELIMITACIÓN GENERAL DE ESTE ANÁLISIS ESTADÍSTICO

• Para: Analizar la Modalidad Escolarizada • Se pusieron las siguientes restricciones a seguir, en

cuestión de: No tomar en cuenta el género estudiantil (estudiantes

mujeres y estudiantes hombres).No considerar los rangos de edad de los estudiantes.

Page 6: Pt2 a3 e1_pelm

LA CONSIDERACIONES PARA CALCULAR EL PORCENTAJE DE LA DESERCIÓN ESTUDIANTIL

• De esta base de datos del Sistema INFOMEXDF, se tomó el registro del número total generacional de los:

1. Estudiantes de Nuevo Ingreso. 2. Estudiantes que Egresaron, este indicador se baso en el

número de certificados de terminación que ha emitido la Subdirección de Administración Escolar.

Page 7: Pt2 a3 e1_pelm

LAS VARIABLES QUE SE OCUPAN EN ESTE ANÁLISIS

Definiendo para como la representación discreta de la generación escolar considerando desde la fundación del IEMS, que es a partir de la generación 2001 hasta la delimitación de la generación 2012, a razón de que son todos los datos que tenemos disponibles en el sistema INFOMEXDF.

Definiendo para como el porcentaje de deserción generacional- que se define por medio de la siguiente fórmula (Ponce,2003):

Donde: Número de estudiantes que ingresaron por generación.Número de estudiantes que egresaron por generación.

Page 8: Pt2 a3 e1_pelm

CÁLCULO DE LA TABLA DE DATOS DEFINITIVOS PARA ESTA DEPENDENCIA DEL IEMSDF

Generación EIG EEG PDG2001-1 3062 349 88.62002-2 3719 644 82.682003-3 3401 901 73.512004-4 5647 1390 75.392005-5 5443 1602 70.572006-6 5538 1765 68.132007-7 5762 1735 69.892008-8 5804 1533 73.592009-9 5729 1502 73.782010-10 6149 1591 74.132011-11 6625 1700 74.342012-12 6372 1601 74.872013-13 6349 ¿? ¿?2014-14 6826 ¿? ¿?

Page 9: Pt2 a3 e1_pelm

APLICACIÓN DEL INSTRUMENTO, SIMULACIÓN Y PRUEBA DE FUNCIONAMIENTO.

• Para poder realizar el óptimo ajuste funcional a los datos de la dependencia; se corrobora mediante el software de wólfram alpha: http://www.wolframalpha.com/ con la siguiente instrucción:

fit {{1,86.60}, {2,82.68}, {3,73.51}, {4,75.39}, {5,70.57}, {6,68.13}, {7,69.89}, {8,73.59}, {9,73.78}, {10,74.13}, {11,74.34}, {12,74.87}} • Esta sintaxis a ejecutar, da las mejores opciones de

ajuste funcional a los datos, mediante una tabla diagnóstica de determinación.

Page 10: Pt2 a3 e1_pelm

LA TABLA DIAGNÓSTICA DE DETERMINACIÓN PARA EL AJUSTE FUNCIONAL DE LOS DATOS DEL IEMS

• La siguiente tabla diagnóstica de determinación del software wólfram alpha proporciona los ajustes funcionales polinomiales viables a los datos:

Page 11: Pt2 a3 e1_pelm

EL CRITERIO DE DETERMINACIÓN PARA LA ELECCIÓN DE UN ÚNICO AJUSTE VIABLE.

• Para poder aplicar el método de regresión por mínimos cuadrados a un ajuste viable a los datos se debe cumplir en la tabla diagnóstico de wólfram alpha el siguiente criterio de determinación, dado por (Infante,2012):

Donde:Coeficiente de determinación

Coeficiente de determinación ajustado, para poder identificar este término en la tabla diagnóstico de wólfram alpha, se considera su

significado en inglés: adjusted

Page 12: Pt2 a3 e1_pelm

LA ELECCIÓN DE UN ÚNICO AJUSTE MEDIANTE EL CRITERIO DE DETERMINACIÓN.

• Para aplicar el criterio de determinación a la tabla diagnóstico de wólfram alpha en sus respectivas opciones, se debe identificar el valor :

Page 13: Pt2 a3 e1_pelm

LA DETERMINACIÓN DE UN ÓPTIMO AJUSTE POLINOMIAL

• Para determinar un óptimo ajuste polinomial, que en este caso es cuadrático, se debe corroborar el cumplimiento del criterio de determinación, es decir:

• Esta determinación implica la consideración de elaborar

manualmente la tabla de ajuste de regresión por mínimos cuadrados para esta función determinada.

Page 14: Pt2 a3 e1_pelm

LA CONSIDERACIÓN DE ELABORAR LA TABLA DEL AJUSTE POLINOMIAL CUADRÁTICO PARA

LOS DATOS DE LA DEPENDENCIA IEMSDF

Suma por

columna

Page 15: Pt2 a3 e1_pelm

LAS SUMATORIAS DE LA TABLA DEL AJUSTE DETERMINA LOS COEFICIENTES DE LA FUNCIÓN CUADRÁTICA

• Se procede a encontrar los coeficientes: a través del siguiente sistema matricial para este ajuste cuadrático:

• Luego se resuelve el sistema matricial a través del Método de la Inversa por medio del software de Matrixcalc, que en este caso, se define por:

Page 16: Pt2 a3 e1_pelm

LOS COEFICIENTES DEL AJUSTE POLINOMIAL CUADRÁTICO CONDUCE LA ESTIMACIÓN DE UN INTERVALO DE PREDICCIÓN

AL 95% DE CONFIANZA PARA GENERACIONES FUTURAS

• Este intervalo de predicción esta dada por la siguiente fórmula (Wackerly, 2010):

Donde Bivalencia

Su matriz inversaNúmero de datos

Grado del mejor ajuste polinomial La variable porcentual de deserción que define la generación discreta

del pronóstico

Page 17: Pt2 a3 e1_pelm

LOS ELEMENTOS DE UN INTERVALO DE PREDICCIÓN PARA GENERACIONES FUTURAS

Definiendo: • La matriz pronóstico para datos discretos

generacionales:

Es decir:• Para la generación 2013, implica que: • La matriz de parámetros:

Page 18: Pt2 a3 e1_pelm

LOS ELEMENTOS DE UN INTERVALO DE PREDICCIÓN PARA GENERACIONES FUTURAS

Definiendo: • La matriz de diseño del ajuste polinomial:

• La matriz de respuesta del modelo ajustado a los datos:

Page 19: Pt2 a3 e1_pelm

LOS ELEMENTOS DE UN INTERVALO DE PREDICCIÓN PARA GENERACIONES FUTURAS

Considerando que: • El percentil de una Student , se caracteriza por: Sus grados de libertad, que se define por: Su nivel de confianza al en su distribución probabilística. Es decir:

Page 20: Pt2 a3 e1_pelm

LOS ELEMENTOS DE UN INTERVALO DE PREDICCIÓN PARA GENERACIONES FUTURAS

Considerando que: • El error estándar de estimación es:

Donde:Suma de cuadrados del error

Su respectiva matriz transpuesta

Page 21: Pt2 a3 e1_pelm

RESULTADOS • Se procede a realizar manualmente la tabla de este ajuste, para poder

aplicar la relación de variables en el método de mínimos cuadrados:

Suma por

columna

Page 22: Pt2 a3 e1_pelm

LAS SUMATORIAS DE LA TABLA DEL AJUSTE DETERMINA LOS COEFICIENTES DE LA FUNCIÓN CUADRÁTICA

• Se procede a encontrar los coeficientes: a través del siguiente sistema matricial para este ajuste cuadrático:

• Luego se resuelve el sistema matricial a través del Método de la Inversa por medio del software de Matrixcalc, que en este caso, se define por:

Page 23: Pt2 a3 e1_pelm

DETERMINACIÓN DE LOS COEFICIENTES DEL AJUSTE POLINOMIAL CUADRÁTICO

• Por lo tanto los valores de los coeficientes, para este ajuste polinomial cuadrático, son definidos en su matriz de parámetros:

• Estos coeficientes encontrados se sustituyen en la función de ajuste polinomial cuadrático:

Page 24: Pt2 a3 e1_pelm

INTEGRACIÓN DE RESULTADOS PARA LOS INTERVALOS DE PREDICCIÓN

• Considerando el ajuste polinomial cuadrático, conduce a estimar los probables intervalos de predicción al 95% de la deserción estudiantil, dada por la siguiente fórmula:

• Esto implica, sustituir los valores respectivos del percentil de una t Student y del error estándar de estimación para esta fórmula que define el ajuste polinomial cuadrático:

Page 25: Pt2 a3 e1_pelm

DETERMINANDO EL VALOR DEL PERCENTIL DE LA T STUDENT MEDIANTE SOFTWARE DE WOLFRAM ALPHA

• Para encontrar el percentil de la distribución t Student de se utiliza el software de wólfram alpha: http://www.wolframalpha.com/ de la siguiente manera:97.5 Percentile Student´s t distribution degrees of freedom 9

• Esta sintaxis a ejecutar, da el valor correspondiente de:

Page 26: Pt2 a3 e1_pelm

DEFINIR LOS ELEMENTOS MATRICIALES PARA REALIZAR OPERACIONES EN EL INTERVALO DE PREDICCIÓN.

• Para la matriz de diseño del ajuste polinomial:

Page 27: Pt2 a3 e1_pelm

DEFINIR LOS ELEMENTOS MATRICIALES PARA REALIZAR OPERACIONES EN EL INTERVALO DE PREDICCIÓN.

• Para la matriz de respuesta del modelo ajustado a los datos:

Page 28: Pt2 a3 e1_pelm

PARA CALCULAR EL ERROR DE LA ESTIMACIÓN

• Se procede a sustituir los elementos matriciales mencionados, para poder efectuar la operación matricial de la formula definida del numerador con el software de Matrixcalc https://matrixcalc.org/es/slu.html de la siguiente manera:

Page 29: Pt2 a3 e1_pelm

UN INTERVALO DE PREDICCIÓN GENERALIZADO QUE PUEDE ESTIMAR EL PDG ESTUDIANTIL.

• Por lo tanto, se sustituye los valores del percentil de la distribución t Student y del error de estimación en la fórmula generalizada del intervalo de predicción:

Para estimar la generación 2013:

Para estimar la generación 2014:

Page 30: Pt2 a3 e1_pelm

DEFINIENDO EL VALOR IZQUIERDO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE PARÁMETROS

EN LOS RESPECTIVOS INTERVALOS DE PREDICCIÓN

En la generación 2013, se sustituyen las matrices correspondientes al lado izquierdo de la bivalencia, para efectuar su operación:

Luego se ocupa el software de wólfram alpha: http://www.wolframalpha.com/ para efectuar la operación matricial del lado izquierdo de la bivalencia, considerando la siguiente instrucción:

{{1,13,169}}*{{91.42409},{-5.69021},{0.37881}} Por lo tanto, el valor del lado izquierdo de la bivalencia es:

Page 31: Pt2 a3 e1_pelm

DEFINIENDO EL VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS

RESPECTIVOS INTERVALOS DE PREDICCIÓN

En la generación 2013, se sustituyen las matrices correspondientes al lado derecho de la bivalencia, para efectuar su operación:

Luego se ocupa el software de matrixcalc: https://matrixcalc.org/es/slu.html para encontrar la operación matricial del lado derecho de la bivalencia, por lo tanto, resulta:

Page 32: Pt2 a3 e1_pelm

DEFINIENDO EL VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS

RESPECTIVOS INTERVALOS DE PREDICCIÓN Luego se ocupa el software de wólfram alpha:

http://www.wolframalpha.com/ para efectuar la operación matricial del lado derecho de la bivalencia, considerando la siguiente instrucción:

{{1,13,169}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{13},{169}}

Esta sintaxis da el resultado de la operación matricial y por lo tanto este valor resultante se sustituye en la fórmula de intervalo de predicción:

Realizando operaciones elementales del lado derecho de la bivalencia , implica encontrar su valor respectivo, es decir:

Page 33: Pt2 a3 e1_pelm

CORROBORANDO LOS LÍMITES DEL INTERVALO DE PREDICCIÓN MEDIANTE EL SOFTWARE DE OCTAVE-MATLAB

Estos límites encontrados de cada intervalo predictivo, se corrobora mediante el software de Octave-MATLAB: http://octave-online.net/ donde se consideran las siguientes instrucciones a ejecutar:

• [p,S] = polyfit(x,y,n): Da los coeficientes del polinomio p de grado n que se encontró manualmente en la ecuación de la mejor función polinomial que ajusta los puntos (x,y) por mínimos cuadrados, con errores estimados S

• [Y,D] = polyconf(p,X,S,alpha): Predicción polinómica con intervalos de confianza Y±D de la salida S dada por polyfit con nivel de confianza alpha (considerando la ecuación del intervalo de predicción, se menciona que es del 95%, es decir 0.05)

Page 34: Pt2 a3 e1_pelm

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Estas instrucciones definidas, implica introducir las variables de los puntos del ajuste considerado, es decir (x,y)=(Generacion,Desercion) con el siguiente orden fundamental:

octave:1>Desercion=[88.60,82.68,73.51,75.39, 70.57,68.13,69.89,73.59,73.78,74.13,74.34,74.87];

octave:2>Generacion=[1,2,3,4,5,6,7,8,9,10,11, 12];

Page 35: Pt2 a3 e1_pelm

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Luego, se agrega la instrucción polyfit definida en este caso, como:

octave:3>[p,S]=polyfit(Generacion,Desercion,2)p =

0.37881 -5.69021 91.42409

• En efecto , estos coeficientes concuerdan con los que se obtuvieron manualmente en el ajuste.

Page 36: Pt2 a3 e1_pelm

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Por lo tanto, se corroboran los predichos intervalos estudiantiles de la generación 2013 y 2014 de desertores, esto implica considerar lo que se obtuvo de la implementación polyfit para que se encuentra la última instrucción definida:

octave:4> [Y,D] = polyconf(p,13,S,0.05)

Y = 81.470D = 8.978 octave:5> [Y,D] = polyconf(p,14,S,0.05)

Y = 86.008D = 10.722

• Esta sintaxis ejecutada da certeza de nuestros resultados obtenidos.

Page 37: Pt2 a3 e1_pelm

ANÁLISIS DE LOS RESULTADOS ESTIMADOS

• Estos límites predictivos de cada intervalo corroborado, se puede expresar de la siguiente manera:

Para la generación 2013:

Para la generación 2014:

Page 38: Pt2 a3 e1_pelm

INTERPRETACIÓN DE RESULTADOS

• En estos dos avances se ha partido de la premisa de que un modelo estadístico paramétrico:

Se encuentra por medio del grado que determina el óptimo ajuste funcional polinomial.

Depende principalmente del nivel de confianza al 95% y de su vía asociada al percentil de la distribución de Student.

Page 39: Pt2 a3 e1_pelm

INTERPRETACIÓN DE RESULTADOS • Los límites porcentuales de cada intervalo predictivo involucra qué

para tamaños de muestras grandes, varía los resultados de la siguiente manera:

Para la generación 2013 en su respectiva desigualdad encontrada, se compara con el último valor obtenido en los datos del ajuste, es decir con el porcentaje de la generación 2012; por lo tanto, se menciona que para su límite inferior el valor se considera optimista a razón de que es proporcional y en su límite superior el valor es fatalista por que incrementa significativamente

Para la generación 2014 en su respectiva desigualdad encontrada, se compara con la desigualdad de la generación 2013 en sus respectivos límites, por lo tanto, se menciona que para su límite inferior el valor aumenta sustancialmente y en su límite superior el valor es catastrófico porque sigue incrementando la deserción estudiantil.

Page 40: Pt2 a3 e1_pelm

CONCLUSIONES

• Este tratamiento informativo de resultados en su valor porcentual de cada intervalo predicho:

Refleja el error de muestreo de deserción estudiantil inherente al cálculo del error estándar de su dispersión generacional.

Puede ser inferido a partir de un profundo estudio del pasado y aceptando que el comportamiento de los agentes históricos no se modifica sustancialmente.

Se interpreta a corto plazo, la cobertura de la eficacia terminal. Busque alentar a la dependencia, en incentivar la flexibilidad de

culminar los estudios, a cada aprendiz del sistema escolarizado que esté en riesgo de abandonar su plantel, para que le genere una visión de superación personal al desarrollo profesional.

Page 41: Pt2 a3 e1_pelm

REFERENCIAS BIBLIOGRÁFICAS.

• Díaz Martínez, Juan Pablo (2015) Deserción Escolar en la Educación Media Superior: Una aproximación logística Ed. UNAM-Facultad de Ciencias en: http://132.248.9.195/ptd2015/junio/306158177/Index.html

• Gujarati, Damodar N. (2010) Econometría (5ª Edición) Ed. McGraw-Hill Interamericana.

• Infante Gil, Said. (2012) Métodos Estadísticos: Un Enfoque Interdisciplinario. (3ª Edición) Ed. La Gaya Ciencia-COLPOS-SAGARPA.

• Sistema de Información Mexicana del Distrito Federal, INFOMEXDF. (2016) “Solicitud de Información Pública registrada y aprobada con el número de folio: 0311000001716; con los datos estadísticos estudiantiles del ingreso (apartado 4)) y del egreso (apartado 3)) desde su primera generación hasta su última generación en todos los planteles que la conforman.” Ed. DE-SAE-IEMSDF, en: http://www.infomexdf.org.mx/flslayer/seguimiento/d90c0f2c/06cd56f7/Respuesta%201716.pdf

• Wackerly, Dennis D. (2010) Estadística Matemática con Aplicaciones. (7ª Edición) Ed. Cengage Learning.

Page 42: Pt2 a3 e1_pelm

VIDEO DE EXPOSICIÓN DE SU SERVIDOR. • El link correspondiente se localiza en:https://www.youtube.com/watch?v=7Uy2Zcuoh0Yhttps://www.youtube.com/watch?v=7Uy2Zcuoh0Y

Gracias por su atención