Post on 26-Dec-2021
Salesforce Predictive Modelling Equipo WorkingData
¿Quiénes somos?
2 #UniversityHack
WorkingData
DAVID JIMÉNEZ PAREDES
RAÚL LÓPEZ JIMÉNEZ FRANCISCO JAVIER VÍLCHEZ TORRALBA
¿Por dónde empezar?
3
#UniversityHack
WorkingData R
ET
OS
R1
R2
R3
Desconocimiento teórico en el ámbito asociado al reto
Conjunto de datos con una elevada dimensionalidad
Contexto de las variables desconocido
Distribución del poder adquisitivo
4 #UniversityHack
WorkingData
Clase B
aja C
lase Alta
5 #UniversityHack
WorkingData
¿Afecta la tenencia de productos? C
LASE
ALT
A
CLA
SE B
AJA
Misma distribución de tenencia de productos en ambas clases económicas
SE PUEDEN ELIMINAR, REDUCCIÓN DE
DIMENSIONALIDAD
Trabajando con clase “Baja”
6 #UniversityHack
WorkingData
¿QUÉ SON ESOS PICOS?
¿VARIAS POBLACIONES JUNTAS EN EL DATASET?
¿TIENEN ALGO EN COMÚN?
Regresión lineal Lasso Modelos
8 #UniversityHack
WorkingData
Light GBM, Gradient Boosting Regression, XGBoost...
Modelos de apilamiento/Stacking Models
Evaluación del modelo
9 #UniversityHack
WorkingData
Medida de evaluación Root Mean Squared Logarithmic Error (RMSLE) Validación Cruzada K_fold = 5 Tuning parámetros por cada modelo
Mejor modelo Modelo de apilamiento
RMSLE(Train) = 0.2579
Herramientas Utilizadas
10 #UniversityHack
WorkingData