Modelo de predicción de diabetes tipo 2 (DMT2) a partir de variables no clínicas en una población asegurada del suroccidente colombiano perteneciente al régimen subsidiado
Archivos
Fecha
Autores
Director de tesis/Asesor
Título de la revista
ISSN de la revista
Título del volumen
Publicador
Editor
Compartir
Resumen
Este trabajo de grado desarrolla un modelo de aprendizaje supervisado para la detección temprana de Diabetes Mellitus Tipo 2 en poblaciones vulnerables del suroccidente colombiano. Utilizando la metodología CRISP-DM, se analizaron datos no clínicos (sociales y ambientales) de una EPS del régimen subsidiado. Debido al fuerte desbalance de clases (6.3% de prevalencia), se aplicaron técnicas de muestreo como SMOTE y Undersampling, priorizando la sensibilidad (recall) como métrica principal. Los resultados demuestran que algoritmos como Naive Bayes y XGBoost (con técnicas de muestreo) logran un equilibrio entre exactitud y sensibilidad, ofreciendo una alternativa eficiente y de bajo costo para la gestión del riesgo en zonas rurales de difícil acceso.
Abstract
This thesis develops a supervised learning model for the early detection of Type 2 Diabetes Mellitus in vulnerable populations in southwestern Colombia. Using the CRISP-DM methodology, non-clinical data (social and environmental) from a subsidized health regime (EPS) were analyzed. Given the severe class imbalance (6.3% prevalence), sampling techniques such as SMOTE and Undersampling were applied, prioritizing recall as the key performance metric. The results show that algorithms like Naive Bayes and XGBoost (combined with sampling) achieve a balance between accuracy and sensitivity, providing a cost-effective alternative for risk management in remote rural areas with limited clinical logistics.
