Logo_Icesi
 

Modelo de predicción de diabetes tipo 2 (DMT2) a partir de variables no clínicas en una población asegurada del suroccidente colombiano perteneciente al régimen subsidiado

Miniatura

Fecha

2023-07-10

Autores

Castro Salamanca, Larry Farid
López, Juan Esteban

Director de tesis/Asesor

Título de la revista

ISSN de la revista

Título del volumen

Publicador

Universidad Icesi

Editor

Compartir

Documentos PDF

Resumen

Este trabajo de grado desarrolla un modelo de aprendizaje supervisado para la detección temprana de Diabetes Mellitus Tipo 2 en poblaciones vulnerables del suroccidente colombiano. Utilizando la metodología CRISP-DM, se analizaron datos no clínicos (sociales y ambientales) de una EPS del régimen subsidiado. Debido al fuerte desbalance de clases (6.3% de prevalencia), se aplicaron técnicas de muestreo como SMOTE y Undersampling, priorizando la sensibilidad (recall) como métrica principal. Los resultados demuestran que algoritmos como Naive Bayes y XGBoost (con técnicas de muestreo) logran un equilibrio entre exactitud y sensibilidad, ofreciendo una alternativa eficiente y de bajo costo para la gestión del riesgo en zonas rurales de difícil acceso.


Abstract

This thesis develops a supervised learning model for the early detection of Type 2 Diabetes Mellitus in vulnerable populations in southwestern Colombia. Using the CRISP-DM methodology, non-clinical data (social and environmental) from a subsidized health regime (EPS) were analyzed. Given the severe class imbalance (6.3% prevalence), sampling techniques such as SMOTE and Undersampling were applied, prioritizing recall as the key performance metric. The results show that algorithms like Naive Bayes and XGBoost (combined with sampling) achieve a balance between accuracy and sensitivity, providing a cost-effective alternative for risk management in remote rural areas with limited clinical logistics.

Resumo

Descripción

Palabras clave

Diabetes Mellitus, Variables No Clínicas, Machine Learning, Balance de Clases, Modelo de Predicción, Tesis de Maestría en Ciencia de Datos

Keywords

Diabetes Mellitus, Non-Clinical Variables, Machine Learning, Class Balance, Prediction Model,

Palavras-chave

Citación

DOI

Handle

ISBN

ISSN

URL

YouTube