Logo_Icesi
 

Modelos de aprendizaje automático para la optimización de la gestión farmacéutica

dc.audienceTodo Público
dc.contributor.advisorSosa, Anibal
dc.contributor.advisorAristizabal, Andres A.
dc.contributor.audiovisualdesignerSosa Aguirre, Anibal
dc.contributor.audiovisualdesignerAristizabal Pinzón, Andres Alberto
dc.contributor.authorBotero, Bertha G.
dc.contributor.authorBotero, Susan L.
dc.coverage.spatialCali de Lat: 03 24 00 N degrees minutes Lat: 3.4000 decimal degrees Long: 076 30 00 W degrees minutes Long: -76.5000 decimal degrees.
dc.date.accessioned2026-03-09T22:31:28Z
dc.date.available2026-03-09T22:31:28Z
dc.date.issued2023-06-22
dc.description.abstractEste documento aborda la implementación de un modelo de aprendizaje automático para la optimización de la gestión farmacéutica. El objetivo de este modelo es fortalecer la prevención y la promoción de estilos de vida saludables, así como prevenir oportunamente las complicaciones asociadas a enfermedades existentes. Se busca mejorar la calidad de la atención médica, garantizar la seguridad y eficacia en la prescripción de medicamentos y optimizar el uso de los recursos sanitarios. El proyecto se centra en 19.362 pacientes diabéticos de la cohorte cardiovascular de una entidad promotora de salud. El objetivo es formular una alternativa para mejorar los resultados clínicos de estos pacientes mediante la optimización de la gestión farmacéutica. El objetivo es crear una solución analítica y funcional que permita mantener buenos resultados de salud en los pacientes, a la vez que se logra la eficiencia operativa en el servicio y el control presupuestario de los tratamientos médicos. El proyecto utilizó la metodología CRISP-DM (Proceso Estándar Intersectorial para Minería de Datos). Esta metodología ha sido estandarizada, especialmente en el sector industrial para proyectos de minería de datos (Wirth, 2000), y continúa siendo ampliamente utilizada en proyectos analíticos debido a su versatilidad. Además, se utilizó el algoritmo XGBoost (Extreme Gradient Boosting) para iterar diferentes arquitecturas y transformaciones de variables, además de la ingeniería de variables que incluyó, entre otros, el número de pacientes. Entre los principales resultados, se observó que variables como la edad, el sexo, el sobrepeso, la obesidad, el índice de masa corporal y la hemoglobina glucosilada (HbA1c) están estrechamente relacionadas con la diabetes y podrían incluirse en el modelo de pronóstico. Se realizaron pronósticos para la cantidad de dosis de 5 medicamentos que forman parte de la prescripción del tratamiento de la cohorte. Se concluye que el aprendizaje automático es una herramienta eficaz para optimizar la gestión farmacéutica, al predecir la cantidad de dosis de medicamentos en pacientes diabéticos de la cohorte cardiovascular. Los resultados indican que el algoritmo XGBoost tuvo el mejor rendimiento en comparación con otros algoritmos evaluados, como LSTM y LightgBM.spa
dc.description.abstractThis document addresses the implementation of a machine learning model for the optimization of pharmaceutical management. The objective of this model is to strengthen the prevention and promotion of healthy lifestyles, as well as to prevent complications associated with existing diseases in a timely manner. The aim is to improve the quality of medical care, ensure the safety and efficacy in drug prescription, and optimize the use of health resources. The project focuses on 19,362 diabetic patients from the cardiovascular cohort of a health promotion entity. The purpose is to formulate an alternative to improve the clinical outcomes of these patients through the optimization of pharmaceutical management. The goal is to create an analytical and functional solution that allows maintaining good health outcomes in patients, while achieving operational efficiency in service and budgetary control of medical treatments. The project used the CRISP-DM (Cross-Industry Standard Process for Data Mining) methodology. This methodology has been standardized, especially in the industry sector for data mining projects (Wirth, 2000) and continues to be widely used in analytical projects due to its versatility. Furthermore, the XGBoost (Extreme Gradient Boosting) algorithm was used to iterate different architectures and variable transformations, in addition to variable engineering which included, among others, the number of patients. Among the main results, it was observed that variables such as age, sex, overweight, obesity, body mass index, and glycated hemoglobin (HbA1c) are closely related to diabetes and could be included in the forecasting model. Forecasts were made for the quantity of doses of 5 medicines that are part of the cohort's treatment prescription. It is concluded that machine learning is an effective tool for optimizing pharmaceutical management, by predicting the quantity of drug doses in diabetic patients of the cardiovascular cohort. The results indicate that the XGBoost algorithm performed best compared to other evaluated algorithms, such as LSTM and LightgBM.eng
dc.description.degreelevelMagíster
dc.description.degreenameTrabajo de grado para optar al título de Magister en Ciencia de Datos
dc.description.tableofcontentsRESUMEN . 5 -- 1. INTRODUCCIÓN. . 6 -- 1.1. Contexto -- Antecedentes y Justificación . 6 -- 1.2. Planteamiento del Problema . 6 -- 1.3. Objetivo General . 7 -- 1.4. Objetivos Específicos . 8 -- 2. ANTECEDENTES . 8 -- 2.1. Marco Teórico . 8 -- 2.1.1. Dominio del Problema. . 8 -- 2.1.2. Dominio de la Solución . 10 -- 2.1.3. Estrategia de validación de modelos . 14 -- 2.1.4. Métricas de evaluación de modelos de pronósticos . 15 -- 2.2. Estado del Arte . 16 -- 2.2.1. Trabajos seleccionados . 16 -- 2.2.2. Matriz resumen de trabajos . 19 -- 3. METODOLOGÍA . 20 -- 3.1. Conceptual . 20 -- 3.1.1. Fases de la Metodología CRISP . 21 -- 4. DESARROLLO . 22 -- 4.1. Comprensión del negocio . 23 -- 4.1.1. Tipo de estudio . 23 -- 4.1.2. Población de estudio . 23 -- 4.1.3. Criterios de inclusión y exclusión . 23 -- 4.1.4. Variables de estudio . 24 -- 4.2. Comprensión de los datos . 25 -- 4.2.1. Estructura de los datos . 25 -- 4.2.2. Recolección de datos . 26 -- 4.2.3. Manejo y control de la calidad de datos . 26 -- 4.2.4. Creación modelo de datos . 26 -- 4.2.5. Métodos de transformación. . 27 -- 4.3. Preparación de los datos . 27 -- 4.3.1. Análisis exploratorio de los datos – EDA . 28 -- 4.4. Modelado . 36 -- 4.4.1. Métricas seleccionadas . 36 -- 4.4.2. Algoritmos seleccionados . 36 -- 4.4.3. Proceso de modelación y validación . 37 -- 4.4.4. Selección de los modelos y validación . 38 -- 4.4.5. Comparación de los resultados . 38 -- 4.5. Despliegue . 39 -- 4.5.1. Uso del modelo con el mejor desempeño . 39 -- 4.5.2. Visualización de los resultados . 40 -- 5. CONCLUSIONES . 40 -- 5.1. Trabajos futuros . 41 -- 6. ANEXOS . 42 -- 7. BIBLIOGRAFÍA . 51spa
dc.format.extent55 páginas
dc.format.mediumDigital
dc.format.mimetypeapplication/pdf
dc.identifier.OLIBhttps://biblioteca2.icesi.edu.co/cgi-olib/?oid=366464
dc.identifier.instnameinstname:Universidad Icesi
dc.identifier.reponamereponame:Biblioteca Digital
dc.identifier.repourlrepourl:https://repository.icesi.edu.co/
dc.identifier.urihttps://hdl.handle.net/10906/130590
dc.language.isospa
dc.publisherUniversidad Icesi
dc.publisher.facultyBarberi de Ingeniería, Diseño y Ciencias Aplicadas
dc.publisher.placeSantiago de Cali
dc.publisher.programMaestría en Ciencia de Datos
dc.relation.referencesAbdallah, A. A. (2020). Healthcare Engineering: A Lean Management Approach. Journal of Healthcare Engineering, 2020. https://doi.org/10.1155/2020/8875902spa
dc.relation.referencesAmazon Web Services. (23 de marzo de 2023). ¿Qué es la ciencia de datos?. https://aws.amazon.com/es/what-is/data-science/spa
dc.relation.referencesArredondo A. y De Icaza E. (2011). Costos de la Diabetes en América Latina: Evidencias del Caso Mexicano.spa
dc.relation.referencesBrownlee, J. (2017). Machine Learning Performance Improvement Cheat Sheet. 32 Tips, Tricks and Hacks to Make Better Predictions https://machinelearningmastery.com/choose-validation-method-for-machine-learningspa
dc.relation.referencesBrownlee, J. (2021) Machine Learning Mastery With Python: Understand Your Data, Create Accurate Models and Work Projects End-To-End.spa
dc.relation.referencesBucca j., Damiani L., Esterkin G., García Dieguez M., Marcos E., Rodriguez M. (1994). Costos en Diabetes tipo II. Revista de la AMBB 1994; 2: 53-56spa
dc.relation.referencesClasificación Internacional de Enfermedades (2020). Secretaría General de Salud Digital, Información e Innovación del Sistema Nacional de Salud, Subdirección General de Información Sanitaria. www.mscbs.gob.esspa
dc.relation.referencesChopra, S., & Peter, M. (2008). Administración de la cadena de suministro. Pearson educación.spa
dc.relation.referencesChapman P., Clinton J., Kerber R., Khabaza T., Reinartz T., Shearer C., and Wirth R. The CRISP-DM consortium, (2000). https://maestria-datamining-2010.googlecode.com/svn-history/r282/trunk/dmct- teorica/tp1/CRISPWP-0800.pdfspa
dc.relation.referencesChuchoque-Urbina F. A., Caro-Gutierrez M. P., and Montoya C. E. (2021). Design of a CPFR (collaborative planning forecasting and replenishment), location, inventory and routing approach to diabetes and high blood pressure medicines supply network planning.spa
dc.relation.referencesDhar, V. (2013). Data Science and Prediction. Communications of the ACM, 56(12), 64-73. doi: 10.1145/2500499spa
dc.relation.referencesDepartamento Administrativo Nacional de Estadística - DANE. (21 de julio de 2022). Boletín Técnico Gasto Social Público y Privado (GSPP) 2021 Preliminar. https://www.dane.gov.co/files/investigaciones/boletines/pib/cuentas-nal- anuales/bol-socx-2021preliminar.pdfspa
dc.relation.referencesDiario LR La República (14 de julio de 2022). SALUD, El gasto promedio per cápita en el país en salud al año es de cerca de $1,3 millones . https://www.larepublica.co/economia/el-gasto-promedio-de-los-colombianos-en- salud-al-ano-es-de-cerca-de-1-3-millones-3403198spa
dc.relation.referencesEAE Business School Online - Blended.(25 de marzo de 2023). Anticiparse a los problemas . https://www.eaeprogramas.es/blog/negocio/empresa/anticiparse-los- problemasspa
dc.relation.referencesJaramillo Ramírez J. (2012). Pasantía de investigación. Pronósticos: Métodos Cualitativos y Cuantitativos vs. Métodos de Inteligencia Artificial. Colegio de Estudios Superiores de Administración CESA.spa
dc.relation.referencesKhanal S., Veerman L., Nissen L. and Hollingworth S., (2019). Forecasting the amount and cost of medicine to treat type 2 diabetes mellitus in Nepal using knowledge on medicine usage from a developed country. Journal of Pharmaceutical Healt Services Reasearch - JPHS, 10; 91-99.spa
dc.relation.referencesKuhn M. y Johnson K., (2013) Applied Predictive Modeling. New York, NY:Springer, 2013. 10.1007/978-1-4614-6849-3 .spa
dc.relation.referencesHyndman, R. J., & Athanasopoulos, G. (2018). Forecasting: principles and practice. pág. 135 -140spa
dc.relation.referencesLipton, Z. C., Berkowitz, J., & Elkan, C. (2015). A critical review of recurrent neural networks for sequence learning. arXiv preprint arXiv:1506.00019spa
dc.relation.referencesLiu, Y., Kang, J., & Zhang, G. P. (2015). Interval forecast evaluation measures. International Journal of Forecasting, 31(1), 27-45.spa
dc.relation.referencesMinisterio de Salud y Protección Social. (Junio de 2018). Dirección de Regulación de la Operación del Aseguramiento en Salud, Riesgos Laborales y Pensiones. Gestión Integral del Riesgo en Salud. Perspectiva desde el Aseguramiento en el contexto de la Política de Atención Integral en Salud . Documento de Trabajo, pág. 16, 22 – 24.spa
dc.relation.referencesMinisterio de Salud y Protección Social. (29 de junio de 2022). Colombia llegó al aseguramiento universal en salud al alcanzar el 99,6 % . https://www.minsalud.gov.co/Paginas/Colombia-llego-al-aseguramiento-universal- en-salud-al-alcanzar-el 99.6.aspx#:~:text=Para%202022%2C%20el%20presupuesto%20para,un%2036% 20%25%20desde%20las%20cotizaciones )spa
dc.relation.referencesMinisterio de Salud y Protección Social. (25 de marzo de 2023). Aseguramiento al sistema general de salud . https://www.minsalud.gov.co/proteccionsocial/Regimensubsidiado/Paginas/asegur amiento-al-sistema-general-salud.aspxspa
dc.relation.referencesMontemayor Gallegos J.E. (2013). Métodos de Pronósticos para Negocios.D.R. Instituto Tecnológico y de Estudios Superiores de Monterrey, México.spa
dc.relation.referencesPan American Health Organization. (2022). Panorama of Diabetes in the Americas. Washington, D.C.: PAHO; Available from: https://doi.org/10.37774/9789275126332 .spa
dc.relation.referencesPerdigón LL. R., Gonzalez B. N. (2021). Comparison and selection of artificial intelligence techniques for forecasting bovine milk productions. Revista Cubana de Ciencias Informáticas, 2021, 15(2): p. 24-43spa
dc.relation.referencesPowers C. A., Meyer C. M., Roebuck M. C. and Vaziri B. (2005). Predictive Modeling of Total Healthcare Costs Using Pharmacy Claims Data: A Comparison of Alternative Econometric Cost Modeling Techniques.spa
dc.relation.referencesRaraz Vidal J., Raraz Vidal O., (2022). Adherencia terapéutica y variables relacionadas en adultos con diabetes mellitus tipo 2 en un hospital público.spa
dc.relation.referencesRodríguez Bolaños RA, Reynales Shigematsu LM, Jiménez Ruíz JA, Juárez Márquez SA, Hernández Ávila M. Costos directos de atención médica en pacientes con diabetes mellitus tipo 2 en México: análisis de microcosteo. Rev Panam Salud Publica. 2010;28(6):412–20.spa
dc.relation.referencesScikit-learn. Preprocessing data. (26 de abril de 2023). https://scikit- learn.org/stable/modules/preprocessing.html#scaling-features-to-a-rangespa
dc.relation.referencesWirth R., Hipp D. (2000). CRISP-DM: Towards a standard process model for data mining.spa
dc.relation.referencesWesson J., Naude M., (2022) Using information visualization to support the Self- Management of Type 2 Diabetes Mellitus - DM.spa
dc.relation.referencesWorld Health Organization Collaborating Centre for Drug Statistics Methodology (17 de abril de 2023). Anatomical Therapeutic Chemical Classification System - ATC/DDD Index 2023. https://www.whocc.no/atc_ddd_index/spa
dc.relation.referencesWorld Health Organization. (2020). The top 10 causes of death. Available from: https://www.who.int/news-room/fact-sheets/detail/the-top-10-causes-of-deathspa
dc.relation.referencesWorld Health Organization. (2021). Report of expert and stakeholder consultations on the WHO Global Diabetes Compact. Available from: https://apps.who.int/iris/handle/10665/340322spa
dc.rightsEL AUTOR, expresa que la obra objeto de la presente autorización es original y la elaboró sin quebrantar ni suplantar los derechos de autor de terceros, y de tal forma, la obra es de su exclusiva autoría y tiene la titularidad sobre éste. PARÁGRAFO: en caso de queja o acción por parte de un tercero referente a los derechos de autor sobre el artículo, folleto o libro en cuestión, EL AUTOR, asumirá la responsabilidad total, y saldrá en defensa de los derechos aquí autorizados; para todos los efectos, la Universidad Icesi actúa como un tercero de buena fe. Esta autorización, permite a la Universidad Icesi, de forma indefinida, para que en los términos establecidos en la Ley 23 de 1982, la Ley 44 de 1993, leyes y jurisprudencia vigente al respecto, haga publicación de este con fines educativos.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.licenseAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.proposalPrescripción de medicamentosspa
dc.subject.proposalDiabetesspa
dc.subject.proposalGestión del riesgo en saludspa
dc.subject.proposalPronósticosspa
dc.subject.proposalXGBoostspa
dc.subject.proposalLSTMspa
dc.subject.proposalLightgBMspa
dc.subject.proposalMedication Prescriptioneng
dc.subject.proposalDiabeteseng
dc.subject.proposalHealth Risk Managementeng
dc.subject.proposalForecastseng
dc.subject.proposalXGBoosteng
dc.subject.proposalLSTMeng
dc.subject.proposalLightgBMeng
dc.subject.proposalTesis de Maestría en Ciencia de Datosspa
dc.titleModelos de aprendizaje automático para la optimización de la gestión farmacéuticaspa
dc.typemaster thesis
dc.type.coarhttp://purl.org/coar/resource_type/c_ba08
dc.type.coarversionhttp://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.localTesis de maestría
dc.type.versioninfo:eu-repo/semantics/publishedVersion

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
T03097.pdf
Tamaño:
1.21 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descripción: