Modelos de aprendizaje automático para la optimización de la gestión farmacéutica
| dc.audience | Todo Público | |
| dc.contributor.advisor | Sosa, Anibal | |
| dc.contributor.advisor | Aristizabal, Andres A. | |
| dc.contributor.audiovisualdesigner | Sosa Aguirre, Anibal | |
| dc.contributor.audiovisualdesigner | Aristizabal Pinzón, Andres Alberto | |
| dc.contributor.author | Botero, Bertha G. | |
| dc.contributor.author | Botero, Susan L. | |
| dc.coverage.spatial | Cali de Lat: 03 24 00 N degrees minutes Lat: 3.4000 decimal degrees Long: 076 30 00 W degrees minutes Long: -76.5000 decimal degrees. | |
| dc.date.accessioned | 2026-03-09T22:31:28Z | |
| dc.date.available | 2026-03-09T22:31:28Z | |
| dc.date.issued | 2023-06-22 | |
| dc.description.abstract | Este documento aborda la implementación de un modelo de aprendizaje automático para la optimización de la gestión farmacéutica. El objetivo de este modelo es fortalecer la prevención y la promoción de estilos de vida saludables, así como prevenir oportunamente las complicaciones asociadas a enfermedades existentes. Se busca mejorar la calidad de la atención médica, garantizar la seguridad y eficacia en la prescripción de medicamentos y optimizar el uso de los recursos sanitarios. El proyecto se centra en 19.362 pacientes diabéticos de la cohorte cardiovascular de una entidad promotora de salud. El objetivo es formular una alternativa para mejorar los resultados clínicos de estos pacientes mediante la optimización de la gestión farmacéutica. El objetivo es crear una solución analítica y funcional que permita mantener buenos resultados de salud en los pacientes, a la vez que se logra la eficiencia operativa en el servicio y el control presupuestario de los tratamientos médicos. El proyecto utilizó la metodología CRISP-DM (Proceso Estándar Intersectorial para Minería de Datos). Esta metodología ha sido estandarizada, especialmente en el sector industrial para proyectos de minería de datos (Wirth, 2000), y continúa siendo ampliamente utilizada en proyectos analíticos debido a su versatilidad. Además, se utilizó el algoritmo XGBoost (Extreme Gradient Boosting) para iterar diferentes arquitecturas y transformaciones de variables, además de la ingeniería de variables que incluyó, entre otros, el número de pacientes. Entre los principales resultados, se observó que variables como la edad, el sexo, el sobrepeso, la obesidad, el índice de masa corporal y la hemoglobina glucosilada (HbA1c) están estrechamente relacionadas con la diabetes y podrían incluirse en el modelo de pronóstico. Se realizaron pronósticos para la cantidad de dosis de 5 medicamentos que forman parte de la prescripción del tratamiento de la cohorte. Se concluye que el aprendizaje automático es una herramienta eficaz para optimizar la gestión farmacéutica, al predecir la cantidad de dosis de medicamentos en pacientes diabéticos de la cohorte cardiovascular. Los resultados indican que el algoritmo XGBoost tuvo el mejor rendimiento en comparación con otros algoritmos evaluados, como LSTM y LightgBM. | spa |
| dc.description.abstract | This document addresses the implementation of a machine learning model for the optimization of pharmaceutical management. The objective of this model is to strengthen the prevention and promotion of healthy lifestyles, as well as to prevent complications associated with existing diseases in a timely manner. The aim is to improve the quality of medical care, ensure the safety and efficacy in drug prescription, and optimize the use of health resources. The project focuses on 19,362 diabetic patients from the cardiovascular cohort of a health promotion entity. The purpose is to formulate an alternative to improve the clinical outcomes of these patients through the optimization of pharmaceutical management. The goal is to create an analytical and functional solution that allows maintaining good health outcomes in patients, while achieving operational efficiency in service and budgetary control of medical treatments. The project used the CRISP-DM (Cross-Industry Standard Process for Data Mining) methodology. This methodology has been standardized, especially in the industry sector for data mining projects (Wirth, 2000) and continues to be widely used in analytical projects due to its versatility. Furthermore, the XGBoost (Extreme Gradient Boosting) algorithm was used to iterate different architectures and variable transformations, in addition to variable engineering which included, among others, the number of patients. Among the main results, it was observed that variables such as age, sex, overweight, obesity, body mass index, and glycated hemoglobin (HbA1c) are closely related to diabetes and could be included in the forecasting model. Forecasts were made for the quantity of doses of 5 medicines that are part of the cohort's treatment prescription. It is concluded that machine learning is an effective tool for optimizing pharmaceutical management, by predicting the quantity of drug doses in diabetic patients of the cardiovascular cohort. The results indicate that the XGBoost algorithm performed best compared to other evaluated algorithms, such as LSTM and LightgBM. | eng |
| dc.description.degreelevel | Magíster | |
| dc.description.degreename | Trabajo de grado para optar al título de Magister en Ciencia de Datos | |
| dc.description.tableofcontents | RESUMEN . 5 -- 1. INTRODUCCIÓN. . 6 -- 1.1. Contexto -- Antecedentes y Justificación . 6 -- 1.2. Planteamiento del Problema . 6 -- 1.3. Objetivo General . 7 -- 1.4. Objetivos Específicos . 8 -- 2. ANTECEDENTES . 8 -- 2.1. Marco Teórico . 8 -- 2.1.1. Dominio del Problema. . 8 -- 2.1.2. Dominio de la Solución . 10 -- 2.1.3. Estrategia de validación de modelos . 14 -- 2.1.4. Métricas de evaluación de modelos de pronósticos . 15 -- 2.2. Estado del Arte . 16 -- 2.2.1. Trabajos seleccionados . 16 -- 2.2.2. Matriz resumen de trabajos . 19 -- 3. METODOLOGÍA . 20 -- 3.1. Conceptual . 20 -- 3.1.1. Fases de la Metodología CRISP . 21 -- 4. DESARROLLO . 22 -- 4.1. Comprensión del negocio . 23 -- 4.1.1. Tipo de estudio . 23 -- 4.1.2. Población de estudio . 23 -- 4.1.3. Criterios de inclusión y exclusión . 23 -- 4.1.4. Variables de estudio . 24 -- 4.2. Comprensión de los datos . 25 -- 4.2.1. Estructura de los datos . 25 -- 4.2.2. Recolección de datos . 26 -- 4.2.3. Manejo y control de la calidad de datos . 26 -- 4.2.4. Creación modelo de datos . 26 -- 4.2.5. Métodos de transformación. . 27 -- 4.3. Preparación de los datos . 27 -- 4.3.1. Análisis exploratorio de los datos – EDA . 28 -- 4.4. Modelado . 36 -- 4.4.1. Métricas seleccionadas . 36 -- 4.4.2. Algoritmos seleccionados . 36 -- 4.4.3. Proceso de modelación y validación . 37 -- 4.4.4. Selección de los modelos y validación . 38 -- 4.4.5. Comparación de los resultados . 38 -- 4.5. Despliegue . 39 -- 4.5.1. Uso del modelo con el mejor desempeño . 39 -- 4.5.2. Visualización de los resultados . 40 -- 5. CONCLUSIONES . 40 -- 5.1. Trabajos futuros . 41 -- 6. ANEXOS . 42 -- 7. BIBLIOGRAFÍA . 51 | spa |
| dc.format.extent | 55 páginas | |
| dc.format.medium | Digital | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.OLIB | https://biblioteca2.icesi.edu.co/cgi-olib/?oid=366464 | |
| dc.identifier.instname | instname:Universidad Icesi | |
| dc.identifier.reponame | reponame:Biblioteca Digital | |
| dc.identifier.repourl | repourl:https://repository.icesi.edu.co/ | |
| dc.identifier.uri | https://hdl.handle.net/10906/130590 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Icesi | |
| dc.publisher.faculty | Barberi de Ingeniería, Diseño y Ciencias Aplicadas | |
| dc.publisher.place | Santiago de Cali | |
| dc.publisher.program | Maestría en Ciencia de Datos | |
| dc.relation.references | Abdallah, A. A. (2020). Healthcare Engineering: A Lean Management Approach. Journal of Healthcare Engineering, 2020. https://doi.org/10.1155/2020/8875902 | spa |
| dc.relation.references | Amazon Web Services. (23 de marzo de 2023). ¿Qué es la ciencia de datos?. https://aws.amazon.com/es/what-is/data-science/ | spa |
| dc.relation.references | Arredondo A. y De Icaza E. (2011). Costos de la Diabetes en América Latina: Evidencias del Caso Mexicano. | spa |
| dc.relation.references | Brownlee, J. (2017). Machine Learning Performance Improvement Cheat Sheet. 32 Tips, Tricks and Hacks to Make Better Predictions https://machinelearningmastery.com/choose-validation-method-for-machine-learning | spa |
| dc.relation.references | Brownlee, J. (2021) Machine Learning Mastery With Python: Understand Your Data, Create Accurate Models and Work Projects End-To-End. | spa |
| dc.relation.references | Bucca j., Damiani L., Esterkin G., García Dieguez M., Marcos E., Rodriguez M. (1994). Costos en Diabetes tipo II. Revista de la AMBB 1994; 2: 53-56 | spa |
| dc.relation.references | Clasificación Internacional de Enfermedades (2020). Secretaría General de Salud Digital, Información e Innovación del Sistema Nacional de Salud, Subdirección General de Información Sanitaria. www.mscbs.gob.es | spa |
| dc.relation.references | Chopra, S., & Peter, M. (2008). Administración de la cadena de suministro. Pearson educación. | spa |
| dc.relation.references | Chapman P., Clinton J., Kerber R., Khabaza T., Reinartz T., Shearer C., and Wirth R. The CRISP-DM consortium, (2000). https://maestria-datamining-2010.googlecode.com/svn-history/r282/trunk/dmct- teorica/tp1/CRISPWP-0800.pdf | spa |
| dc.relation.references | Chuchoque-Urbina F. A., Caro-Gutierrez M. P., and Montoya C. E. (2021). Design of a CPFR (collaborative planning forecasting and replenishment), location, inventory and routing approach to diabetes and high blood pressure medicines supply network planning. | spa |
| dc.relation.references | Dhar, V. (2013). Data Science and Prediction. Communications of the ACM, 56(12), 64-73. doi: 10.1145/2500499 | spa |
| dc.relation.references | Departamento Administrativo Nacional de Estadística - DANE. (21 de julio de 2022). Boletín Técnico Gasto Social Público y Privado (GSPP) 2021 Preliminar. https://www.dane.gov.co/files/investigaciones/boletines/pib/cuentas-nal- anuales/bol-socx-2021preliminar.pdf | spa |
| dc.relation.references | Diario LR La República (14 de julio de 2022). SALUD, El gasto promedio per cápita en el país en salud al año es de cerca de $1,3 millones . https://www.larepublica.co/economia/el-gasto-promedio-de-los-colombianos-en- salud-al-ano-es-de-cerca-de-1-3-millones-3403198 | spa |
| dc.relation.references | EAE Business School Online - Blended.(25 de marzo de 2023). Anticiparse a los problemas . https://www.eaeprogramas.es/blog/negocio/empresa/anticiparse-los- problemas | spa |
| dc.relation.references | Jaramillo Ramírez J. (2012). Pasantía de investigación. Pronósticos: Métodos Cualitativos y Cuantitativos vs. Métodos de Inteligencia Artificial. Colegio de Estudios Superiores de Administración CESA. | spa |
| dc.relation.references | Khanal S., Veerman L., Nissen L. and Hollingworth S., (2019). Forecasting the amount and cost of medicine to treat type 2 diabetes mellitus in Nepal using knowledge on medicine usage from a developed country. Journal of Pharmaceutical Healt Services Reasearch - JPHS, 10; 91-99. | spa |
| dc.relation.references | Kuhn M. y Johnson K., (2013) Applied Predictive Modeling. New York, NY:Springer, 2013. 10.1007/978-1-4614-6849-3 . | spa |
| dc.relation.references | Hyndman, R. J., & Athanasopoulos, G. (2018). Forecasting: principles and practice. pág. 135 -140 | spa |
| dc.relation.references | Lipton, Z. C., Berkowitz, J., & Elkan, C. (2015). A critical review of recurrent neural networks for sequence learning. arXiv preprint arXiv:1506.00019 | spa |
| dc.relation.references | Liu, Y., Kang, J., & Zhang, G. P. (2015). Interval forecast evaluation measures. International Journal of Forecasting, 31(1), 27-45. | spa |
| dc.relation.references | Ministerio de Salud y Protección Social. (Junio de 2018). Dirección de Regulación de la Operación del Aseguramiento en Salud, Riesgos Laborales y Pensiones. Gestión Integral del Riesgo en Salud. Perspectiva desde el Aseguramiento en el contexto de la Política de Atención Integral en Salud . Documento de Trabajo, pág. 16, 22 – 24. | spa |
| dc.relation.references | Ministerio de Salud y Protección Social. (29 de junio de 2022). Colombia llegó al aseguramiento universal en salud al alcanzar el 99,6 % . https://www.minsalud.gov.co/Paginas/Colombia-llego-al-aseguramiento-universal- en-salud-al-alcanzar-el 99.6.aspx#:~:text=Para%202022%2C%20el%20presupuesto%20para,un%2036% 20%25%20desde%20las%20cotizaciones ) | spa |
| dc.relation.references | Ministerio de Salud y Protección Social. (25 de marzo de 2023). Aseguramiento al sistema general de salud . https://www.minsalud.gov.co/proteccionsocial/Regimensubsidiado/Paginas/asegur amiento-al-sistema-general-salud.aspx | spa |
| dc.relation.references | Montemayor Gallegos J.E. (2013). Métodos de Pronósticos para Negocios.D.R. Instituto Tecnológico y de Estudios Superiores de Monterrey, México. | spa |
| dc.relation.references | Pan American Health Organization. (2022). Panorama of Diabetes in the Americas. Washington, D.C.: PAHO; Available from: https://doi.org/10.37774/9789275126332 . | spa |
| dc.relation.references | Perdigón LL. R., Gonzalez B. N. (2021). Comparison and selection of artificial intelligence techniques for forecasting bovine milk productions. Revista Cubana de Ciencias Informáticas, 2021, 15(2): p. 24-43 | spa |
| dc.relation.references | Powers C. A., Meyer C. M., Roebuck M. C. and Vaziri B. (2005). Predictive Modeling of Total Healthcare Costs Using Pharmacy Claims Data: A Comparison of Alternative Econometric Cost Modeling Techniques. | spa |
| dc.relation.references | Raraz Vidal J., Raraz Vidal O., (2022). Adherencia terapéutica y variables relacionadas en adultos con diabetes mellitus tipo 2 en un hospital público. | spa |
| dc.relation.references | Rodríguez Bolaños RA, Reynales Shigematsu LM, Jiménez Ruíz JA, Juárez Márquez SA, Hernández Ávila M. Costos directos de atención médica en pacientes con diabetes mellitus tipo 2 en México: análisis de microcosteo. Rev Panam Salud Publica. 2010;28(6):412–20. | spa |
| dc.relation.references | Scikit-learn. Preprocessing data. (26 de abril de 2023). https://scikit- learn.org/stable/modules/preprocessing.html#scaling-features-to-a-range | spa |
| dc.relation.references | Wirth R., Hipp D. (2000). CRISP-DM: Towards a standard process model for data mining. | spa |
| dc.relation.references | Wesson J., Naude M., (2022) Using information visualization to support the Self- Management of Type 2 Diabetes Mellitus - DM. | spa |
| dc.relation.references | World Health Organization Collaborating Centre for Drug Statistics Methodology (17 de abril de 2023). Anatomical Therapeutic Chemical Classification System - ATC/DDD Index 2023. https://www.whocc.no/atc_ddd_index/ | spa |
| dc.relation.references | World Health Organization. (2020). The top 10 causes of death. Available from: https://www.who.int/news-room/fact-sheets/detail/the-top-10-causes-of-death | spa |
| dc.relation.references | World Health Organization. (2021). Report of expert and stakeholder consultations on the WHO Global Diabetes Compact. Available from: https://apps.who.int/iris/handle/10665/340322 | spa |
| dc.rights | EL AUTOR, expresa que la obra objeto de la presente autorización es original y la elaboró sin quebrantar ni suplantar los derechos de autor de terceros, y de tal forma, la obra es de su exclusiva autoría y tiene la titularidad sobre éste. PARÁGRAFO: en caso de queja o acción por parte de un tercero referente a los derechos de autor sobre el artículo, folleto o libro en cuestión, EL AUTOR, asumirá la responsabilidad total, y saldrá en defensa de los derechos aquí autorizados; para todos los efectos, la Universidad Icesi actúa como un tercero de buena fe. Esta autorización, permite a la Universidad Icesi, de forma indefinida, para que en los términos establecidos en la Ley 23 de 1982, la Ley 44 de 1993, leyes y jurisprudencia vigente al respecto, haga publicación de este con fines educativos. | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.license | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.proposal | Prescripción de medicamentos | spa |
| dc.subject.proposal | Diabetes | spa |
| dc.subject.proposal | Gestión del riesgo en salud | spa |
| dc.subject.proposal | Pronósticos | spa |
| dc.subject.proposal | XGBoost | spa |
| dc.subject.proposal | LSTM | spa |
| dc.subject.proposal | LightgBM | spa |
| dc.subject.proposal | Medication Prescription | eng |
| dc.subject.proposal | Diabetes | eng |
| dc.subject.proposal | Health Risk Management | eng |
| dc.subject.proposal | Forecasts | eng |
| dc.subject.proposal | XGBoost | eng |
| dc.subject.proposal | LSTM | eng |
| dc.subject.proposal | LightgBM | eng |
| dc.subject.proposal | Tesis de Maestría en Ciencia de Datos | spa |
| dc.title | Modelos de aprendizaje automático para la optimización de la gestión farmacéutica | spa |
| dc.type | master thesis | |
| dc.type.coar | http://purl.org/coar/resource_type/c_ba08 | |
| dc.type.coarversion | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |
| dc.type.driver | info:eu-repo/semantics/masterThesis | |
| dc.type.local | Tesis de maestría | |
| dc.type.version | info:eu-repo/semantics/publishedVersion |
