Espinosa, Laura DanielaJaramillo, Carlos EnriqueTimaran, Andrea Estefania2026-02-242026-02-242024-12-10https://hdl.handle.net/10906/130569Este proyecto tiene como objetivo la implementación de un módulo de segmentación dentro del aplicativo GIRO, diseñado para mejorar la identificación y gestión de riesgos asociados con el Lavado de Activos y la Financiación del Terrorismo (LA/FT), en conformidad con las normativas colombianas establecidas por la Superintendencia Financiera. Utilizando técnicas de Inteligencia Artificial (IA) y Machine Learning (ML), se busca clasificar factores de riesgo, como clientes, pro ductos, canales de distribución y jurisdicciones, con el fin de optimizar la eficiencia operativa y reducir los riesgos financieros y reputacionales. La metodología aplicada incluye un análisis exploratorio de datos, seguido de la implementación de modelos de aprendizaje no supervisado: K-means y Clustering Jerárquico, tanto con reducción de dimensionalidad mediante Análisis de Componentes Principales (PCA) como sin esta técnica. La evaluación del desempeño de los modelos se realiza a través de métricas robustas, lo que permite generar segmentaciones precisas que mejoren la toma de decisiones y fortalezcan el cumplimiento de las normativas regulatorias en el sector financiero colombiano.This project focuses on the implementation of a segmentation module for the GIRO application, aimed at optimizing the identification and management of risks related to Money Laundering and Terrorism Financing (ML/TF), in compliance with Colombian regulations established by the Financial Superintendence. Using Artificial Intelligence (AI) and Machine Learning (ML) techniques, the project categorizes risk factors such as clients, products, distribution channels, and jurisdictions to enhance operational efficiency and minimize financial and reputational risks. The methodology involves data exploration, the implementation of unsupervised learning models (K-means and Hierarchical Clustering), and the evaluation of model performance using robust metrics. This approach enables precise segmentations, improves decision-making, and strengthens regulatory compliance in the Colombian financial sector.1. Descripción del Problema -- 1.1. Planteamiento del Problema -- 1.1.1. Formulación -- 1.1.2. Sistematización -- 1.2. Objetivos -- 1.2.1. Objetivo General -- 1.2.2. Objetivos Específicos -- 1.3. Justificación -- 2. Marco de Referencia -- 2.1. Áreas Temáticas -- 2.1.1. Ciencia de Datos -- 2.2. Marco Teórico -- 2.2.1. Glosario -- 2.2.2. Normativa -- 2.2.3. Analítica de datos -- 2.2.4. Aprendizaje no supervisado -- 2.3. Trabajos Relacionados -- 3. Metodología -- 3.1. Metodología ASUM-DM -- 3.1.1. Análisis -- diseño -- configuración y construcción -- 3.1.2. Despliegue -- 3.1.3. Optimización -- 3.2. Modelo de Diseño de Datos -- 3.2.1. Medallion Architecture -- 4. Diseño -- 4.1. Arquitectura de Solución -- 4.2. Estructura de proyecto -- 4.2.1. GitHub -- 4.2.2. Ventajas de Usar GitHub como Repositorio para el Proyecto -- 4.3. Arquitectura de datos -- 4.3.1. Integración con AWS -- 4.4. Estructura de datos Fuente -- 4.4.1. Modelo Entidad-Relación de GIRO -- 5. Ciencia de Datos -- 5.1. Dataset -- 5.1.1. Dataset inicial -- 5.2. Análisis exploratorio de datos -- 5.3. Preparación datos -- 5.3.1. Limpieza de datos -- 5.3.2. Imputación de Datos -- 6. Implementación -- 6.1. Selección de Características -- 6.1.1. Selección por Varianza -- 6.1.2. Selección por Correlación -- 6.1.3. Reducción de Dimensionalidad -- 6.2. Modelos -- 6.2.1. Modelo K-means -- 6.2.2. Modelo Clustering Jerarquico -- 7. Resultados -- 8. Conclusiones -- Bibliografía86 páginasDigitalapplication/pdfspaEL AUTOR, expresa que la obra objeto de la presente autorización es original y la elaboró sin quebrantar ni suplantar los derechos de autor de terceros, y de tal forma, la obra es de su exclusiva autoría y tiene la titularidad sobre éste. PARÁGRAFO: en caso de queja o acción por parte de un tercero referente a los derechos de autor sobre el artículo, folleto o libro en cuestión, EL AUTOR, asumirá la responsabilidad total, y saldrá en defensa de los derechos aquí autorizados; para todos los efectos, la Universidad Icesi actúa como un tercero de buena fe. Esta autorización, permite a la Universidad Icesi, de forma indefinida, para que en los términos establecidos en la Ley 23 de 1982, la Ley 44 de 1993, leyes y jurisprudencia vigente al respecto, haga publicación de este con fines educativos.http://creativecommons.org/licenses/by-nc-nd/4.0/Aplicación de inteligencia artificial y machine learning para la segmentación en GIRO buscando identificar el riesgo de LA/FT según circular básica jurídica de la superintendencia financiera de Colombia, numeral 4.1.1.1, título IV, parte Imaster thesishttps://biblioteca2.icesi.edu.co/cgi-olib/?oid=366443info:eu-repo/semantics/openAccessAttribution-NonCommercial-NoDerivatives 4.0 InternationalSegmentaciónLavado de ActivosFinanciación del TerrorismoK-meansHierarchical ClusteringPCAPrincipal Components AnalysisCumplimiento NormativoSegmentationMoney LaunderingTerrorism FinancingMachine LearningK-meansHierarchical ClusteringPCAPrincipal Components AnalysisRegulatory ComplianceTesis de Maestría en Ciencia de Datosinstname:Universidad Icesireponame:Biblioteca Digitalrepourl:https://repository.icesi.edu.co/http://purl.org/coar/access_right/c_abf2