Alonso C., Julio CésarHoyos B., Cristian CamiloLargo L., María Fernanda2025-04-042025-04-042025-03-01978-628-7740-99-0 (eBook)https://hdl.handle.net/10906/130243Este libro es una introducción clara y accesible a los modelos estadísticos y de aprendizaje de máquina aplicados al clustering. Dirigido a quienes inician su formación como científicos de datos, ofrece una guía esencial para entender cómo identificar y agrupar elementos similares, manteniendo la mayor diferencia posible entre los grupos, también llamados conglomerados, clases o clústeres. Estas técnicas no solo pueden responder preguntas de negocio por sí solas, sino que también son clave en la exploración de datos antes de desarrollar modelos complejos y probar hipótesis. A lo largo del libro, descubrirás cómo construir y analizar estos grupos con aplicaciones prácticas y enfoques fundamentales.This book is a clear and accessible introduction to statistical and machine learning models applied to clustering. Aimed at those starting their training as data scientists, it offers an essential guide to understanding how to identify and group similar elements, while maintaining the greatest possible difference between groups, also called clusters, classes, or clusters. These techniques can not only answer business questions on their own, but are also key in data exploration before developing complex models and testing hypotheses. Throughout the book, you will discover how to build and analyze these groups with practical applications and fundamental approaches.Prefacio -- I Conceptos fundamentales -- 1 Introducción -- Objetivos del capítulo -- 1.1 Introducción -- 1.2 Comentarios Finales -- 2 Generalidades y métricas en el clústering -- Objetivos del capítulo -- 2.1 La intuición detrás de los algoritmos de clústering -- 2.2 Medidas de similitud -- 2.3 Algoritmos para la formación de clústeres -- 2.4 Criterio para determinar el número de clústeres -- 2.5 Comentarios finales -- 2.6 Anexo: Índices de validación -- II Algoritmos jerárquicos -- 3 Clústering Jerárquico -- Objetivos del capítulo -- 3.1 Introducción -- 3.2 La intuición de los métodos aglomerativos -- 3.3 Métodos de aglomeración -- 3.4 La intuición de los métodos de división -- 3.5 Comentarios finales -- 4 Implementando los algoritmos de clústering jerárquico en R -- Objetivos del capítulo -- 4.1 Introducción -- 4.2 Los datos y la pregunta de negocio -- 4.3 Exploración y preparación de los datos -- 4.4 Construcción de clústeres jerárquicos aglomerativos y dendrograma -- 4.5 Escogiendo el número óptimo de clústeres -- 4.6 Construcción de clústeres jerárquicos de división -- 4.7 Visualización y analisis de resultados -- 4.8 Comentarios finales -- 4.9 Anexos -- III Algoritmos basados en centroides -- 5 Modelo k-means -- Objetivos del capítulo -- 5.1 Introducción -- 5.2 La intuición -- 5.3 Detalle técnico del algoritmo k-means -- 5.4 k-means en R -- 5.5 k-means++ -- 5.6 Comentarios Finales -- 6 Modelos PAM y CLARA -- Objetivos del capítulo -- 6.1 Introducción -- 6.2 El modelo PAM -- 6.3 El modelo CLARA -- 6.4 Implementación de PAM y CLARA en R -- 6.5 Calculando siluetas individuales y membrecías para los algoritmos PAM y CLA- RA -- 6.6 Comentarios Finales -- IV Algoritmos basados en densidad -- 7 Modelo DBSCAN -- Objetivos del capítulo -- 7.1 Introducción -- 7.2 El algoritmo DBSCAN -- 7.3 Implementación del algoritmo DBSCAN en R -- 7.4 Otro ejemplo -- 7.5 Comentarios finales -- V Algoritmos basados en distribuciones -- 8 Modelo GMM -- Objetivos del capítulo -- 8.1 Introducción -- 8.2 Formalmente -- 8.3 Implementación del modelo GMM -- 8.4 Otro ejemplo -- 8.5 Comentarios finales -- VI Algoritmos combinados -- 9 Modelo FANNY -- Objetivos del capítulo -- 9.1 Introducción -- 9.2 El algoritmo FANNY -- 9.3 Implementación de FANNY en R -- 9.4 Comentarios finales -- VII Referencias -- Referencias -- Índice alfabético -- Índice de figuras195 páginasapplication/pdfspaEL AUTOR, expresa que la obra objeto de la presente autorización es original y la elaboró sin quebrantar ni suplantar los derechos de autor de terceros, y de tal forma, la obra es de su exclusiva autoría y tiene la titularidad sobre éste. PARÁGRAFO: en caso de queja o acción por parte de un tercero referente a los derechos de autor sobre el artículo, folleto o libro en cuestión, EL AUTOR, asumirá la responsabilidad total, y saldrá en defensa de los derechos aquí autorizados; para todos los efectos, la Universidad Icesi actúa como un tercero de buena fe. Esta autorización, permite a la Universidad Icesi, de forma indefinida, para que en los términos establecidos en la Ley 23 de 1982, la Ley 44 de 1993, leyes y jurisprudencia vigente al respecto, haga publicación de este con fines educativos Toda persona que consulte ya sea la biblioteca o en medio electróico podrá copiar apartes del texto citando siempre la fuentes, es decir el título del trabajo y el autor.http://creativecommons.org/licenses/by-nc-nd/4.0/Una introducción a los modelos de Clústering empleando RAn introduction to clustering models using Rbookinfo:eu-repo/semantics/openAccesshttps://doi.org/10.18046/EUI/bda.h.6Attribution-NonCommercial-NoDerivatives 4.0 InternationalRAnalíticaModelos de clústeringModelos de agrupamientoBig Data AnalyticsRAnalyticsClustering ModelsClustering ModelsBig Data Analyticshttp://purl.org/coar/access_right/c_abf2