Explorando la opinión de los usuarios de Twitter: análisis de sentimientos de marca mediante Deep Learning
| dc.audience | Todo Público | |
| dc.contributor.advisor | Diaz Cely, Javier Gustavo | |
| dc.contributor.author | Soto Sarria, Diego Fernando | |
| dc.contributor.author | Muñoz Bacca, Julian | |
| dc.coverage.spatial | Cali de Lat: 03 24 00 N degrees minutes Lat: 3.4000 decimal degrees Long: 076 30 00 W degrees minutes Long: -76.5000 decimal degrees. | |
| dc.date.accessioned | 2026-03-09T21:39:42Z | |
| dc.date.available | 2026-03-09T21:39:42Z | |
| dc.date.issued | 2023-07-09 | |
| dc.description.abstract | Identificar efectivamente las oportunidades de mejora es fundamental para toda organización; es por esto, que es de gran interés para las mismas tener conocimiento de la percepción de su marca en redes sociales como Twitter, donde sus clientes pueden expre sarse pública y libremente. Este estudio propone una solución teórico - práctica aplicando técnicas de minería de texto y Deep Learning sobre los tweets recopilados de los usuarios en 3 de las principales empresas prestadoras de servicios de telecomunicacio nes como son Movistar, Claro y Tigo. Comparando las métricas de evaluación, en dos de las redes neuronales recurrentes mayormente usados en el análisis de sentimiento de texto, como son L ST M (Long Short - Term Memory) y GRU (Gated Recurrent Units). Una vez realizada esta comparación, tanto GRU como LSTM obtuvieron muy buenos resultados en la métrica de evaluación y con poco sobre ajuste. Las pruebas ejecutadas con los modelos seleccionados m ostraron una alta precisión en la clasificación de Tweets co n sentimiento Negativo, con un porcentaje de Sensibilidad (Recall) en los datos de validación superiores al 94%. Sin embargo, en los Tweets con sentimientos No Negativos, la precisión fue más baja, con un a Especificidad (Specificity) del 68%, 82.4% y 42.4% para Movistar, Claro y Tigo respectivamente, siendo significativamente bajo para este último. La baja precisión para clasificar los Tweets no Negativos, se atribuyen a la gran variedad de temas para esta categoría, además de la baja cantidad de datos en comparación con los Negativos. Por lo tanto, para futuros estudios se recomienda el uso de un set de datos (Tweets) mucho más grande para mejorar la precisión en la clasificación de ambos grupos . Gracias a esta clasificación y la identificación de aspectos negativos detectados en los diferentes comentarios en Twitter l a solución propuesta permite gestionar de manera efectiva la experiencia de usuar io mediante un tablero de control desarrollado en Power BI , este facilitará la supervisión de su presencia en esta red social, generando información clave que permita a la organización desarrollar estrategias de negocio basadas en datos que busquen abordar los problemas de manera efectiva y mejorar la calidad del servicio para satisfacer las necesidades del mercado. | spa |
| dc.description.abstract | Effectively identifying opportunities for improvement is fundamental for every organization; this is why it is of great interest for them to know the perception of their brand on social networks like Twitter, where their customers can express themselves publicly and freely. This study proposes a theoretical-practical solution applying text mining and Deep Learning techniques on tweets collected from users of 3 of the main telecommunications service providers such as Movistar, Claro, and Tigo. Comparing the evaluation metrics of two of the most commonly used recurrent neural networks in text sentiment analysis, such as LSTM (Long Short-Term Memory) and GRU (Gated Recurrent Units). Once this comparison was made, both GRU and LSTM obtained very good results in the evaluation metric and with little overfitting. The tests executed with the selected models showed high precision in the classification of Tweets with Negative sentiment, with a Sensitivity (Recall) percentage in the validation data exceeding 94%. However, for Tweets with Non-Negative sentiments, the precision was lower, with a Specificity of 68%, 82.4%, and 42.4% for Movistar, Claro, and Tigo respectively, being significantly low for the latter. The low precision for classifying Non-Negative Tweets is attributed to the wide variety of topics in this category, in addition to the low amount of data compared to Negative ones. Therefore, for future studies, the use of a much larger dataset (Tweets) is recommended to improve the precision in the classification of both groups. Thanks to this classification and the identification of negative aspects detected in the different comments on Twitter, the proposed solution allows for effective management of the user experience through a dashboard developed in Power BI, which will facilitate the supervision of their presence on this social network, generating key information that allows the organization to develop data-driven business strategies that seek to effectively address problems and improve service quality to meet market needs. | eng |
| dc.description.degreelevel | Magíster | |
| dc.description.degreename | Trabajo de grado para optar al título de Magister en Ciencia de Datos | |
| dc.description.tableofcontents | 1. INTRODUCCIÓN -- 1.1. Contexto -- Antecedentes -- 1.2. Planteamiento del Problema -- 1.3. Objetivos del Proyecto -- 1.3.1. Objetivo General -- 1.3.2. Objetivos Específicos -- 2. MARCO TEÓRICO -- 2.1. Servicio de Atención al Cliente Social -- 2.2. Analítica de Negocio -- 2.2.1. Tipos de Analítica -- 2.2.1.1. Analítica Descriptiva -- 2.2.1.2. Analítica Predictiva -- 2.2.1.3. Analítica Prescriptiva -- 2.2.1.4. Analítica de Descubrimiento o Analítica de Sabiduría -- 2.3. Minería de Texto -- 2.3.1. KDD (Knowledge Discovery in Databases) -- 2.3.2. KDT (Knowledge Discovery in Text) -- 2.3.3. CRISP - DM -- 2.4. Análisis de Sentimiento -- 2.5. Deep Learning -- 2.5.1. Redes Neuronales Recurrentes (RNN) -- 2.5.1.1. LSTM -- 2.5.1.2. GRU -- 3. ESTADO DEL ARTE -- 4. METODOLOGÍA -- 4.1. Fase 1: Comprensión del negocio -- 4.2. Fase 2: Comprensión de los datos -- 4.3. Fase 3: Preparación de los Datos -- 4.4. Fase 4: Modelamiento -- 4.5. Fase 5: Evaluación -- 4.6. Fase 6: Despliegue -- 5. RESULTADOS -- 5.1. Comprensión de los datos -- 5.1.1. Negativos -- 5.1.2. No Negativos -- 5.2. Preparación de los Datos -- 5.2.1. Vocabulario set de entrenamiento -- 5.2.2. Representación secuencial -- 5.3. Modelamiento -- 5.3.1. Evaluación del Loss por época -- 5.4. Evaluación -- 5.4.1. Selección del punto de corte -- 5.4.2. Métricas de desempeño -- 5.4.3. Desempeño del modelo por Sentimiento -- 5.4.4. Selección de modelo -- 5.5. Despliegue del modelo -- 6. CONCLUSIONES Y TRABAJOS FUTUROS -- 6.1. Conclusiones -- 6.2. Trabajos Futuros -- 7. BIBLIOGRAFÍA | spa |
| dc.format.extent | 70 páginas | |
| dc.format.medium | Digital | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.OLIB | https://biblioteca2.icesi.edu.co/cgi-olib/?oid=366460 | |
| dc.identifier.instname | instname:Universidad Icesi | |
| dc.identifier.reponame | reponame:Biblioteca Digital | |
| dc.identifier.repourl | repourl:https://repository.icesi.edu.co/ | |
| dc.identifier.uri | https://hdl.handle.net/10906/130586 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Icesi | |
| dc.publisher.faculty | Barberi de Ingeniería, Diseño y Ciencias Aplicadas | |
| dc.publisher.place | Santiago de Cali | |
| dc.publisher.program | Maestría en Ciencia de Datos | |
| dc.relation.references | Kriss, P (2014). The Value of Customer Experience, Quantified. Harvard Business Review. The Harvard Business Review. Recuperado de: https://hbr.org/2014/08/the - value - of - customer - experience - quantified | spa |
| dc.relation.references | Scheibenreif, D., Chiu, M., Nordlund, C., Thompson, E.(2023). How IT Can Strengthen Customer Experience Governance. Gartner. Recuperado de: https://www.gartner.com/en/doc/728141 - how - it - can - strengthen - customer - experience - governance | spa |
| dc.relation.references | Postdata (2023). Data Flash 2023 - 01 - Portabilidad Numérica Móvil.Comisión de Regulación de Comunicaciones CRC. Recuperado de: https://www.postdata.gov.co/dataflash/data - flash - 2023 - 001 - portabilidad - numerica - movil | spa |
| dc.relation.references | LaRepública (2022). Conozca los operadores móviles con mayor número de quejas por parte de usuarios. Recuperado de: https://www.larepublica.co/empresas/conozca - los - operadores - moviles - con - el - mayor - numero - de - quejas - por - parte - de - usuarios - 3363706#:~:text=Para%20emp ezar%2C%20los%20datos%20de,por%20parte% 20de%20sus%20usuarios | spa |
| dc.relation.references | Hill - Wilson, M., & Blunt, C. (2013). Delivering effective social customer service: How to redefine the way you manage customer experience and your corporate reputation. John Wiley & Sons. | spa |
| dc.relation.references | Alfaro, E., Velilla, J., Brunetta, H., Navarro, B., & Molina, C. (2012). Customer experience: una visión multidimensional del marketing de experiencias. Recuperado de https://boscolg.files.wordpress.com/2013/09/ebook_customerexperience.pdf | spa |
| dc.relation.references | Raghupathi, W., & Raghupathi, V. (2021). Contemporary business analytics: An Overview. Data, 6(8), 86. Recuperado de: https://doi.org/10.3390/data6080086 | spa |
| dc.relation.references | IBM Documentation (2021). About text mining. Recuperado de: https://www.ibm.com/docs/en/spss - modeler/saas?topic=analytics - about - text - mining | spa |
| dc.relation.references | IBM Documentation (2021). Conceptos básicos de ayuda CRISP - DM. Recuperado de: https://www.ibm.com/docs/es/spss - modeler/saas?topic=dm - crisp - help - overview | spa |
| dc.relation.references | Fayyad, U., Piatetsky - Shapiro, G., & Smyth, P. (1996). The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM, 39(11), 27 - 34. Recuperado de: https://dl.ac m.org/doi/pdf/10.1145/240455.240464 | spa |
| dc.relation.references | Feldman, R., & Dagan, I. (1995, August). Knowledge Discovery in Textual Databases (KDT). In KDD (Vol. 95, pp. 112 - 117). Recuperado de: https://www.academia.edu/download/49469467/KDD95 - 012.pdf | spa |
| dc.relation.references | Mansilla, J. (2018). Knowledge Discovery in Text. Linkedin. Recuperado de: https://www.linkedin.com/pulse/knowledge - discovery - text - javier - mansilla/?trackingId=tHu%2BJEDxQVSdTKswYBUc7g%3D%3D | spa |
| dc.relation.references | Liu, B. (2012). Sentiment analysis and opinion mining. Synthesis lectures on human language technologies, 5(1), 1 - 167. Recuperado de: https://www.cs.uic.edu/~liub/FBS/liub - SA - and - OM - book.pdf | spa |
| dc.relation.references | Souza, F. D., & Filho, J. B. D. O. E. S. (2022, March). BERT for Sentiment Analysis: Pre - trained and Fine - Tuned Alternatives. In Computational Processing of the Portuguese Language: 15th International Conference, PROPOR 2022, Fortaleza, Brazil, March 21 – 23, 2022, Proceedings (pp. 209 - 218). Cham: Springer International Publishing. | spa |
| dc.relation.references | Cheng, L. C., & Tsai, S. L. (2019, August). Deep learning for automated sentiment analysis of social media. In Proceedings of the 2019 IEEE/ACM international conference on advances in social networks analysis and mining (pp. 1001 - 1004). | spa |
| dc.relation.references | Kavlakoglu, E. (2020). AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the difference?. IBM Documentation Recuperado de: https://www.ibm.com/cloud/blog/ai - vs - machine - learning - vs - deep - learning - vs - neural - networks | spa |
| dc.relation.references | Madhavan, S. & Madan, P. (2020). An introduction to deep Learning. IBM Documentation. Recuperado de: https://developer.ibm.com/learningpaths/get - started - with - deep - learning/an - introduction - to - deep - learning/ | spa |
| dc.relation.references | Jones, T. (2017). Recurrent Neural Networks Deep Dive. IBM Documentation Recuperado de: https://developer.ibm.com/articles/cc - cognitive - rec urrent - neural - networks/?mhsrc=ibmsearch_a&mhq=architecture%20for%20RNN | spa |
| dc.relation.references | Madhavan, S & Jones, T. (2021). Deep Learning Architectures. IBM Documentation. Recuperado de: https://developer.ibm.com/articles/cc - machine - learning - deep - learning - architectures/?mhsrc=ibmsearch_a&mhq=architecture%20for%20RNN | spa |
| dc.relation.references | Olah, C. (2015). Understanding lstm networks. Personal Blog. Recuperado de: https://colah.github.io/posts/2015 - 08 - Understanding - LSTMs/ | spa |
| dc.relation.references | Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data - analytic thinking. "O'Reilly Media, Inc.". | spa |
| dc.relation.references | Yang, Z. (2020, November). Sentiment Analysis of Movie Reviews based on Machine Learning. In 2020 2nd International Workshop on Artificial Intelligence and Education (pp. 1 - 4). | spa |
| dc.relation.references | Çano, E., & Morisio, M. (2018, April). A deep learning architecture for sentiment analysis. In Proceedings of the International Conference on Geoinformatics and Data Analysis (pp. 122 - 126). | spa |
| dc.relation.references | Elbagir, S., & Yang, J. (2018, December). Sentiment analysis of twitter data using machine learning techniques and scikit - learn. In Proceedings of the 2018 International Conference on Algorithms, Computing and Artificial Intelligence (pp. 1 - 5). | spa |
| dc.relation.references | Hutto, C., & Gilbert, E. (2014, May). Vader: A parsimonious rule - based model for sentiment analysis of social media text. In Proceedings of the international AAAI conference on web and social media (Vol. 8, No. 1, pp. 216 - 225). Recuperado de: https://ojs.aaai.org/index.php/icwsm/article/view/14550 | spa |
| dc.relation.references | Gautam, G., & Yadav, D. (2014, August). Sentiment analysis of twitter data using machine learning approaches and semantic analysis. In 2014 Seventh international conference on contemporary computing (IC3) (pp. 437 - 442). IEEE. | spa |
| dc.rights | EL AUTOR, expresa que la obra objeto de la presente autorización es original y la elaboró sin quebrantar ni suplantar los derechos de autor de terceros, y de tal forma, la obra es de su exclusiva autoría y tiene la titularidad sobre éste. PARÁGRAFO: en caso de queja o acción por parte de un tercero referente a los derechos de autor sobre el artículo, folleto o libro en cuestión, EL AUTOR, asumirá la responsabilidad total, y saldrá en defensa de los derechos aquí autorizados; para todos los efectos, la Universidad Icesi actúa como un tercero de buena fe. Esta autorización, permite a la Universidad Icesi, de forma indefinida, para que en los términos establecidos en la Ley 23 de 1982, la Ley 44 de 1993, leyes y jurisprudencia vigente al respecto, haga publicación de este con fines educativos. | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.license | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.proposal | Análisis de sentimientos | spa |
| dc.subject.proposal | Deep Learning | spa |
| dc.subject.proposal | spa | |
| dc.subject.proposal | Marca | spa |
| dc.subject.proposal | Sentiment analysis | eng |
| dc.subject.proposal | Deep Learning | eng |
| dc.subject.proposal | eng | |
| dc.subject.proposal | Brand | eng |
| dc.subject.proposal | Tesis de Maestría en Ciencia de Datos | spa |
| dc.title | Explorando la opinión de los usuarios de Twitter: análisis de sentimientos de marca mediante Deep Learning | spa |
| dc.type | master thesis | |
| dc.type.coar | http://purl.org/coar/resource_type/c_ba08 | |
| dc.type.coarversion | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |
| dc.type.driver | info:eu-repo/semantics/masterThesis | |
| dc.type.local | Tesis de maestría | |
| dc.type.version | info:eu-repo/semantics/publishedVersion |
