Explorando la opinión de los usuarios de Twitter: análisis de sentimientos de marca mediante Deep Learning

Soto Sarria, Diego Fernando; Muñoz Bacca, Julian

Explorando la opinión de los usuarios de Twitter: análisis de sentimientos de marca mediante Deep Learning

dc.audience	Todo Público
dc.contributor.advisor	Diaz Cely, Javier Gustavo
dc.contributor.author	Soto Sarria, Diego Fernando
dc.contributor.author	Muñoz Bacca, Julian
dc.coverage.spatial	Cali de Lat: 03 24 00 N degrees minutes Lat: 3.4000 decimal degrees Long: 076 30 00 W degrees minutes Long: -76.5000 decimal degrees.
dc.date.accessioned	2026-03-09T21:39:42Z
dc.date.available	2026-03-09T21:39:42Z
dc.date.issued	2023-07-09
dc.description.abstract	Identificar efectivamente las oportunidades de mejora es fundamental para toda organización; es por esto, que es de gran interés para las mismas tener conocimiento de la percepción de su marca en redes sociales como Twitter, donde sus clientes pueden expre sarse pública y libremente. Este estudio propone una solución teórico - práctica aplicando técnicas de minería de texto y Deep Learning sobre los tweets recopilados de los usuarios en 3 de las principales empresas prestadoras de servicios de telecomunicacio nes como son Movistar, Claro y Tigo. Comparando las métricas de evaluación, en dos de las redes neuronales recurrentes mayormente usados en el análisis de sentimiento de texto, como son L ST M (Long Short - Term Memory) y GRU (Gated Recurrent Units). Una vez realizada esta comparación, tanto GRU como LSTM obtuvieron muy buenos resultados en la métrica de evaluación y con poco sobre ajuste. Las pruebas ejecutadas con los modelos seleccionados m ostraron una alta precisión en la clasificación de Tweets co n sentimiento Negativo, con un porcentaje de Sensibilidad (Recall) en los datos de validación superiores al 94%. Sin embargo, en los Tweets con sentimientos No Negativos, la precisión fue más baja, con un a Especificidad (Specificity) del 68%, 82.4% y 42.4% para Movistar, Claro y Tigo respectivamente, siendo significativamente bajo para este último. La baja precisión para clasificar los Tweets no Negativos, se atribuyen a la gran variedad de temas para esta categoría, además de la baja cantidad de datos en comparación con los Negativos. Por lo tanto, para futuros estudios se recomienda el uso de un set de datos (Tweets) mucho más grande para mejorar la precisión en la clasificación de ambos grupos . Gracias a esta clasificación y la identificación de aspectos negativos detectados en los diferentes comentarios en Twitter l a solución propuesta permite gestionar de manera efectiva la experiencia de usuar io mediante un tablero de control desarrollado en Power BI , este facilitará la supervisión de su presencia en esta red social, generando información clave que permita a la organización desarrollar estrategias de negocio basadas en datos que busquen abordar los problemas de manera efectiva y mejorar la calidad del servicio para satisfacer las necesidades del mercado.	spa
dc.description.abstract	Effectively identifying opportunities for improvement is fundamental for every organization; this is why it is of great interest for them to know the perception of their brand on social networks like Twitter, where their customers can express themselves publicly and freely. This study proposes a theoretical-practical solution applying text mining and Deep Learning techniques on tweets collected from users of 3 of the main telecommunications service providers such as Movistar, Claro, and Tigo. Comparing the evaluation metrics of two of the most commonly used recurrent neural networks in text sentiment analysis, such as LSTM (Long Short-Term Memory) and GRU (Gated Recurrent Units). Once this comparison was made, both GRU and LSTM obtained very good results in the evaluation metric and with little overfitting. The tests executed with the selected models showed high precision in the classification of Tweets with Negative sentiment, with a Sensitivity (Recall) percentage in the validation data exceeding 94%. However, for Tweets with Non-Negative sentiments, the precision was lower, with a Specificity of 68%, 82.4%, and 42.4% for Movistar, Claro, and Tigo respectively, being significantly low for the latter. The low precision for classifying Non-Negative Tweets is attributed to the wide variety of topics in this category, in addition to the low amount of data compared to Negative ones. Therefore, for future studies, the use of a much larger dataset (Tweets) is recommended to improve the precision in the classification of both groups. Thanks to this classification and the identification of negative aspects detected in the different comments on Twitter, the proposed solution allows for effective management of the user experience through a dashboard developed in Power BI, which will facilitate the supervision of their presence on this social network, generating key information that allows the organization to develop data-driven business strategies that seek to effectively address problems and improve service quality to meet market needs.	eng
dc.description.degreelevel	Magíster
dc.description.degreename	Trabajo de grado para optar al título de Magister en Ciencia de Datos
dc.description.tableofcontents	1. INTRODUCCIÓN -- 1.1. Contexto -- Antecedentes -- 1.2. Planteamiento del Problema -- 1.3. Objetivos del Proyecto -- 1.3.1. Objetivo General -- 1.3.2. Objetivos Específicos -- 2. MARCO TEÓRICO -- 2.1. Servicio de Atención al Cliente Social -- 2.2. Analítica de Negocio -- 2.2.1. Tipos de Analítica -- 2.2.1.1. Analítica Descriptiva -- 2.2.1.2. Analítica Predictiva -- 2.2.1.3. Analítica Prescriptiva -- 2.2.1.4. Analítica de Descubrimiento o Analítica de Sabiduría -- 2.3. Minería de Texto -- 2.3.1. KDD (Knowledge Discovery in Databases) -- 2.3.2. KDT (Knowledge Discovery in Text) -- 2.3.3. CRISP - DM -- 2.4. Análisis de Sentimiento -- 2.5. Deep Learning -- 2.5.1. Redes Neuronales Recurrentes (RNN) -- 2.5.1.1. LSTM -- 2.5.1.2. GRU -- 3. ESTADO DEL ARTE -- 4. METODOLOGÍA -- 4.1. Fase 1: Comprensión del negocio -- 4.2. Fase 2: Comprensión de los datos -- 4.3. Fase 3: Preparación de los Datos -- 4.4. Fase 4: Modelamiento -- 4.5. Fase 5: Evaluación -- 4.6. Fase 6: Despliegue -- 5. RESULTADOS -- 5.1. Comprensión de los datos -- 5.1.1. Negativos -- 5.1.2. No Negativos -- 5.2. Preparación de los Datos -- 5.2.1. Vocabulario set de entrenamiento -- 5.2.2. Representación secuencial -- 5.3. Modelamiento -- 5.3.1. Evaluación del Loss por época -- 5.4. Evaluación -- 5.4.1. Selección del punto de corte -- 5.4.2. Métricas de desempeño -- 5.4.3. Desempeño del modelo por Sentimiento -- 5.4.4. Selección de modelo -- 5.5. Despliegue del modelo -- 6. CONCLUSIONES Y TRABAJOS FUTUROS -- 6.1. Conclusiones -- 6.2. Trabajos Futuros -- 7. BIBLIOGRAFÍA	spa
dc.format.extent	70 páginas
dc.format.medium	Digital
dc.format.mimetype	application/pdf
dc.identifier.OLIB	https://biblioteca2.icesi.edu.co/cgi-olib/?oid=366460
dc.identifier.instname	instname:Universidad Icesi
dc.identifier.reponame	reponame:Biblioteca Digital
dc.identifier.repourl	repourl:https://repository.icesi.edu.co/
dc.identifier.uri	https://hdl.handle.net/10906/130586
dc.language.iso	spa
dc.publisher	Universidad Icesi
dc.publisher.faculty	Barberi de Ingeniería, Diseño y Ciencias Aplicadas
dc.publisher.place	Santiago de Cali
dc.publisher.program	Maestría en Ciencia de Datos
dc.relation.references	Kriss, P (2014). The Value of Customer Experience, Quantified. Harvard Business Review. The Harvard Business Review. Recuperado de: https://hbr.org/2014/08/the - value - of - customer - experience - quantified	spa
dc.relation.references	Scheibenreif, D., Chiu, M., Nordlund, C., Thompson, E.(2023). How IT Can Strengthen Customer Experience Governance. Gartner. Recuperado de: https://www.gartner.com/en/doc/728141 - how - it - can - strengthen - customer - experience - governance	spa
dc.relation.references	Postdata (2023). Data Flash 2023 - 01 - Portabilidad Numérica Móvil.Comisión de Regulación de Comunicaciones CRC. Recuperado de: https://www.postdata.gov.co/dataflash/data - flash - 2023 - 001 - portabilidad - numerica - movil	spa
dc.relation.references	LaRepública (2022). Conozca los operadores móviles con mayor número de quejas por parte de usuarios. Recuperado de: https://www.larepublica.co/empresas/conozca - los - operadores - moviles - con - el - mayor - numero - de - quejas - por - parte - de - usuarios - 3363706#:~:text=Para%20emp ezar%2C%20los%20datos%20de,por%20parte% 20de%20sus%20usuarios	spa
dc.relation.references	Hill - Wilson, M., & Blunt, C. (2013). Delivering effective social customer service: How to redefine the way you manage customer experience and your corporate reputation. John Wiley & Sons.	spa
dc.relation.references	Alfaro, E., Velilla, J., Brunetta, H., Navarro, B., & Molina, C. (2012). Customer experience: una visión multidimensional del marketing de experiencias. Recuperado de https://boscolg.files.wordpress.com/2013/09/ebook_customerexperience.pdf	spa
dc.relation.references	Raghupathi, W., & Raghupathi, V. (2021). Contemporary business analytics: An Overview. Data, 6(8), 86. Recuperado de: https://doi.org/10.3390/data6080086	spa
dc.relation.references	IBM Documentation (2021). About text mining. Recuperado de: https://www.ibm.com/docs/en/spss - modeler/saas?topic=analytics - about - text - mining	spa
dc.relation.references	IBM Documentation (2021). Conceptos básicos de ayuda CRISP - DM. Recuperado de: https://www.ibm.com/docs/es/spss - modeler/saas?topic=dm - crisp - help - overview	spa
dc.relation.references	Fayyad, U., Piatetsky - Shapiro, G., & Smyth, P. (1996). The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM, 39(11), 27 - 34. Recuperado de: https://dl.ac m.org/doi/pdf/10.1145/240455.240464	spa
dc.relation.references	Feldman, R., & Dagan, I. (1995, August). Knowledge Discovery in Textual Databases (KDT). In KDD (Vol. 95, pp. 112 - 117). Recuperado de: https://www.academia.edu/download/49469467/KDD95 - 012.pdf	spa
dc.relation.references	Mansilla, J. (2018). Knowledge Discovery in Text. Linkedin. Recuperado de: https://www.linkedin.com/pulse/knowledge - discovery - text - javier - mansilla/?trackingId=tHu%2BJEDxQVSdTKswYBUc7g%3D%3D	spa
dc.relation.references	Liu, B. (2012). Sentiment analysis and opinion mining. Synthesis lectures on human language technologies, 5(1), 1 - 167. Recuperado de: https://www.cs.uic.edu/~liub/FBS/liub - SA - and - OM - book.pdf	spa
dc.relation.references	Souza, F. D., & Filho, J. B. D. O. E. S. (2022, March). BERT for Sentiment Analysis: Pre - trained and Fine - Tuned Alternatives. In Computational Processing of the Portuguese Language: 15th International Conference, PROPOR 2022, Fortaleza, Brazil, March 21 – 23, 2022, Proceedings (pp. 209 - 218). Cham: Springer International Publishing.	spa
dc.relation.references	Cheng, L. C., & Tsai, S. L. (2019, August). Deep learning for automated sentiment analysis of social media. In Proceedings of the 2019 IEEE/ACM international conference on advances in social networks analysis and mining (pp. 1001 - 1004).	spa
dc.relation.references	Kavlakoglu, E. (2020). AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the difference?. IBM Documentation Recuperado de: https://www.ibm.com/cloud/blog/ai - vs - machine - learning - vs - deep - learning - vs - neural - networks	spa
dc.relation.references	Madhavan, S. & Madan, P. (2020). An introduction to deep Learning. IBM Documentation. Recuperado de: https://developer.ibm.com/learningpaths/get - started - with - deep - learning/an - introduction - to - deep - learning/	spa
dc.relation.references	Jones, T. (2017). Recurrent Neural Networks Deep Dive. IBM Documentation Recuperado de: https://developer.ibm.com/articles/cc - cognitive - rec urrent - neural - networks/?mhsrc=ibmsearch_a&mhq=architecture%20for%20RNN	spa
dc.relation.references	Madhavan, S & Jones, T. (2021). Deep Learning Architectures. IBM Documentation. Recuperado de: https://developer.ibm.com/articles/cc - machine - learning - deep - learning - architectures/?mhsrc=ibmsearch_a&mhq=architecture%20for%20RNN	spa
dc.relation.references	Olah, C. (2015). Understanding lstm networks. Personal Blog. Recuperado de: https://colah.github.io/posts/2015 - 08 - Understanding - LSTMs/	spa
dc.relation.references	Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data - analytic thinking. "O'Reilly Media, Inc.".	spa
dc.relation.references	Yang, Z. (2020, November). Sentiment Analysis of Movie Reviews based on Machine Learning. In 2020 2nd International Workshop on Artificial Intelligence and Education (pp. 1 - 4).	spa
dc.relation.references	Çano, E., & Morisio, M. (2018, April). A deep learning architecture for sentiment analysis. In Proceedings of the International Conference on Geoinformatics and Data Analysis (pp. 122 - 126).	spa
dc.relation.references	Elbagir, S., & Yang, J. (2018, December). Sentiment analysis of twitter data using machine learning techniques and scikit - learn. In Proceedings of the 2018 International Conference on Algorithms, Computing and Artificial Intelligence (pp. 1 - 5).	spa
dc.relation.references	Hutto, C., & Gilbert, E. (2014, May). Vader: A parsimonious rule - based model for sentiment analysis of social media text. In Proceedings of the international AAAI conference on web and social media (Vol. 8, No. 1, pp. 216 - 225). Recuperado de: https://ojs.aaai.org/index.php/icwsm/article/view/14550	spa
dc.relation.references	Gautam, G., & Yadav, D. (2014, August). Sentiment analysis of twitter data using machine learning approaches and semantic analysis. In 2014 Seventh international conference on contemporary computing (IC3) (pp. 437 - 442). IEEE.	spa
dc.rights	EL AUTOR, expresa que la obra objeto de la presente autorización es original y la elaboró sin quebrantar ni suplantar los derechos de autor de terceros, y de tal forma, la obra es de su exclusiva autoría y tiene la titularidad sobre éste. PARÁGRAFO: en caso de queja o acción por parte de un tercero referente a los derechos de autor sobre el artículo, folleto o libro en cuestión, EL AUTOR, asumirá la responsabilidad total, y saldrá en defensa de los derechos aquí autorizados; para todos los efectos, la Universidad Icesi actúa como un tercero de buena fe. Esta autorización, permite a la Universidad Icesi, de forma indefinida, para que en los términos establecidos en la Ley 23 de 1982, la Ley 44 de 1993, leyes y jurisprudencia vigente al respecto, haga publicación de este con fines educativos.	spa
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.coar	http://purl.org/coar/access_right/c_abf2
dc.rights.license	Attribution-NonCommercial-NoDerivatives 4.0 International	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.proposal	Análisis de sentimientos	spa
dc.subject.proposal	Deep Learning	spa
dc.subject.proposal	Twitter	spa
dc.subject.proposal	Marca	spa
dc.subject.proposal	Sentiment analysis	eng
dc.subject.proposal	Deep Learning	eng
dc.subject.proposal	Twitter	eng
dc.subject.proposal	Brand	eng
dc.subject.proposal	Tesis de Maestría en Ciencia de Datos	spa
dc.title	Explorando la opinión de los usuarios de Twitter: análisis de sentimientos de marca mediante Deep Learning	spa
dc.type	master thesis
dc.type.coar	http://purl.org/coar/resource_type/c_ba08
dc.type.coarversion	http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver	info:eu-repo/semantics/masterThesis
dc.type.local	Tesis de maestría
dc.type.version	info:eu-repo/semantics/publishedVersion

Files

Original bundle

Now showing 1 - 1 of 1

Name:: T03093.pdf
Size:: 3.06 MB
Format:: Adobe Portable Document Format

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

Maestría en Ciencia de Datos