Logo_Icesi
 

Explorando la opinión de los usuarios de Twitter: análisis de sentimientos de marca mediante Deep Learning

dc.audienceTodo Público
dc.contributor.advisorDiaz Cely, Javier Gustavo
dc.contributor.authorSoto Sarria, Diego Fernando
dc.contributor.authorMuñoz Bacca, Julian
dc.coverage.spatialCali de Lat: 03 24 00 N degrees minutes Lat: 3.4000 decimal degrees Long: 076 30 00 W degrees minutes Long: -76.5000 decimal degrees.
dc.date.accessioned2026-03-09T21:39:42Z
dc.date.available2026-03-09T21:39:42Z
dc.date.issued2023-07-09
dc.description.abstractIdentificar efectivamente las oportunidades de mejora es fundamental para toda organización; es por esto, que es de gran interés para las mismas tener conocimiento de la percepción de su marca en redes sociales como Twitter, donde sus clientes pueden expre sarse pública y libremente. Este estudio propone una solución teórico - práctica aplicando técnicas de minería de texto y Deep Learning sobre los tweets recopilados de los usuarios en 3 de las principales empresas prestadoras de servicios de telecomunicacio nes como son Movistar, Claro y Tigo. Comparando las métricas de evaluación, en dos de las redes neuronales recurrentes mayormente usados en el análisis de sentimiento de texto, como son L ST M (Long Short - Term Memory) y GRU (Gated Recurrent Units). Una vez realizada esta comparación, tanto GRU como LSTM obtuvieron muy buenos resultados en la métrica de evaluación y con poco sobre ajuste. Las pruebas ejecutadas con los modelos seleccionados m ostraron una alta precisión en la clasificación de Tweets co n sentimiento Negativo, con un porcentaje de Sensibilidad (Recall) en los datos de validación superiores al 94%. Sin embargo, en los Tweets con sentimientos No Negativos, la precisión fue más baja, con un a Especificidad (Specificity) del 68%, 82.4% y 42.4% para Movistar, Claro y Tigo respectivamente, siendo significativamente bajo para este último. La baja precisión para clasificar los Tweets no Negativos, se atribuyen a la gran variedad de temas para esta categoría, además de la baja cantidad de datos en comparación con los Negativos. Por lo tanto, para futuros estudios se recomienda el uso de un set de datos (Tweets) mucho más grande para mejorar la precisión en la clasificación de ambos grupos . Gracias a esta clasificación y la identificación de aspectos negativos detectados en los diferentes comentarios en Twitter l a solución propuesta permite gestionar de manera efectiva la experiencia de usuar io mediante un tablero de control desarrollado en Power BI , este facilitará la supervisión de su presencia en esta red social, generando información clave que permita a la organización desarrollar estrategias de negocio basadas en datos que busquen abordar los problemas de manera efectiva y mejorar la calidad del servicio para satisfacer las necesidades del mercado.spa
dc.description.abstractEffectively identifying opportunities for improvement is fundamental for every organization; this is why it is of great interest for them to know the perception of their brand on social networks like Twitter, where their customers can express themselves publicly and freely. This study proposes a theoretical-practical solution applying text mining and Deep Learning techniques on tweets collected from users of 3 of the main telecommunications service providers such as Movistar, Claro, and Tigo. Comparing the evaluation metrics of two of the most commonly used recurrent neural networks in text sentiment analysis, such as LSTM (Long Short-Term Memory) and GRU (Gated Recurrent Units). Once this comparison was made, both GRU and LSTM obtained very good results in the evaluation metric and with little overfitting. The tests executed with the selected models showed high precision in the classification of Tweets with Negative sentiment, with a Sensitivity (Recall) percentage in the validation data exceeding 94%. However, for Tweets with Non-Negative sentiments, the precision was lower, with a Specificity of 68%, 82.4%, and 42.4% for Movistar, Claro, and Tigo respectively, being significantly low for the latter. The low precision for classifying Non-Negative Tweets is attributed to the wide variety of topics in this category, in addition to the low amount of data compared to Negative ones. Therefore, for future studies, the use of a much larger dataset (Tweets) is recommended to improve the precision in the classification of both groups. Thanks to this classification and the identification of negative aspects detected in the different comments on Twitter, the proposed solution allows for effective management of the user experience through a dashboard developed in Power BI, which will facilitate the supervision of their presence on this social network, generating key information that allows the organization to develop data-driven business strategies that seek to effectively address problems and improve service quality to meet market needs.eng
dc.description.degreelevelMagíster
dc.description.degreenameTrabajo de grado para optar al título de Magister en Ciencia de Datos
dc.description.tableofcontents1. INTRODUCCIÓN -- 1.1. Contexto -- Antecedentes -- 1.2. Planteamiento del Problema -- 1.3. Objetivos del Proyecto -- 1.3.1. Objetivo General -- 1.3.2. Objetivos Específicos -- 2. MARCO TEÓRICO -- 2.1. Servicio de Atención al Cliente Social -- 2.2. Analítica de Negocio -- 2.2.1. Tipos de Analítica -- 2.2.1.1. Analítica Descriptiva -- 2.2.1.2. Analítica Predictiva -- 2.2.1.3. Analítica Prescriptiva -- 2.2.1.4. Analítica de Descubrimiento o Analítica de Sabiduría -- 2.3. Minería de Texto -- 2.3.1. KDD (Knowledge Discovery in Databases) -- 2.3.2. KDT (Knowledge Discovery in Text) -- 2.3.3. CRISP - DM -- 2.4. Análisis de Sentimiento -- 2.5. Deep Learning -- 2.5.1. Redes Neuronales Recurrentes (RNN) -- 2.5.1.1. LSTM -- 2.5.1.2. GRU -- 3. ESTADO DEL ARTE -- 4. METODOLOGÍA -- 4.1. Fase 1: Comprensión del negocio -- 4.2. Fase 2: Comprensión de los datos -- 4.3. Fase 3: Preparación de los Datos -- 4.4. Fase 4: Modelamiento -- 4.5. Fase 5: Evaluación -- 4.6. Fase 6: Despliegue -- 5. RESULTADOS -- 5.1. Comprensión de los datos -- 5.1.1. Negativos -- 5.1.2. No Negativos -- 5.2. Preparación de los Datos -- 5.2.1. Vocabulario set de entrenamiento -- 5.2.2. Representación secuencial -- 5.3. Modelamiento -- 5.3.1. Evaluación del Loss por época -- 5.4. Evaluación -- 5.4.1. Selección del punto de corte -- 5.4.2. Métricas de desempeño -- 5.4.3. Desempeño del modelo por Sentimiento -- 5.4.4. Selección de modelo -- 5.5. Despliegue del modelo -- 6. CONCLUSIONES Y TRABAJOS FUTUROS -- 6.1. Conclusiones -- 6.2. Trabajos Futuros -- 7. BIBLIOGRAFÍAspa
dc.format.extent70 páginas
dc.format.mediumDigital
dc.format.mimetypeapplication/pdf
dc.identifier.OLIBhttps://biblioteca2.icesi.edu.co/cgi-olib/?oid=366460
dc.identifier.instnameinstname:Universidad Icesi
dc.identifier.reponamereponame:Biblioteca Digital
dc.identifier.repourlrepourl:https://repository.icesi.edu.co/
dc.identifier.urihttps://hdl.handle.net/10906/130586
dc.language.isospa
dc.publisherUniversidad Icesi
dc.publisher.facultyBarberi de Ingeniería, Diseño y Ciencias Aplicadas
dc.publisher.placeSantiago de Cali
dc.publisher.programMaestría en Ciencia de Datos
dc.relation.referencesKriss, P (2014). The Value of Customer Experience, Quantified. Harvard Business Review. The Harvard Business Review. Recuperado de: https://hbr.org/2014/08/the - value - of - customer - experience - quantifiedspa
dc.relation.referencesScheibenreif, D., Chiu, M., Nordlund, C., Thompson, E.(2023). How IT Can Strengthen Customer Experience Governance. Gartner. Recuperado de: https://www.gartner.com/en/doc/728141 - how - it - can - strengthen - customer - experience - governancespa
dc.relation.referencesPostdata (2023). Data Flash 2023 - 01 - Portabilidad Numérica Móvil.Comisión de Regulación de Comunicaciones CRC. Recuperado de: https://www.postdata.gov.co/dataflash/data - flash - 2023 - 001 - portabilidad - numerica - movilspa
dc.relation.referencesLaRepública (2022). Conozca los operadores móviles con mayor número de quejas por parte de usuarios. Recuperado de: https://www.larepublica.co/empresas/conozca - los - operadores - moviles - con - el - mayor - numero - de - quejas - por - parte - de - usuarios - 3363706#:~:text=Para%20emp ezar%2C%20los%20datos%20de,por%20parte% 20de%20sus%20usuariosspa
dc.relation.referencesHill - Wilson, M., & Blunt, C. (2013). Delivering effective social customer service: How to redefine the way you manage customer experience and your corporate reputation. John Wiley & Sons.spa
dc.relation.referencesAlfaro, E., Velilla, J., Brunetta, H., Navarro, B., & Molina, C. (2012). Customer experience: una visión multidimensional del marketing de experiencias. Recuperado de https://boscolg.files.wordpress.com/2013/09/ebook_customerexperience.pdfspa
dc.relation.referencesRaghupathi, W., & Raghupathi, V. (2021). Contemporary business analytics: An Overview. Data, 6(8), 86. Recuperado de: https://doi.org/10.3390/data6080086spa
dc.relation.referencesIBM Documentation (2021). About text mining. Recuperado de: https://www.ibm.com/docs/en/spss - modeler/saas?topic=analytics - about - text - miningspa
dc.relation.referencesIBM Documentation (2021). Conceptos básicos de ayuda CRISP - DM. Recuperado de: https://www.ibm.com/docs/es/spss - modeler/saas?topic=dm - crisp - help - overviewspa
dc.relation.referencesFayyad, U., Piatetsky - Shapiro, G., & Smyth, P. (1996). The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM, 39(11), 27 - 34. Recuperado de: https://dl.ac m.org/doi/pdf/10.1145/240455.240464spa
dc.relation.referencesFeldman, R., & Dagan, I. (1995, August). Knowledge Discovery in Textual Databases (KDT). In KDD (Vol. 95, pp. 112 - 117). Recuperado de: https://www.academia.edu/download/49469467/KDD95 - 012.pdfspa
dc.relation.referencesMansilla, J. (2018). Knowledge Discovery in Text. Linkedin. Recuperado de: https://www.linkedin.com/pulse/knowledge - discovery - text - javier - mansilla/?trackingId=tHu%2BJEDxQVSdTKswYBUc7g%3D%3Dspa
dc.relation.referencesLiu, B. (2012). Sentiment analysis and opinion mining. Synthesis lectures on human language technologies, 5(1), 1 - 167. Recuperado de: https://www.cs.uic.edu/~liub/FBS/liub - SA - and - OM - book.pdfspa
dc.relation.referencesSouza, F. D., & Filho, J. B. D. O. E. S. (2022, March). BERT for Sentiment Analysis: Pre - trained and Fine - Tuned Alternatives. In Computational Processing of the Portuguese Language: 15th International Conference, PROPOR 2022, Fortaleza, Brazil, March 21 – 23, 2022, Proceedings (pp. 209 - 218). Cham: Springer International Publishing.spa
dc.relation.referencesCheng, L. C., & Tsai, S. L. (2019, August). Deep learning for automated sentiment analysis of social media. In Proceedings of the 2019 IEEE/ACM international conference on advances in social networks analysis and mining (pp. 1001 - 1004).spa
dc.relation.referencesKavlakoglu, E. (2020). AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the difference?. IBM Documentation Recuperado de: https://www.ibm.com/cloud/blog/ai - vs - machine - learning - vs - deep - learning - vs - neural - networksspa
dc.relation.referencesMadhavan, S. & Madan, P. (2020). An introduction to deep Learning. IBM Documentation. Recuperado de: https://developer.ibm.com/learningpaths/get - started - with - deep - learning/an - introduction - to - deep - learning/spa
dc.relation.referencesJones, T. (2017). Recurrent Neural Networks Deep Dive. IBM Documentation Recuperado de: https://developer.ibm.com/articles/cc - cognitive - rec urrent - neural - networks/?mhsrc=ibmsearch_a&mhq=architecture%20for%20RNNspa
dc.relation.referencesMadhavan, S & Jones, T. (2021). Deep Learning Architectures. IBM Documentation. Recuperado de: https://developer.ibm.com/articles/cc - machine - learning - deep - learning - architectures/?mhsrc=ibmsearch_a&mhq=architecture%20for%20RNNspa
dc.relation.referencesOlah, C. (2015). Understanding lstm networks. Personal Blog. Recuperado de: https://colah.github.io/posts/2015 - 08 - Understanding - LSTMs/spa
dc.relation.referencesProvost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data - analytic thinking. "O'Reilly Media, Inc.".spa
dc.relation.referencesYang, Z. (2020, November). Sentiment Analysis of Movie Reviews based on Machine Learning. In 2020 2nd International Workshop on Artificial Intelligence and Education (pp. 1 - 4).spa
dc.relation.referencesÇano, E., & Morisio, M. (2018, April). A deep learning architecture for sentiment analysis. In Proceedings of the International Conference on Geoinformatics and Data Analysis (pp. 122 - 126).spa
dc.relation.referencesElbagir, S., & Yang, J. (2018, December). Sentiment analysis of twitter data using machine learning techniques and scikit - learn. In Proceedings of the 2018 International Conference on Algorithms, Computing and Artificial Intelligence (pp. 1 - 5).spa
dc.relation.referencesHutto, C., & Gilbert, E. (2014, May). Vader: A parsimonious rule - based model for sentiment analysis of social media text. In Proceedings of the international AAAI conference on web and social media (Vol. 8, No. 1, pp. 216 - 225). Recuperado de: https://ojs.aaai.org/index.php/icwsm/article/view/14550spa
dc.relation.referencesGautam, G., & Yadav, D. (2014, August). Sentiment analysis of twitter data using machine learning approaches and semantic analysis. In 2014 Seventh international conference on contemporary computing (IC3) (pp. 437 - 442). IEEE.spa
dc.rightsEL AUTOR, expresa que la obra objeto de la presente autorización es original y la elaboró sin quebrantar ni suplantar los derechos de autor de terceros, y de tal forma, la obra es de su exclusiva autoría y tiene la titularidad sobre éste. PARÁGRAFO: en caso de queja o acción por parte de un tercero referente a los derechos de autor sobre el artículo, folleto o libro en cuestión, EL AUTOR, asumirá la responsabilidad total, y saldrá en defensa de los derechos aquí autorizados; para todos los efectos, la Universidad Icesi actúa como un tercero de buena fe. Esta autorización, permite a la Universidad Icesi, de forma indefinida, para que en los términos establecidos en la Ley 23 de 1982, la Ley 44 de 1993, leyes y jurisprudencia vigente al respecto, haga publicación de este con fines educativos.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.licenseAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.proposalAnálisis de sentimientosspa
dc.subject.proposalDeep Learningspa
dc.subject.proposalTwitterspa
dc.subject.proposalMarcaspa
dc.subject.proposalSentiment analysiseng
dc.subject.proposalDeep Learningeng
dc.subject.proposalTwittereng
dc.subject.proposalBrandeng
dc.subject.proposalTesis de Maestría en Ciencia de Datosspa
dc.titleExplorando la opinión de los usuarios de Twitter: análisis de sentimientos de marca mediante Deep Learningspa
dc.typemaster thesis
dc.type.coarhttp://purl.org/coar/resource_type/c_ba08
dc.type.coarversionhttp://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.localTesis de maestría
dc.type.versioninfo:eu-repo/semantics/publishedVersion

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
T03093.pdf
Tamaño:
3.06 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descripción: