Modelo para la detección de noticias falsas en formato texto en la red social Twitter, aplicado al contexto político colombiano de las elecciones presidenciales de 2022.

Montaño Morcillo, Juan Gabriel; Flores Quinayás, Jesús Eduardo

Modelo para la detección de noticias falsas en formato texto en la red social Twitter, aplicado al contexto político colombiano de las elecciones presidenciales de 2022.

dc.contributor.advisor	Sosa Aguirre, Uram Aníbal
dc.contributor.advisor	Aristizábal, Andrés
dc.contributor.author	Montaño Morcillo, Juan Gabriel
dc.contributor.author	Flores Quinayás, Jesús Eduardo
dc.contributor.role	Asesor Tesis
dc.contributor.role	Asesor Tesis
dc.coverage.spatial	Cali de Lat: 03 24 00 N degrees minutes Lat: 3.4000 decimal degrees Long: 076 30 00 W degrees minutes Long: -76.5000 decimal degrees.
dc.date.accessioned	2022-09-14T07:40:28Z
dc.date.available	2022-01-01
dc.date.available	2022-09-14T07:40:28Z
dc.date.issued	2022-01-01
dc.description.abstract	En este trabajo de grado, se formuló una propuesta para abordar la ausencia de modelos de detección de noticias falsas en el contexto político colombiano en la red social Twitter. Para desarrollarlo se tomó como referencia la metodología CRISP-DM que considera seis fases para su desarrollo, estas fases fueron: entendimiento del negocio, entendimiento de los datos, preparación de los datos, modelamiento, evaluación y despliegue. Los modelos, técnicas y herramientas de la ciencia de datos utilizados para abordar la solución del problema fueron: Random Forest, Naive Bayes, Support Vector Classifier, Regresión Logística, XG-Boost, redes neuronales tradicionales y modelos basados en atención como BERT. De los resultados obtenidos en el entrenamiento de los modelos de analítica utilizando modelos tradicionales y BERT, se alcanzó un accuracy de 0.88 y 0.95 respectivamente para el corpus creado en el contexto político colombiano. El uso de las aproximaciones por modelos tradicionales y los modelos de atención con BERT permitió comparar el comportamiento en el desempeño del proceso de la clasificación de noticias, mostrando que con BERT se obtienen mejores resultados. La validación a la que fue sometida la propuesta consistió en la realización de varios experimentos con dos corpus de noticias diferentes; el primero fue el creado en el proyecto con noticias colombianas y el segundo lo conformó la combinación del corpus de noticias colombianas con dos corpus adicionales de contextos diferentes al colombiano. En las validaciones se realizaron ajustes de parámetros e hiperparámetros buscando obtener mejores resultados en el proceso de clasificación de noticias falsas. Finalmente, después del trabajo desarrollado y de las validaciones realizadas se logró formular un modelo de analítica capaz de detectar noticias falsas en el contexto político colombiano con un buen nivel de desempeño, validando de esta manera que el enfoque de la solución propuesto y la metodología empleada permitieron obtener resultados válidos.	spa
dc.format.extent	69 páginas
dc.format.medium	Digital
dc.format.mimetype	application/pdf
dc.identifier.OLIB	http://biblioteca2.icesi.edu.co/cgi-olib?oid=329387
dc.identifier.other	329387
dc.identifier.uri	http://hdl.handle.net/10906/95206
dc.language.iso	spa
dc.publisher	Universidad Icesi
dc.publisher.department	Departamento Tecnologías de Información y Comunicaciones
dc.publisher.faculty	Facultad de Ingeniería y Diseño
dc.publisher.place	Santiago de Cali
dc.rights	EL AUTOR, expresa que la obra objeto de la presente autorización es original y la elaboró sin quebrantar ni suplantar los derechos de autor de terceros, y de tal forma, la obra es de su exclusiva autoría y tiene la titularidad sobre éste. PARÁGRAFO: en caso de queja o acción por parte de un tercero referente a los derechos de autor sobre el artículo, folleto o libro en cuestión, EL AUTOR, asumirá la responsabilidad total, y saldrá en defensa de los derechos aquí autorizados; para todos los efectos, la Universidad Icesi actúa como un tercero de buena fe. Esta autorización, permite a la Universidad Icesi, de forma indefinida, para que en los términos establecidos en la Ley 23 de 1982, la Ley 44 de 1993, leyes y jurisprudencia vigente al respecto, haga publicación de este con fines educativos Todo persona que consulte ya sea la biblioteca o en medio electrónico podrá copiar apartes del texto citando siempre la fuentes, es decir el título del trabajo y el autor.
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.license	Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.proposal	Redes sociales	spa
dc.subject.proposal	Twitter	spa
dc.subject.proposal	Detección	spa
dc.subject.proposal	Noticias falsas	spa
dc.subject.proposal	Elecciones presidenciales	spa
dc.subject.proposal	Procesamiento de lenguaje natural (Computación)	spa
dc.subject.proposal	Aprendizaje automático (Inteligencia artificial)	spa
dc.subject.proposal	Análisis de datos	spa
dc.subject.proposal	Tésis	spa
dc.subject.proposal	Ingenierías	spa
dc.subject.proposal	Departamento Tecnologías de Información y Comunicaciones	spa
dc.title	Modelo para la detección de noticias falsas en formato texto en la red social Twitter, aplicado al contexto político colombiano de las elecciones presidenciales de 2022.
dc.type.coar	http://purl.org/coar/resource_type/c_bdcc
dc.type.driver	info:eu-repo/semantics/masterThesis
dc.type.local	Tesis de maestría
dc.type.version	info:eu-repo/semantics/publishedVersion

Files

Original bundle

Now showing 1 - 1 of 1

Name:: T02444.pdf
Size:: 1.7 MB
Format:: Adobe Portable Document Format

Download

Collections

Maestría en Ciencia de Datos