Bebot: Detección de bots en Twitter usando procesamiento de lenguaje natural y modelos de predicción

Cornejo Tejada, Diego Sebastian; Ylaquita Atencio, Jorge Mauricio

Bebot: Detección de bots en Twitter usando procesamiento de lenguaje natural y modelos de predicción

dc.contributor.advisor	Castro Gutierrez Eveling Gloria
dc.contributor.author	Cornejo Tejada, Diego Sebastian
dc.contributor.author	Ylaquita Atencio, Jorge Mauricio
dc.date.accessioned	2025-05-16T16:38:19Z
dc.date.available	2025-05-16T16:38:19Z
dc.date.issued	2024-07-09
dc.description.abstract	En Twitter, surge el concepto de cuentas Bots, que son programas que realizan tareas de forma automática, son usadas para el engaño de identidad. El crecimiento y la evolución de estos Bots es preocupante para los consumidores de esta red, siendo estos Bots usados como spammers, estafadores y ciberacosadores. Este estudio presenta el proyecto "BeBot: Detección de Bots en Twitter Usando Procesamiento de Lenguaje Natural y Modelos de Predicción". El objetivo ha sido desarrollar un sistema para detectar Bots en Twitter utilizando técnicas de web scraping, procesamiento de lenguaje natural (PLN) y modelos de predicción como Random Forest, BERT, ELMO y SVM, implementados en Python. Se adoptó la metodología CRISP-DM, que consta de fases como comprensión del negocio, comprensión de los datos, preparación de los datos, modelado de los datos, evaluación y despliegue. El sistema propuesto logró una precisión del 94% en la detección de Bots en la plataforma de Twitter, demostrando la viabilidad de combinar el procesamiento de lenguaje natural con técnicas de BERT Embeddings. Además, se desarrolló una plataforma web para los usuarios de Twitter, que normaliza los perfiles mediante limpieza de datos y BERT Embeddings, utilizando el modelo desarrollado. Este proyecto representa una contribución al campo de la detección de Bots en Twitter al combinar de manera innovadora el procesamiento de lenguaje natural y los modelos de predicción. En trabajos futuros, se planea mejorar el sistema mediante el uso de otras bases de datos, explorando diferentes modelos de predicción y técnicas de normalización de datos.
dc.format	application/pdf
dc.identifier.uri	https://hdl.handle.net/20.500.12920/15141
dc.language.iso	spa
dc.publisher	Universidad Católica de Santa María	es_ES
dc.publisher.country	PE
dc.rights	info:eu-repo/semantics/openAccess
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/	es_ES
dc.source	Universidad Católica de Santa María	es_ES
dc.source	Repositorio de la Universidad Católica de Santa María - UCSM	es_ES
dc.subject	Random Forest
dc.subject	Redes neuronales
dc.subject	Modelos de Predicción.
dc.subject.ocde	https://purl.org/pe-repo/ocde/ford#1.02.01
dc.title	Bebot: Detección de bots en Twitter usando procesamiento de lenguaje natural y modelos de predicción
dc.type	info:eu-repo/semantics/bachelorThesis
dc.type.version	info:eu-repo/semantics/publishedVersion
renati.advisor.dni	29695284
renati.advisor.orcid	0000-0002-0203-041X
renati.author.dni	70840298
renati.author.dni	72476832
renati.discipline	612076
renati.juror	Torres Gamarra, Nestor
renati.juror	Montesinos Murillo, Angel Felipe
renati.juror	Rosas Paredes, Karina
renati.level	https://purl.org/pe-repo/renati/level#tituloProfesional
renati.type	https://purl.org/pe-repo/renati/type#tesis
thesis.degree.discipline	Ingeniería de Sistemas
thesis.degree.grantor	Universidad Católica de Santa María.Facultad de Ciencias e Ingenierías Físicas y Formales	es_ES
thesis.degree.name	Ingeniero de Sistemas