Bebot: Detección de bots en Twitter usando procesamiento de lenguaje natural y modelos de predicción

dc.contributor.advisorCastro Gutierrez Eveling Gloria
dc.contributor.authorCornejo Tejada, Diego Sebastian
dc.contributor.authorYlaquita Atencio, Jorge Mauricio
dc.date.accessioned2025-05-16T16:38:19Z
dc.date.available2025-05-16T16:38:19Z
dc.date.issued2024-07-09
dc.description.abstractEn Twitter, surge el concepto de cuentas Bots, que son programas que realizan tareas de forma automática, son usadas para el engaño de identidad. El crecimiento y la evolución de estos Bots es preocupante para los consumidores de esta red, siendo estos Bots usados como spammers, estafadores y ciberacosadores. Este estudio presenta el proyecto "BeBot: Detección de Bots en Twitter Usando Procesamiento de Lenguaje Natural y Modelos de Predicción". El objetivo ha sido desarrollar un sistema para detectar Bots en Twitter utilizando técnicas de web scraping, procesamiento de lenguaje natural (PLN) y modelos de predicción como Random Forest, BERT, ELMO y SVM, implementados en Python. Se adoptó la metodología CRISP-DM, que consta de fases como comprensión del negocio, comprensión de los datos, preparación de los datos, modelado de los datos, evaluación y despliegue. El sistema propuesto logró una precisión del 94% en la detección de Bots en la plataforma de Twitter, demostrando la viabilidad de combinar el procesamiento de lenguaje natural con técnicas de BERT Embeddings. Además, se desarrolló una plataforma web para los usuarios de Twitter, que normaliza los perfiles mediante limpieza de datos y BERT Embeddings, utilizando el modelo desarrollado. Este proyecto representa una contribución al campo de la detección de Bots en Twitter al combinar de manera innovadora el procesamiento de lenguaje natural y los modelos de predicción. En trabajos futuros, se planea mejorar el sistema mediante el uso de otras bases de datos, explorando diferentes modelos de predicción y técnicas de normalización de datos.
dc.formatapplication/pdf
dc.identifier.urihttps://hdl.handle.net/20.500.12920/15141
dc.language.isospa
dc.publisherUniversidad Católica de Santa Maríaes_ES
dc.publisher.countryPE
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/es_ES
dc.sourceUniversidad Católica de Santa Maríaes_ES
dc.sourceRepositorio de la Universidad Católica de Santa María - UCSMes_ES
dc.subjectRandom Forest
dc.subjectRedes neuronales
dc.subjectModelos de Predicción.
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.01
dc.titleBebot: Detección de bots en Twitter usando procesamiento de lenguaje natural y modelos de predicción
dc.typeinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/publishedVersion
renati.advisor.dni29695284
renati.advisor.orcid0000-0002-0203-041X
renati.author.dni70840298
renati.author.dni72476832
renati.discipline612076
renati.jurorTorres Gamarra, Nestor
renati.jurorMontesinos Murillo, Angel Felipe
renati.jurorRosas Paredes, Karina
renati.levelhttps://purl.org/pe-repo/renati/nivel#tituloProfesional
renati.typehttps://purl.org/pe-repo/renati/type#tesis
thesis.degree.disciplineIngeniería de Sistemas
thesis.degree.grantorUniversidad Católica de Santa María.Facultad de Ciencias e Ingenierías Físicas y Formaleses_ES
thesis.degree.nameIngeniero de Sistemas

Files

Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
71.0704.IS.pdf
Size:
3.07 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
71.0704.IS.RT.pdf
Size:
10.18 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Autorización_71.0704.IS.pdf
Size:
203.02 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: