Acceso Abierto
Bebot: Detección de bots en Twitter usando procesamiento de lenguaje natural y modelos de predicción
Cargando...
Fecha
2024-07-09
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Católica de Santa María
Resumen
En Twitter, surge el concepto de cuentas Bots, que son programas que realizan tareas de forma
automática, son usadas para el engaño de identidad. El crecimiento y la evolución de estos Bots
es preocupante para los consumidores de esta red, siendo estos Bots usados como spammers,
estafadores y ciberacosadores. Este estudio presenta el proyecto "BeBot: Detección de Bots en
Twitter Usando Procesamiento de Lenguaje Natural y Modelos de Predicción". El objetivo ha
sido desarrollar un sistema para detectar Bots en Twitter utilizando técnicas de web scraping,
procesamiento de lenguaje natural (PLN) y modelos de predicción como Random Forest, BERT,
ELMO y SVM, implementados en Python. Se adoptó la metodología CRISP-DM, que consta de
fases como comprensión del negocio, comprensión de los datos, preparación de los datos,
modelado de los datos, evaluación y despliegue. El sistema propuesto logró una precisión del
94% en la detección de Bots en la plataforma de Twitter, demostrando la viabilidad de combinar
el procesamiento de lenguaje natural con técnicas de BERT Embeddings. Además, se desarrolló
una plataforma web para los usuarios de Twitter, que normaliza los perfiles mediante limpieza
de datos y BERT Embeddings, utilizando el modelo desarrollado. Este proyecto representa una
contribución al campo de la detección de Bots en Twitter al combinar de manera innovadora el
procesamiento de lenguaje natural y los modelos de predicción. En trabajos futuros, se planea
mejorar el sistema mediante el uso de otras bases de datos, explorando diferentes modelos de
predicción y técnicas de normalización de datos.
Descripción
Palabras clave
Random Forest, Redes neuronales, Modelos de Predicción.