Logotipo del repositorio
  • English
  • Español
  • Iniciar sesión
    ¿Nuevo Usuario? Pulse aquí para registrarse ¿Has olvidado tu contraseña?
Logotipo del repositorio
  • Comunidades
  • Repositorio Institucional
  • English
  • Español
  • Iniciar sesión
    ¿Nuevo Usuario? Pulse aquí para registrarse ¿Has olvidado tu contraseña?
  1. Inicio
  2. Buscar por autor

Examinando por Autor "Cornejo Tejada, Diego Sebastian"

Mostrando 1 - 1 de 1
Resultados por página
Opciones de ordenación
  • Cargando...
    Miniatura
    ÍtemAcceso Abierto
    Bebot: Detección de bots en Twitter usando procesamiento de lenguaje natural y modelos de predicción
    (Universidad Católica de Santa María, 2024-07-09) Cornejo Tejada, Diego Sebastian; Ylaquita Atencio, Jorge Mauricio
    En Twitter, surge el concepto de cuentas Bots, que son programas que realizan tareas de forma automática, son usadas para el engaño de identidad. El crecimiento y la evolución de estos Bots es preocupante para los consumidores de esta red, siendo estos Bots usados como spammers, estafadores y ciberacosadores. Este estudio presenta el proyecto "BeBot: Detección de Bots en Twitter Usando Procesamiento de Lenguaje Natural y Modelos de Predicción". El objetivo ha sido desarrollar un sistema para detectar Bots en Twitter utilizando técnicas de web scraping, procesamiento de lenguaje natural (PLN) y modelos de predicción como Random Forest, BERT, ELMO y SVM, implementados en Python. Se adoptó la metodología CRISP-DM, que consta de fases como comprensión del negocio, comprensión de los datos, preparación de los datos, modelado de los datos, evaluación y despliegue. El sistema propuesto logró una precisión del 94% en la detección de Bots en la plataforma de Twitter, demostrando la viabilidad de combinar el procesamiento de lenguaje natural con técnicas de BERT Embeddings. Además, se desarrolló una plataforma web para los usuarios de Twitter, que normaliza los perfiles mediante limpieza de datos y BERT Embeddings, utilizando el modelo desarrollado. Este proyecto representa una contribución al campo de la detección de Bots en Twitter al combinar de manera innovadora el procesamiento de lenguaje natural y los modelos de predicción. En trabajos futuros, se planea mejorar el sistema mediante el uso de otras bases de datos, explorando diferentes modelos de predicción y técnicas de normalización de datos.
Universidad
  • Admisión
  • Pregrado
  • Postgrado
  • Investigación
Contacto
  • Campus Central Urb. San José s/n Umacollo Arequipa - Perú
Mapa del Sitio
  • Tesis Licenciaturas
  • Segundas Especialidades
  • Maestrias
  • Doctorados
Biblioteca
  • Política
  • Normativa
© 2024  Repositorio de la Universidad Católica Santa María