Implemetación de clasificador de noticias en idioma español para la identificación de Fake News mediante el análisis, traducción automática y validación de un conjunto de datos en inglés, y el uso de técnicas de aprendizaje máquina y procesamiento de lenguaje natural

dc.contributor.advisorRivera Chávez, Victor Hugo
dc.contributor.authorObando Molina, Felix Antonio Junjiro
dc.date.accessioned2021-07-01T19:01:27Z
dc.date.available2021-07-01T19:01:27Z
dc.date.issued2021-07-01
dc.description.abstractEl presente trabajo presenta la implementación de un clasificador de noticias que permite la identificación de noticias falsas en el idioma español. Dicho clasificador se basa en el entrenamiento de modelos de aprendizaje automático supervisado mediante el uso de técnicas y herramientas de procesamiento de lenguaje natural. Uno de los mayores desafíos de este trabajo es la escasez de conjuntos de datos en español que puedan ser utilizados para el entrenamiento de los modelos de aprendizaje automático. Como respuesta a este desafío, se hace uso de la metodología del backtranslation y de la métrica METEOR (Banerjee y Lavie 2005) para la evaluación de la traducción automática de un conjunto de datos de noticias falsas en idioma inglés hacia el idioma español. Dicho conjunto de datos traducido es después utilizado como fuente de datos para el entrenamiento del modelo de aprendizaje automático. Debido a que ningún modelo de aprendizaje automático puede utilizar una muestra textual directamente para su entrenamiento, se realiza la implementación de un transformador que permite la extracción de características semánticas, sintácticas y de polaridad. Las características semánticas son extraídas mediante el uso de un modelo de aprendizaje automático que permite la obtención de vectores de palabras que codifican las relaciones semánticas y de significado entre palabras. Las características sintácticas son expresadas mediante la obtención de etiquetas de parte del discurso y de nombres de entidades. Las características de polaridad son obtenidas con un léxico de sentimientos en el idioma español. Se realiza además el despliegue de dicho modelo en un sistema web para su uso por usuarios externos.es_ES
dc.description.uriTesises_ES
dc.formatapplication/pdfes_ES
dc.identifier.urihttps://repositorio.ucsm.edu.pe/handle/20.500.12920/10902
dc.language.isospaes_ES
dc.publisherUniversidad Católica de Santa Maríaes_ES
dc.publisher.countryPEes_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/es_ES
dc.sourceUniversidad Católica de Santa Maríaes_ES
dc.sourceRepositorio de la Universidad Católica de Santa María - UCSMes_ES
dc.subjectInteligencia artificiales_ES
dc.subjectAprendizaje automáticoes_ES
dc.subjectAprendizaje máquinaes_ES
dc.subjectVectorizaciónes_ES
dc.subjectAnálisis de sentimientoses_ES
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#2.02.00es_ES
dc.titleImplemetación de clasificador de noticias en idioma español para la identificación de Fake News mediante el análisis, traducción automática y validación de un conjunto de datos en inglés, y el uso de técnicas de aprendizaje máquina y procesamiento de lenguaje naturales_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.type.versioninfo:eu-repo/semantics/publishedVersiones_ES
renati.advisor.dni29576767
renati.author.dni72215429
renati.discipline712026es_ES
renati.jurorRivera Chavez, Victor Hugoes_ES
renati.jurorDelgado Barra, Lucy Angelaes_ES
renati.jurorSulla Torres, Raul Ricardoes_ES
renati.levelhttps://purl.org/pe-repo/renati/nivel#tituloProfesionales_ES
renati.typehttps://purl.org/pe-repo/renati/type#tesises_ES
thesis.degree.disciplineIngeniería Electrónicaes_ES
thesis.degree.grantorUniversidad Católica de Santa María.Facultad de Ciencias e Ingenierías Físicas y Formaleses_ES
thesis.degree.levelTítulo Profesionales_ES
thesis.degree.nameIngeniero Electrónico con especialidad en Telecomunicacioneses_ES

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
74.0198.IE.pdf
Size:
91.9 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: