Please use this identifier to cite or link to this item: http://localhost:8080/xmlui/handle/123456789/1335
Title: Clasificación de servicios de mantenimiento industrial utilizando machine learning para procesamiento de lenguaje natural
Authors: Cantero Alonso, Alcides David
Romero Aquino, Nelson
Cabrera, Francisco
Keywords: Aprendizaje Máquina
Procesamiento de lenguaje natural
Mantenimiento
CMMS
Clasificación de texto
Issue Date: 2024
Publisher: Facultad Politécnica, Universidad Nacional del Este
Abstract: Este estudio aborda el problema de la clasificación de las actividades de mantenimiento y desarrolla, mediante la utilización de técnicas de machine learning y procesamiento de lenguaje natural, una solución de clasificación automática de órdenes de trabajo de un sistema CMMS (Sistema computarizado de gestión de mantenimiento) a partir de texto no estructurado contenido en ellas de manera a que sirvan de apoyo a los responsables por analizar las mismas, con un caso de estudio llevado a cabo en una central hidroeléctrica. El procesamiento de lenguaje natural es un campo en constante evolución, donde técnicas y herramientas nuevas van surgiendo día a día. Combinada con otras técnicas como algoritmos de machine learning, pueden ser de utilidad para la extracción y clasificación de información de documentos de texto. Los informes de mantenimiento se realizan usualmente mediante la ejecución de órdenes de trabajo, donde los responsables por el mantenimiento incluyen notas y observaciones en formato de texto no estructurado, pudiendo contener informaciones valiosas para la toma de futuras decisiones. La metodología propuesta combina y compara varias técnicas en las diferentes etapas del flujo de trabajo propuesto. En la etapa de preprocesamiento de texto, son utilizadas técnicas como tokenización, conversión a minúsculas, stemming y lematización. En la etapa de extracción de características se utilizan representaciones discretas, como Bag of Words y TF-IDF, así como representaciones distribuidas incluyendo embeddings. En la etapa de clasificación se entrenan modelos del machine learning clásico, como Multinomial Naive Bayes, Complement Naive Bayes y Random Forest, y modelos de deep learning que incluyen unidades Gated Recurrent Unit (GRU) y Long Short Term Memory (LSTM). Los resultados demuestran que, aunque los modelos entrenados arrojan resultados similares, el modelo deep learning basado en GRU supera ligeramente al modelo más eficaz del machine learning clásico, Random Forest, con una puntuación F1 de 76,09%, frente al 74,54%.
URI: http://localhost:8080/xmlui/handle/123456789/1335
Appears in Collections:Maestría en Informática y Computación

Files in This Item:
There are no files associated with this item.


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.