Repositorio Institucional

Método de aprendizaje multi-instancia basado en bolsas de palabras

Mostrar el registro sencillo del ítem

dc.contributor.advisor Quintero Domínguez, Luis A
dc.contributor.advisor Palmero Salazar, Jose A
dc.contributor.author Companioni García, Yojacni
dc.coverage.spatial 7004624 es_ES
dc.date.accessioned 2019-11-11T16:53:23Z
dc.date.available 2019-11-11T16:53:23Z
dc.date.issued 2019
dc.identifier.uri http://hdl.handle.net/123456789/6376
dc.description.abstract Dentro del área del aprendizaje automático se encuentra el aprendizaje multi-instancia, que no es más que una variante del aprendizaje proposicional en el que cada ejemplo no está descrito ya por un único vector, sino por muchos vectores atributo-valor. Este tipo de representación ha sido usado con muy buen desempeño en ciertos problemas como la clasificación de imágenes, y la categorización de documentos. Existen varios métodos de aprendizaje multi-instancia que transforman cada bolsa en una única instancia para luego aplicar métodos de aprendizaje supervisado estándar. Sin embargo, estas transformaciones provocan una disminución de la precisión de la clasificación. En este trabajo se propone un nuevo método, que transforma los datos multi-instancia inspirado en la minería de textos. El método propuesto realiza la transformación de los datos a una representación atributo-valor tradicional, mediante la creación de un corpus de documentos formados por palabras artificiales para reducir la pérdida de información durante el proceso de transformación. Además, se evaluó el método propuesto, de forma experimental, utilizando nueve conjuntos de datos multi-instancia y otros dos métodos que también transforman los datos multi-instancia a una representación atributo-valor tradicional. De acuerdo a los resultados obtenidos se puede indicar que, en términos de precisión de la clasificación, el método propuesto es competitivo con los métodos de aprendizaje utilizados en la comparación. es_ES
dc.description.abstract Within the area of machine learning is multi-instance learning, which is no more than a variant of propositional learning in which each example is not already described by a single vector, but by many attribute-value vectors. This type of representation has been used with very good results in certain problems such as classification of images, and categorization of documents. There are several multi-instance learning methods that transform each bag into a single instance and then apply standard supervised learning methods. However, these transformations cause a decrease in the accuracy of the classification. In this work a new method is proposed, which transforms the multi-instance data inspired by text mining. The proposed method performs the transformation of the data to a traditional attribute-value representation, through the creation of a corpus of documents formed by artificial words to reduce the loss of information during the transformation process. In addition, the proposed method was evaluated, experimentally, using nine multi-instance data sets and two other methods that also transform the multi-instance data to a traditional attributevalue representation. According to the results obtained, it can be indicated that, in terms of classification accuracy, the proposed method is competitive with the learning methods used in the comparison. es_ES
dc.description.sponsorship Facultad de Ciencias Técnicas y Empresariales. Departamento Ingeniería Informática es_ES
dc.language.iso es es_ES
dc.publisher Universidad de Sancti Spíritus José Martí Pérez es_ES
dc.rights Este documento es Propiedad Patrimonial de la Universidad de Sancti Spíritus ¨José Martí Pérez¨ El autor o autores conservan los derechos morales que como tal le son reconocidos por la Legislación vigente sobre Derecho de Autor. Los distintos Usuarios podrán copiar, distribuir, comunicar públicamente la obra y hacer obras derivadas; bajo las condiciones siguientes: 1.Reconocer y citar al autor original 2.No utilizar la obra con fines comerciales 3.No realizar modificación alguna a la obra 4.Compartir aquellos productos resultados del uso de la obra bajo la misma licencia de esta. Los Usuarios pueden reutilizar los metadatos en cualquier medio sin autorización previa, siempre que los propósitos de su utilización sean sin ánimo de lucro y se provea el Identificador OAI, un enlace al registro de metadatos original, o se haga referencia al repositorio de donde ha sido extraído. es_ES
dc.subject Métodos de Aprendizaje es_ES
dc.subject Bolsas de Palabras es_ES
dc.subject Método Multi-instancia es_ES
dc.subject Minería de Textos es_ES
dc.title Método de aprendizaje multi-instancia basado en bolsas de palabras es_ES
dc.type Thesis es_ES
dc.description.status non-published es_ES
dc.type.thesis bachelor es_ES


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem