Método de aprendizaje multi-instancia basado en bolsas de palabras

Companioni García, Yojacni

DSpace UNISS
→
Facultad de Ciencias Técnicas y Empresariales
→
Departamento de Ingeniería Informática
→
Trabajo de Diploma
→
Ver ítem

dc.contributor.advisor	Quintero Domínguez, Luis A
dc.contributor.advisor	Palmero Salazar, Jose A
dc.contributor.author	Companioni García, Yojacni
dc.coverage.spatial	7004624	es_ES
dc.date.accessioned	2019-11-11T16:53:23Z
dc.date.available	2019-11-11T16:53:23Z
dc.date.issued	2019
dc.identifier.uri	http://hdl.handle.net/123456789/6376
dc.description.abstract	Dentro del área del aprendizaje automático se encuentra el aprendizaje multi-instancia, que no es más que una variante del aprendizaje proposicional en el que cada ejemplo no está descrito ya por un único vector, sino por muchos vectores atributo-valor. Este tipo de representación ha sido usado con muy buen desempeño en ciertos problemas como la clasificación de imágenes, y la categorización de documentos. Existen varios métodos de aprendizaje multi-instancia que transforman cada bolsa en una única instancia para luego aplicar métodos de aprendizaje supervisado estándar. Sin embargo, estas transformaciones provocan una disminución de la precisión de la clasificación. En este trabajo se propone un nuevo método, que transforma los datos multi-instancia inspirado en la minería de textos. El método propuesto realiza la transformación de los datos a una representación atributo-valor tradicional, mediante la creación de un corpus de documentos formados por palabras artificiales para reducir la pérdida de información durante el proceso de transformación. Además, se evaluó el método propuesto, de forma experimental, utilizando nueve conjuntos de datos multi-instancia y otros dos métodos que también transforman los datos multi-instancia a una representación atributo-valor tradicional. De acuerdo a los resultados obtenidos se puede indicar que, en términos de precisión de la clasificación, el método propuesto es competitivo con los métodos de aprendizaje utilizados en la comparación.	es_ES
dc.description.abstract	Within the area of machine learning is multi-instance learning, which is no more than a variant of propositional learning in which each example is not already described by a single vector, but by many attribute-value vectors. This type of representation has been used with very good results in certain problems such as classification of images, and categorization of documents. There are several multi-instance learning methods that transform each bag into a single instance and then apply standard supervised learning methods. However, these transformations cause a decrease in the accuracy of the classification. In this work a new method is proposed, which transforms the multi-instance data inspired by text mining. The proposed method performs the transformation of the data to a traditional attribute-value representation, through the creation of a corpus of documents formed by artificial words to reduce the loss of information during the transformation process. In addition, the proposed method was evaluated, experimentally, using nine multi-instance data sets and two other methods that also transform the multi-instance data to a traditional attributevalue representation. According to the results obtained, it can be indicated that, in terms of classification accuracy, the proposed method is competitive with the learning methods used in the comparison.	es_ES
dc.description.sponsorship	Facultad de Ciencias Técnicas y Empresariales. Departamento Ingeniería Informática	es_ES
dc.language.iso	es	es_ES
dc.publisher	Universidad de Sancti Spíritus José Martí Pérez	es_ES
dc.rights	Este documento es Propiedad Patrimonial de la Universidad de Sancti Spíritus ¨José Martí Pérez¨ El autor o autores conservan los derechos morales que como tal le son reconocidos por la Legislación vigente sobre Derecho de Autor. Los distintos Usuarios podrán copiar, distribuir, comunicar públicamente la obra y hacer obras derivadas; bajo las condiciones siguientes: 1.Reconocer y citar al autor original 2.No utilizar la obra con fines comerciales 3.No realizar modificación alguna a la obra 4.Compartir aquellos productos resultados del uso de la obra bajo la misma licencia de esta. Los Usuarios pueden reutilizar los metadatos en cualquier medio sin autorización previa, siempre que los propósitos de su utilización sean sin ánimo de lucro y se provea el Identificador OAI, un enlace al registro de metadatos original, o se haga referencia al repositorio de donde ha sido extraído.	es_ES
dc.subject	Métodos de Aprendizaje	es_ES
dc.subject	Bolsas de Palabras	es_ES
dc.subject	Método Multi-instancia	es_ES
dc.subject	Minería de Textos	es_ES
dc.title	Método de aprendizaje multi-instancia basado en bolsas de palabras	es_ES
dc.type	Thesis	es_ES
dc.description.status	non-published	es_ES
dc.type.thesis	bachelor	es_ES