Por favor, use este identificador para citar o enlazar este ítem: http://cimat.repositorioinstitucional.mx/jspui/handle/1008/1167
Agrupamiento semi-supervisado conrestricciones a nivel instancias mediantealgoritmos evolutivos
Erika-Tatiana Rueda-Santos
Acceso Abierto
Atribución-NoComercial
COMPUTO ESTADÍSTICO
Existe una gran variedad de problemas en el mundo real en los que se desea aprender un modelo de clasificación a partir de un conjunto de datos, pero las etiquetas de clase con las que se dispone no son suficientes. El agrupamiento es una alternativa para aprender a partir de datos no etiquetados y, recientemente, se ha mostrado que produce mejores agrupamientos cuando es retroalimentado con información parcial del conjunto de datos, la cual puede ser representada en forma de restricciones. Este tipo de agrupamiento se le conoce como agrupamiento semi-supervisado con restricciones. El agrupamiento con restricciones es un problema desafiante, ya que su solución no sólo implica explorar el espacio de búsqueda de manera eficiente, sino que también debe asegurar que las particiones resultantes sean factibles. Diversos métodos del estado del arte se han propuesto para dar solución al problema de agrupamiento haciendo uso de restricciones a nivel de instancias. No obstante, estos métodos en general asumen que se conoce el número de grupos que contiene el conjunto de datos, lo cual es típicamente desconocido en problemas reales. Esta tesis propone MOECC: Multi-Objective Evolutionary Constrained Clustering. MOECC formula el problema de agrupamiento como un problema multi-objetivo, considerando la compacidad y la conectividad de los grupos como los objetivos a optimizar. Además, adapta un mecanismo basado en epsilon-restringido para el manejo de las restricciones a nivel instancias. MOECC implementa operadores de cruza y mutación especialmente diseñados para agrupamiento e incorpora una estrategia para ayudar a escoger de manera automática el número de grupos. La eficacia de MOECC es comparada con COP-K-Medias, LCVQE, RDPM y ME-MOEA/D. El estudio experimental considera conjuntos de datos de referencia y se evalúa el desempeño considerando diferentes niveles de restricciones. Los resultados experimentales dan evidencia que MOECC es capaz de encontrar agrupamientos de manera eficaz y eficiente en comparación con los métodos de referencia.
31-01-2022
Trabajo de grado, maestría
OTRAS
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Tesis del CIMAT

Cargar archivos:


Fichero Descripción Tamaño Formato  
MTY TE 21.pdf2.84 MBAdobe PDFVisualizar/Abrir