Por favor, use este identificador para citar o enlazar este ítem: http://cimat.repositorioinstitucional.mx/jspui/handle/1008/715
UN ROL PARA LA CURVA DE BETTI EN PROBLEMAS DE CIENCIA DE DATOS
RAFAEL JOSE GONZALEZ DE GOUVEIA
Acceso Abierto
Atribución-NoComercial
CURVAS DE BETTI
Se responde a preguntas sobre la utilidad y eficacia del Análisis Topológico de Datos (ATD) en la solución de problemas de Ciencia de Datos. Se utilizan las Curvas de Betti (CB). Estas curvas resumen la forma de una nube de datos, es decir, cualidades como clusters (componentes conexas), estructura filamentosa o agujeros. Una esfera y un toro tienen formas diferentes porque sus agujeros son diferentes. Para estudiar la aplicación de las CB se escogieron casos en los cuales es posible compararlas con herramientas usuales en Ciencia de Datos. En el primer caso se aborda la bondad del ajuste en procesos puntuales bajo la hipótesis de aleatoriedad espacial completa. El estadístico alternativo de prueba utiliza diferencias entre curvas de Betti para cuantificar discrepancias entre procesos puntuales. Esta prueba se contrasta con la prueba de cuadrantes y la prueba de desviaciones absolutas máximas (o MAD por sus siglas en inglés), ampliamente conocidas en la literatura de procesos puntuales. Como segundo problema, se clasifican nubes de puntos muestreadas sobre objetos 3D. Se aborda utilizando vectores de Betti. Este concepto es original de este trabajo y resulta útil para hacer clasificación con topología. Este método es comparado con una aproximación en ciencia de datos, utilizando directamente los datos en un algoritmo de máquina de soporte vectorial. Estos experimentos cuantifican el aporte de utilizar métodos topológicos contra las técnicas conocidas en Ciencia de datos.
01-12-2017
Tesis de maestría
ANÁLISIS DE DATOS
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Tesis del CIMAT

Cargar archivos:


Fichero Tamaño Formato  
TE 645.pdf2.16 MBAdobe PDFVisualizar/Abrir