Please use this identifier to cite or link to this item: http://cimat.repositorioinstitucional.mx/jspui/handle/1008/992
Métodos de Ciencia de Datos aplicados al diagnóstico del cáncer colo-rectal en población Mexicana
Rael Rojas
Acceso Abierto
Atribución-NoComercial
COMPUTO ESTADÍSTICO
El CCR es una enfermedad multifactor con alta mortalidad que la ubican entre la primeras 5 causas de muerte por cáncer en el mundo. Los factores no hereditarios que lo generan son aún desconocidos, sin embargo a lo largo de los años estudios principalmente en Estados Unidos, Europa y Asia, lo han asociado a variantes no genéticas entre ellas: Sedentarismo, el consumo de grasas provenientes de carnes rojas, el alcoholismo, entre otras; estas asociaciones han tenido criterios divididos en la comunidad científica generando expectación sobre el como y en que medida están asociadas.\\ El presente trabajo explora esas asociaciones mediante el uso de técnicas de Ciencia de Datos. Basado en análisis estadísticos realizados sobre la base de 3525 individuos mexicanos se muestran asociaciones entre las variables genómicas y no genómica mediante un \textbf{Análisis de Correspondencia múltiple} (MCA), explorando los beneficios respecto al Análisis por Componentes Principales (PCA); se presenta una variedad de modelos predictivos unos creados mediante regresión logística y aplicando selección de variables mediante LASSO, o técnicas de aprendizaje automático como Random Forest, Adaboost, Soport Vector Machine, entre otros, realizando en cada caso una comparativa entre las ventajas y desventajas de cada uno.
01-10-2019
Trabajo de grado, maestría
OTRAS
Versión aceptada
acceptedVersion - Versión aceptada
Appears in Collections:Tesis del CIMAT

Upload archives


File Description SizeFormat 
MTY TE 7.pdf2.63 MBAdobe PDFView/Open