Please use this identifier to cite or link to this item:
http://cimat.repositorioinstitucional.mx/jspui/handle/1008/992
Métodos de Ciencia de Datos aplicados al diagnóstico del cáncer colo-rectal en población Mexicana | |
Rael Rojas | |
Acceso Abierto | |
Atribución-NoComercial | |
COMPUTO ESTADÍSTICO | |
El CCR es una enfermedad multifactor con alta mortalidad que la ubican entre la primeras 5 causas de muerte por cáncer en el mundo. Los factores no hereditarios que lo generan son aún desconocidos, sin embargo a lo largo de los años estudios principalmente en Estados Unidos, Europa y Asia, lo han asociado a variantes no genéticas entre ellas: Sedentarismo, el consumo de grasas provenientes de carnes rojas, el alcoholismo, entre otras; estas asociaciones han tenido criterios divididos en la comunidad científica generando expectación sobre el como y en que medida están asociadas.\\ El presente trabajo explora esas asociaciones mediante el uso de técnicas de Ciencia de Datos. Basado en análisis estadísticos realizados sobre la base de 3525 individuos mexicanos se muestran asociaciones entre las variables genómicas y no genómica mediante un \textbf{Análisis de Correspondencia múltiple} (MCA), explorando los beneficios respecto al Análisis por Componentes Principales (PCA); se presenta una variedad de modelos predictivos unos creados mediante regresión logística y aplicando selección de variables mediante LASSO, o técnicas de aprendizaje automático como Random Forest, Adaboost, Soport Vector Machine, entre otros, realizando en cada caso una comparativa entre las ventajas y desventajas de cada uno. | |
01-10-2019 | |
Trabajo de grado, maestría | |
OTRAS | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Appears in Collections: | Tesis del CIMAT |
Upload archives
File | Description | Size | Format | |
---|---|---|---|---|
MTY TE 7.pdf | 2.63 MB | Adobe PDF | View/Open |