Show simple item record

dc.contributor.advisorTorres-García, Wandaliz
dc.contributor.authorNarvaez Bandera, Isis Yanina
dc.date.accessioned2018-09-19T19:34:07Z
dc.date.available2018-09-19T19:34:07Z
dc.date.issued2017
dc.identifier.urihttp://hdl.handle.net/20.500.11801/930
dc.description.abstractEl cáncer de mama es una enfermedad heterogénea del genoma que necesita mejores diagnósticos y tratamientos a través de la caracterización de patrones genómicos e interacciones. Actualmente, su comprensión molecular es aún insuficiente incluso con los avances en las tecnologías genómicas. Por lo tanto, esta tesis presenta un enfoque de minería de datos en varias etapas para discriminar los subtipos de cáncer de mama a través de la integración de datos altamente dimensionales de diferentes plataformas genómicas utilizando técnicas de selección y clasificación de características. Esta metodología nos permitió extraer patrones que desempeñan un papel crítico en la clasificación de los subtipos de cáncer de mama (es decir, la subexpresión de FOXA1 para basal). Además, esta tesis proporciona una nueva métrica capaz de evaluar y clasificar las interacciones entre las características pertinentes utilizando un criterio de prevalencia y el clasificador Random Forest. Esta métrica identificó una lista de interacciones de variables importantes para discriminar subtipos. Entre las principales interacciones, encontramos un conjunto de genes correlacionados interactuando frecuentemente con FOXA1 o MLPH tales como CEP55 y UBET2.en_US
dc.description.abstractEl cáncer de mama es una enfermedad heterogénea del genoma que necesita mejores diagnósticos y tratamientos a través de la caracterización de patrones genómicos e interacciones. Actualmente, su comprensión molecular es aún insuficiente incluso con los avances en las tecnologías genómicas. Por lo tanto, esta tesis presenta un enfoque de minería de datos en varias etapas para discriminar los subtipos de cáncer de mama a través de la integración de datos altamente dimensionales de diferentes plataformas genómicas utilizando técnicas de selección y clasificación de características. Esta metodología nos permitió extraer patrones que desempeñan un papel crítico en la clasificación de los subtipos de cáncer de mama (es decir, la subexpresión de FOXA1 para basal). Además, esta tesis proporciona una nueva métrica capaz de evaluar y clasificar las interacciones entre las características pertinentes utilizando un criterio de prevalencia y el clasificador Random Forest. Esta métrica identificó una lista de interacciones de variables importantes para discriminar subtipos. Entre las principales interacciones, encontramos un conjunto de genes correlacionados interactuando frecuentemente con FOXA1 o MLPH tales como CEP55 y UBET2.en_US
dc.language.isoenen_US
dc.subjectRandom Foresten_US
dc.subjectBreast canceren_US
dc.subjectGenomic patternsen_US
dc.subject.lcshData miningen_US
dc.subject.lcshGene expressionen_US
dc.subject.lcshNucleotide sequenceen_US
dc.subject.lcshBreast--Cancer--Patientsen_US
dc.titleAn integrative data-driven approach to identify molecular patterns in breast cancer patientsen_US
dc.rights.licenseAll rights reserveden_US
dc.rights.holder(c) 2017 Isis Yanina Narvaez Banderaen_US
dc.contributor.committeeCabrera, Mauricio
dc.contributor.committeeDomenech, Maribella
dc.contributor.representativeRodríguez Román, Daniel
thesis.degree.levelM.S.en_US
thesis.degree.disciplineIndustrial Engineeringen_US
dc.type.thesisThesisen_US
dc.contributor.collegeCollege of Engineeringen_US
dc.contributor.departmentDepartment of Industrial Engineeringen_US
dc.description.graduationYear2017en_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

  • Theses & Dissertations
    The only items allowed under this collection are theses, dissertations, and project reports submitted as a requirement for completing a degree at UPR-Mayagüez.

Show simple item record