Big Data Analysis using CUR Algorithm / Marco Andrés Enríquez Pinto ; tutor Isidro Rafael Amaro Martín
Tipo de material: TextoIdioma: Inglés Idioma del resumen: Español Fecha de copyright: Urcuquí, 2021Descripción: 93 hojas : ilustraciones (algunas a color) ; 30 cm + 1 CD-ROMTema(s): Recursos en línea: Nota de disertación: Trabajo de integración curricular (Matemático/a). Universidad de Investigación de Tecnología Experimental Yachay. Urcuquí, 2021 Resumen: En esta tesis, presentamos los resultados the dos análisis bien conocidos como son el Análisis de Componentes Principales (ACP) y el Algorithmo CUR, en dos conjuntos de datos: uno relacionado con pruebas clinicas tal como las pruebas del COVID-19 y el otro esta relacionado con la electroencefalografía (EEG). En algunos casos, ACP y otros métodos de reducción de dimensión basados en la truncación de la Descomposición en Valores Singulares (DCS), pueden tener ciertos problemas con la interpretación de sus resultados. Esto sucede porque ACP crea nuevas variables que son combinaciones lineales tha las variables originales y, en aplicaciones, estas no tienen un significado físico necesariamente. Por esta razón, nosotros usamos el Algoritmo CUR y lo aplicamos a nuestros conjuntos de datos selectos para mostrar que es más facil de interpretar la matriz reducida que nos retorna. También desarrolamos la matemática detrás ACP y el Algoritmo CUR. Por ejemplo, hemos demostrado que la Descomposición Matricial CUR (de la cual el Algoritmo CUR está basado) existe solo usando algebra lineal. Además, demostramos que la Descomposición Matricial CUR es una aproximación tan buena como la truncació de la DVS. Como los conjuntos de datos que usamos tienen diferente dimensión, esto fue útil para ver el comportamiento de el Algoritmo CUR cuando trabaja con pequeñas y grandes matrices. Para el conjunto de datos de pruebas clínicas (COVID-19) analizamos la efectividad de el Algoritmo CUR frente a ACP y descubrimos que, para esta matriz, el Algoritmo CUR resulta mas efectivo que el ACP cuando los parametros de control de el Algoritmo CUR c y k son iguales. Adem´asm los resultados de el Algoritmo CUR sugieren que las pruebas de laboratorio Dimero D, Ferritina y PCR son las variables más importantes. Para el conjunto de datos EEG, concluimos que el Algoritmo CUR es más efectivo para esta matriz de datos si sus parametros de entrada cumple lo siquiente: c = 8 y k ≤ 57, c = 16 y k ≤ 50, c = 24 y k ≤ 43, c = 32 y k ≤ 36, c = 40 y k ≤ 29, c = 48 y k ≤ 22, c = 56 y k ≤ 15, c = 64 y k ≤ 8.Tipo de ítem | Biblioteca actual | Signatura | Copia número | Estado | Fecha de vencimiento | Código de barras | Reserva de ítems | |
---|---|---|---|---|---|---|---|---|
Tesis | Biblioteca Yachay Tech | ECMC0075 (Navegar estantería(Abre debajo)) | 1 | No para préstamo | T000109 |
Trabajo de integración curricular (Matemático/a). Universidad de Investigación de Tecnología Experimental Yachay. Urcuquí, 2021
Incluye referencias bibliográficas (páginas 55-57)
Trabajo de integración curricular con acceso abierto
Texto (Hypertexto links)
En esta tesis, presentamos los resultados the dos análisis bien conocidos como son el Análisis de Componentes Principales (ACP) y el Algorithmo CUR, en dos conjuntos de datos: uno relacionado con pruebas clinicas tal como las pruebas del COVID-19 y el otro esta relacionado con la electroencefalografía (EEG). En algunos casos, ACP y otros métodos de reducción de dimensión basados en la truncación de la Descomposición en Valores Singulares (DCS), pueden tener ciertos problemas con la interpretación de sus resultados. Esto sucede porque ACP crea nuevas variables que son combinaciones lineales tha las variables originales y, en aplicaciones, estas no tienen un significado físico necesariamente. Por esta razón, nosotros usamos el Algoritmo CUR y lo aplicamos a nuestros conjuntos de datos selectos para mostrar que es más facil de interpretar la matriz reducida que nos retorna. También desarrolamos la matemática detrás ACP y el Algoritmo CUR. Por ejemplo, hemos demostrado que la Descomposición Matricial CUR (de la cual el Algoritmo CUR está basado) existe solo usando algebra lineal. Además, demostramos que la Descomposición Matricial CUR es una aproximación tan buena como la truncació de la DVS. Como los conjuntos de datos que usamos tienen diferente dimensión, esto fue útil para ver el comportamiento de el Algoritmo CUR cuando trabaja con pequeñas y grandes matrices. Para el conjunto de datos de pruebas clínicas (COVID-19) analizamos la efectividad de el Algoritmo CUR frente a ACP y descubrimos que, para esta matriz, el Algoritmo CUR resulta mas efectivo que el ACP cuando los parametros de control de el Algoritmo CUR c y k son iguales. Adem´asm los resultados de el Algoritmo CUR sugieren que las pruebas de laboratorio Dimero D, Ferritina y PCR son las variables más importantes. Para el conjunto de datos EEG, concluimos que el Algoritmo CUR es más efectivo para esta matriz de datos si sus parametros de entrada cumple lo siquiente: c = 8 y k ≤ 57, c = 16 y k ≤ 50, c = 24 y k ≤ 43, c = 32 y k ≤ 36, c = 40 y k ≤ 29, c = 48 y k ≤ 22, c = 56 y k ≤ 15, c = 64 y k ≤ 8.
Textos en inglés con resúmenes en español e inglés
No hay comentarios en este titulo.