The Yggdrasil Project: organic reaction prediction with a custom-developed feedforward neural network and a tailored database / Jonnathan Ariel Castro Angamarca ; tutor Thibault Terencio
Tipo de material: TextoIdioma: Inglés Idioma del resumen: Español Fecha de copyright: Urcuquí, 2024Descripción: 102 hojas : ilustraciones (algunas a color) ; 30 cm + 1 CD-ROMTema(s): Recursos en línea: Nota de disertación: Trabajo de integración curricular (Químico/a). Universidad de Investigación de Tecnología Experimental Yachay. Urcuquí, 2024 Resumen: Esta tesis presenta el proyecto Yggdrasil, cuyo objetivo es aplicar el aprendizaje automático para predecir reacciones químicas orgánicas mediante el desarrollo y validación de un modelo de red neuronal. El proyecto se estructura en dos fases principales: Cognitio y Vaticinor. En la fase Cognitio, un subconjunto de la base de datos USPTO_MIT fue procesado y adaptado para el aprendizaje automático, aumentado con cálculos de la Teoría del Funcional Densidad, para formar un conjunto de datos adecuado para el entrenamiento del modelo. La fase Vaticinor consistió en el diseño, desarrollo y validación del modelo de red neuronal, centrándose en la capacidad del modelo para predecir reacciones orgánicas con precisión. Utilizando sólo el 0,375% de la base de datos USPTO_MIT, el proyecto logró una precisión de prueba del 32,33% y una precisión de validación cruzada del 29,39%. El análisis determinó que el conjunto de características "Correlación fuerte" era el que ofrecía el mejor rendimiento, lo que subraya la importancia de la selección estratégica de características para mejorar la precisión predictiva y la capacidad de generalización del modelo. Los resultados ilustran la viabilidad y el potencial del uso del aprendizaje automático para la predicción de reacciones orgánicas. La dirección futura del proyecto Yggdrasil incluye: • La ampliación de la base de datos para mejorar la robustez del modelo. • La integración de todos los scripts de Cognitio para la optimización de procesos. • La adición de información estereoquímica al conjunto de datos. • El perfeccionamiento del modelo para cubrir una gama más amplia de reacciones orgánicas. Esta tesis destaca la importancia de la preparación de datos, la selección de características y la validación de modelos en el aprendizaje automático y la química computacional. Los códigos que componen el Proyecto Yggdrasil fueron escritos en Python3.10 y Bash y están disponibles en el repositorio GitHub: https://github.com/jcastro7732/Yggdrasil-ProjectTipo de ítem | Biblioteca actual | Signatura | Copia número | Estado | Fecha de vencimiento | Código de barras | Reserva de ítems | |
---|---|---|---|---|---|---|---|---|
Tesis | Biblioteca Yachay Tech | ECQI0159 (Navegar estantería(Abre debajo)) | 1 | No para préstamo | T000664 |
Trabajo de integración curricular (Químico/a). Universidad de Investigación de Tecnología Experimental Yachay. Urcuquí, 2024
Incluye referencias bibliográficas (páginas 77-80)
Trabajo de integración curricular con acceso abierto
Texto (Hypertexto links)
Esta tesis presenta el proyecto Yggdrasil, cuyo objetivo es aplicar el aprendizaje automático para predecir reacciones químicas orgánicas mediante el desarrollo y validación de un modelo de red neuronal. El proyecto se estructura en dos fases principales: Cognitio y Vaticinor. En la fase Cognitio, un subconjunto de la base de datos USPTO_MIT fue procesado y adaptado para el aprendizaje automático, aumentado con cálculos de la Teoría del Funcional Densidad, para formar un conjunto de datos adecuado para el entrenamiento del modelo. La fase Vaticinor consistió en el diseño, desarrollo y validación del modelo de red neuronal, centrándose en la capacidad del modelo para predecir reacciones orgánicas con precisión. Utilizando sólo el 0,375% de la base de datos USPTO_MIT, el proyecto logró una precisión de prueba del 32,33% y una precisión de validación cruzada del 29,39%. El análisis determinó que el conjunto de características "Correlación fuerte" era el que ofrecía el mejor rendimiento, lo que subraya la importancia de la selección estratégica de características para mejorar la precisión predictiva y la capacidad de generalización del modelo. Los resultados ilustran la viabilidad y el potencial del uso del aprendizaje automático para la predicción de reacciones orgánicas. La dirección futura del proyecto Yggdrasil incluye: • La ampliación de la base de datos para mejorar la robustez del modelo. • La integración de todos los scripts de Cognitio para la optimización de procesos. • La adición de información estereoquímica al conjunto de datos. • El perfeccionamiento del modelo para cubrir una gama más amplia de reacciones orgánicas. Esta tesis destaca la importancia de la preparación de datos, la selección de características y la validación de modelos en el aprendizaje automático y la química computacional. Los códigos que componen el Proyecto Yggdrasil fueron escritos en Python3.10 y Bash y están disponibles en el repositorio GitHub: https://github.com/jcastro7732/Yggdrasil-Project
Textos en inglés con resúmenes en español e inglés
No hay comentarios en este titulo.