Detalles MARC
000 -CABECERA |
Campo de control de longitud fija |
03388nam a22003617a 4500 |
003 - IDENTIFICADOR DEL NÚMERO DE CONTROL |
Campo de control |
EC-UrYT |
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN |
Campo de control |
20230704153619.0 |
008 - CÓDIGOS DE INFORMACIÓN DE LONGITUD FIJA |
Campo de control de longitud fija |
150116t9999 mx r gr 000 0 spa d |
040 ## - FUENTE DE LA CATALOGACIÓN |
Centro transcriptor |
EC-UrYT |
041 ## - CÓDIGO DE LENGUA |
Código de lengua del texto/banda sonora o título independiente |
eng |
Código de lengua del sumario o resumen |
spa |
100 1# - PUNTO DE ACCESO PRINCIPAL - NOMBRE DE PERSONA |
9 (RLIN) |
15291 |
Nombre de persona |
Ramos Granda, Leo Thomas |
Término indicativo de función |
autor |
245 1# - MENCIÓN DE TÍTULO |
Título |
Boosting image captioning using ConvNeXt deep neural networks/ |
Mención de responsabilidad etc. |
Leo Thomas Ramos Granda ; tutor Manuel Eugenio Morocho Cayamcela |
264 #4 - PRODUCCIÓN, PUBLICACIÓN, DISTRIBUCIÓN, FABRICACIÓN Y COPYRIGHT |
Lugar de producción |
Urcuquí, |
Fecha de producción |
2023 |
300 ## - DESCRIPCIÓN FÍSICA |
Extensión |
81 hojas : |
Otras características físicas |
ilustraciones (algunas a color) ; |
Dimensiones |
30 cm + |
Material anejo |
1 CD-ROM |
502 ## - NOTA DE TESIS |
Nota de tesis |
Trabajo de integración curricular |
Tipo de título |
(Ingeniero/a en Tecnologías de la Información). |
Nombre de la institución que otorga el título |
Universidad de Investigación de Tecnología Experimental Yachay. |
Ciudad de la institución que otorga el título |
Urcuquí, |
Año de obtención del título |
2023 |
504 ## - NOTA DE BIBLIOGRAFÍA; ETC. |
Nota de bibliografía etc. |
Incluye referencias bibliográficas (páginas 53-61) |
506 ## - NOTA DE RESTRICCIONES AL ACCESO |
Limitaciones de acceso |
Trabajo de integración curricular con acceso abierto |
516 ## - NOTA DE TIPO DE ARCHIVO DE ORDENADOR O DE DATOS |
Nota de tipo de archivo de ordenador o de datos |
Texto (Hypertexto links) |
520 ## - NOTA DE SUMARIO; ETC. |
Sumario etc. |
Este trabajo propone un modelo basado en ConvNeXt para generar subtítulos de imágenes. Específicamente, se integra el modelo convolucional ConvNeXt, una arquitectura de visión por computadora de última generación, con una red de memoria a corto y largo plazo que incluye un módulo de atención visual. Se realizaron diversos experimentos para evaluar la viabilidad de ConvNeXt en esta tarea. En primer lugar, se estudió el impacto de usar cuatro versiones de ConvNeXt para la extracción de características. Además, se probaron dos tasas de aprendizaje diferentes durante la etapa de entrenamiento del codificador para analizar el impacto de esto en el rendimiento. Asimismo, se analizó el efecto de la inclusión y exclusión de teacher-forcing en el decodificador durante el entrenamiento. Se utilizó el conjunto de datos MS COCO 2014, y se adoptaron la pérdida, top-5 accuracy y BLEU-n como métricas de rendimiento. Los resultados muestran que nuestro modelo propuesto supera el modelo de referencia en un 43.04% y un 39.04% para los modelos de atención suave y atención dura, respectivamente, en términos de BLEU-4. Nuestro modelo también supera en un 4.57% y un 0.93% a los enfoques equivalentes basados en transformador de visión y transformador de imagen con eficiencia de datos, respectivamente, en términos de BLEU-4. Además, nuestro modelo mejoró a alternativas que utilizan codificadores basados en arquitecturas ResNet-101, ResNet-152, VGG-16, ResNeXt-101, y MobileNet V3, en un 6.44%, 6.46%, 6.47%, 6.39% y 6.68%, respectivamente, en términos de precisión en top-5 accuracy, y en un 18.46%, 18.44%, 18.46%, 18.24% y 18.72%, respectivamente, en términos de pérdida. |
546 ## - NOTA DE LENGUA |
Nota de lengua |
Textos en inglés con resúmenes en español e inglés |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
9 (RLIN) |
12691 |
Término de materia o nombre geográfico como elemento inicial |
Redes neuronales artificiales |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
9 (RLIN) |
15292 |
Término de materia o nombre geográfico como elemento inicial |
Visión computacional |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
9 (RLIN) |
15293 |
Término de materia o nombre geográfico como elemento inicial |
Subtítulado de imágenes |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
9 (RLIN) |
12689 |
Término de materia o nombre geográfico como elemento inicial |
Artificial Neural Networks |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
9 (RLIN) |
4865 |
Término de materia o nombre geográfico como elemento inicial |
Computer vision. |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
9 (RLIN) |
15294 |
Término de materia o nombre geográfico como elemento inicial |
Image captioning |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
9 (RLIN) |
3891 |
Término de materia o nombre geográfico como elemento inicial |
Tecnologías de la Información |
Subdivisión de forma |
Trabajos y disertaciones académicas |
700 1# - PUNTO DE ACCESO ADICIONAL - NOMBRE DE PERSONA |
9 (RLIN) |
12750 |
Nombre de persona |
Morocho Cayamcela, Manuel Eugenio |
Término indicativo de función |
tutor |
710 1# - PUNTO DE ACCESO ADICIONAL - NOMBRE DE ENTIDAD |
9 (RLIN) |
11232 |
Nombre de entidad o nombre de jurisdicción como elemento inicial |
Universidad de Investigación de Tecnología Experimental Yachay. |
Unidad subordinada |
Escuela de Ciencias Matemáticas y Computacionales |
856 ## - LOCALIZACIÓN Y ACCESO ELECTRÓNICOS |
Nota pública |
Ver recurso |
Identificador Uniforme del Recurso (URI) |
http://repositorio.yachaytech.edu.ec/handle/123456789/627 |
942 ## - ENTRADA PARA ELEMENTOS AGREGADOS (KOHA) |
Fuente de clasificación o esquema de ordenación en estanterías |
Clasificación Decimal Dewey |
Koha [por defecto] tipo de item |
Tesis |