Boosting image captioning using ConvNeXt deep neural networks/ (Registro nro. 4417)

Detalles MARC
000 -CABECERA
Campo de control de longitud fija 03388nam a22003617a 4500
003 - IDENTIFICADOR DEL NÚMERO DE CONTROL
Campo de control EC-UrYT
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN
Campo de control 20230704153619.0
008 - CÓDIGOS DE INFORMACIÓN DE LONGITUD FIJA
Campo de control de longitud fija 150116t9999 mx r gr 000 0 spa d
040 ## - FUENTE DE LA CATALOGACIÓN
Centro transcriptor EC-UrYT
041 ## - CÓDIGO DE LENGUA
Código de lengua del texto/banda sonora o título independiente eng
Código de lengua del sumario o resumen spa
100 1# - PUNTO DE ACCESO PRINCIPAL - NOMBRE DE PERSONA
9 (RLIN) 15291
Nombre de persona Ramos Granda, Leo Thomas
Término indicativo de función autor
245 1# - MENCIÓN DE TÍTULO
Título Boosting image captioning using ConvNeXt deep neural networks/
Mención de responsabilidad etc. Leo Thomas Ramos Granda ; tutor Manuel Eugenio Morocho Cayamcela
264 #4 - PRODUCCIÓN, PUBLICACIÓN, DISTRIBUCIÓN, FABRICACIÓN Y COPYRIGHT
Lugar de producción Urcuquí,
Fecha de producción 2023
300 ## - DESCRIPCIÓN FÍSICA
Extensión 81 hojas :
Otras características físicas ilustraciones (algunas a color) ;
Dimensiones 30 cm +
Material anejo 1 CD-ROM
502 ## - NOTA DE TESIS
Nota de tesis Trabajo de integración curricular
Tipo de título (Ingeniero/a en Tecnologías de la Información).
Nombre de la institución que otorga el título Universidad de Investigación de Tecnología Experimental Yachay.
Ciudad de la institución que otorga el título Urcuquí,
Año de obtención del título 2023
504 ## - NOTA DE BIBLIOGRAFÍA; ETC.
Nota de bibliografía etc. Incluye referencias bibliográficas (páginas 53-61)
506 ## - NOTA DE RESTRICCIONES AL ACCESO
Limitaciones de acceso Trabajo de integración curricular con acceso abierto
516 ## - NOTA DE TIPO DE ARCHIVO DE ORDENADOR O DE DATOS
Nota de tipo de archivo de ordenador o de datos Texto (Hypertexto links)
520 ## - NOTA DE SUMARIO; ETC.
Sumario etc. Este trabajo propone un modelo basado en ConvNeXt para generar subtítulos de imágenes. Específicamente, se integra el modelo convolucional ConvNeXt, una arquitectura de visión por computadora de última generación, con una red de memoria a corto y largo plazo que incluye un módulo de atención visual. Se realizaron diversos experimentos para evaluar la viabilidad de ConvNeXt en esta tarea. En primer lugar, se estudió el impacto de usar cuatro versiones de ConvNeXt para la extracción de características. Además, se probaron dos tasas de aprendizaje diferentes durante la etapa de entrenamiento del codificador para analizar el impacto de esto en el rendimiento. Asimismo, se analizó el efecto de la inclusión y exclusión de teacher-forcing en el decodificador durante el entrenamiento. Se utilizó el conjunto de datos MS COCO 2014, y se adoptaron la pérdida, top-5 accuracy y BLEU-n como métricas de rendimiento. Los resultados muestran que nuestro modelo propuesto supera el modelo de referencia en un 43.04% y un 39.04% para los modelos de atención suave y atención dura, respectivamente, en términos de BLEU-4. Nuestro modelo también supera en un 4.57% y un 0.93% a los enfoques equivalentes basados en transformador de visión y transformador de imagen con eficiencia de datos, respectivamente, en términos de BLEU-4. Además, nuestro modelo mejoró a alternativas que utilizan codificadores basados en arquitecturas ResNet-101, ResNet-152, VGG-16, ResNeXt-101, y MobileNet V3, en un 6.44%, 6.46%, 6.47%, 6.39% y 6.68%, respectivamente, en términos de precisión en top-5 accuracy, y en un 18.46%, 18.44%, 18.46%, 18.24% y 18.72%, respectivamente, en términos de pérdida.
546 ## - NOTA DE LENGUA
Nota de lengua Textos en inglés con resúmenes en español e inglés
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN) 12691
Término de materia o nombre geográfico como elemento inicial Redes neuronales artificiales
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN) 15292
Término de materia o nombre geográfico como elemento inicial Visión computacional
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN) 15293
Término de materia o nombre geográfico como elemento inicial Subtítulado de imágenes
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN) 12689
Término de materia o nombre geográfico como elemento inicial Artificial Neural Networks
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN) 4865
Término de materia o nombre geográfico como elemento inicial Computer vision.
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN) 15294
Término de materia o nombre geográfico como elemento inicial Image captioning
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN) 3891
Término de materia o nombre geográfico como elemento inicial Tecnologías de la Información
Subdivisión de forma Trabajos y disertaciones académicas
700 1# - PUNTO DE ACCESO ADICIONAL - NOMBRE DE PERSONA
9 (RLIN) 12750
Nombre de persona Morocho Cayamcela, Manuel Eugenio
Término indicativo de función tutor
710 1# - PUNTO DE ACCESO ADICIONAL - NOMBRE DE ENTIDAD
9 (RLIN) 11232
Nombre de entidad o nombre de jurisdicción como elemento inicial Universidad de Investigación de Tecnología Experimental Yachay.
Unidad subordinada Escuela de Ciencias Matemáticas y Computacionales
856 ## - LOCALIZACIÓN Y ACCESO ELECTRÓNICOS
Nota pública Ver recurso
Identificador Uniforme del Recurso (URI) http://repositorio.yachaytech.edu.ec/handle/123456789/627
942 ## - ENTRADA PARA ELEMENTOS AGREGADOS (KOHA)
Fuente de clasificación o esquema de ordenación en estanterías Clasificación Decimal Dewey
Koha [por defecto] tipo de item Tesis
Existencias
Suprimido Estado de pérdida Fuente de clasificación o esquema de ordenación en estanterías Estropeado No para préstamo Localización permanente Localización actual Fecha de adquisición Número de inventario Préstamos totales Signatura completa Código de barras Fecha última consulta Número de ejemplar Fecha del precio de reemplazo Tipo de item de Koha
    Clasificación Decimal Dewey     Biblioteca Yachay Tech Biblioteca Yachay Tech 06/21/2023 T000555   ECMC0125 T000555 07/04/2023 1 07/04/2023 Tesis

Ayuda

X

Correo: bibliotecayachaytech@yachaytech.edu.ec
Teléfono:+593 6299 9500 Ext. 2517

Horario de atención:

X

BIBLIOTECA UNIVERSIDAD YACHAY TECH

  • Área: Fondo Impreso
    Lunes a Viernes de 08h00 a 20h30
    Sábado de 08h00 a 16h30
  • Área: Ingenio
    Abierto 24 horas 7 días
  • Área: Bloque de Servicios, 2do. Piso
    Espacios de Estudio Grupal e Individual, abierto 24 horas 7 días

Recuerda que los espacios son compartidos por toda la comunidad, por lo que debes hacer un uso adecuado
del tiempo que los ocupes, mantenerlos limpios y evitar el daño a las instalaciones y bienes materiales.

También puedes usar nuestros canales de comunicación:

Correo: bibliotecayachaytech@yachaytech.edu.ec
Teléfono: +593 6299 9500 Ext. 2517
Ubicación: San Miguel de Urcuquí, Hacienda San José s/n y Proyecto Yachay

Video

X