Boosting image captioning using ConvNeXt deep neural networks/ (Registro nro. 4417)

Detalles MARC
000 -CABECERA
Campo de control de longitud fija	03388nam a22003617a 4500
003 - IDENTIFICADOR DEL NÚMERO DE CONTROL
Campo de control	EC-UrYT
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN
Campo de control	20230704153619.0
008 - CÓDIGOS DE INFORMACIÓN DE LONGITUD FIJA
Campo de control de longitud fija	150116t9999 mx r gr 000 0 spa d
040 ## - FUENTE DE LA CATALOGACIÓN
Centro transcriptor	EC-UrYT
041 ## - CÓDIGO DE LENGUA
Código de lengua del texto/banda sonora o título independiente	eng
Código de lengua del sumario o resumen	spa
100 1# - PUNTO DE ACCESO PRINCIPAL - NOMBRE DE PERSONA
9 (RLIN)	15291
Nombre de persona	Ramos Granda, Leo Thomas
Término indicativo de función	autor
245 1# - MENCIÓN DE TÍTULO
Título	Boosting image captioning using ConvNeXt deep neural networks/
Mención de responsabilidad etc.	Leo Thomas Ramos Granda ; tutor Manuel Eugenio Morocho Cayamcela
264 #4 - PRODUCCIÓN, PUBLICACIÓN, DISTRIBUCIÓN, FABRICACIÓN Y COPYRIGHT
Lugar de producción	Urcuquí,
Fecha de producción	2023
300 ## - DESCRIPCIÓN FÍSICA
Extensión	81 hojas :
Otras características físicas	ilustraciones (algunas a color) ;
Dimensiones	30 cm +
Material anejo	1 CD-ROM
502 ## - NOTA DE TESIS
Nota de tesis	Trabajo de integración curricular
Tipo de título	(Ingeniero/a en Tecnologías de la Información).
Nombre de la institución que otorga el título	Universidad de Investigación de Tecnología Experimental Yachay.
Ciudad de la institución que otorga el título	Urcuquí,
Año de obtención del título	2023
504 ## - NOTA DE BIBLIOGRAFÍA; ETC.
Nota de bibliografía etc.	Incluye referencias bibliográficas (páginas 53-61)
506 ## - NOTA DE RESTRICCIONES AL ACCESO
Limitaciones de acceso	Trabajo de integración curricular con acceso abierto
516 ## - NOTA DE TIPO DE ARCHIVO DE ORDENADOR O DE DATOS
Nota de tipo de archivo de ordenador o de datos	Texto (Hypertexto links)
520 ## - NOTA DE SUMARIO; ETC.
Sumario etc.	Este trabajo propone un modelo basado en ConvNeXt para generar subtítulos de imágenes. Específicamente, se integra el modelo convolucional ConvNeXt, una arquitectura de visión por computadora de última generación, con una red de memoria a corto y largo plazo que incluye un módulo de atención visual. Se realizaron diversos experimentos para evaluar la viabilidad de ConvNeXt en esta tarea. En primer lugar, se estudió el impacto de usar cuatro versiones de ConvNeXt para la extracción de características. Además, se probaron dos tasas de aprendizaje diferentes durante la etapa de entrenamiento del codificador para analizar el impacto de esto en el rendimiento. Asimismo, se analizó el efecto de la inclusión y exclusión de teacher-forcing en el decodificador durante el entrenamiento. Se utilizó el conjunto de datos MS COCO 2014, y se adoptaron la pérdida, top-5 accuracy y BLEU-n como métricas de rendimiento. Los resultados muestran que nuestro modelo propuesto supera el modelo de referencia en un 43.04% y un 39.04% para los modelos de atención suave y atención dura, respectivamente, en términos de BLEU-4. Nuestro modelo también supera en un 4.57% y un 0.93% a los enfoques equivalentes basados en transformador de visión y transformador de imagen con eficiencia de datos, respectivamente, en términos de BLEU-4. Además, nuestro modelo mejoró a alternativas que utilizan codificadores basados en arquitecturas ResNet-101, ResNet-152, VGG-16, ResNeXt-101, y MobileNet V3, en un 6.44%, 6.46%, 6.47%, 6.39% y 6.68%, respectivamente, en términos de precisión en top-5 accuracy, y en un 18.46%, 18.44%, 18.46%, 18.24% y 18.72%, respectivamente, en términos de pérdida.
546 ## - NOTA DE LENGUA
Nota de lengua	Textos en inglés con resúmenes en español e inglés
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN)	12691
Término de materia o nombre geográfico como elemento inicial	Redes neuronales artificiales
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN)	15292
Término de materia o nombre geográfico como elemento inicial	Visión computacional
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN)	15293
Término de materia o nombre geográfico como elemento inicial	Subtítulado de imágenes
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN)	12689
Término de materia o nombre geográfico como elemento inicial	Artificial Neural Networks
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN)	4865
Término de materia o nombre geográfico como elemento inicial	Computer vision.
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN)	15294
Término de materia o nombre geográfico como elemento inicial	Image captioning
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA
9 (RLIN)	3891
Término de materia o nombre geográfico como elemento inicial	Tecnologías de la Información
Subdivisión de forma	Trabajos y disertaciones académicas
700 1# - PUNTO DE ACCESO ADICIONAL - NOMBRE DE PERSONA
9 (RLIN)	12750
Nombre de persona	Morocho Cayamcela, Manuel Eugenio
Término indicativo de función	tutor
710 1# - PUNTO DE ACCESO ADICIONAL - NOMBRE DE ENTIDAD
9 (RLIN)	11232
Nombre de entidad o nombre de jurisdicción como elemento inicial	Universidad de Investigación de Tecnología Experimental Yachay.
Unidad subordinada	Escuela de Ciencias Matemáticas y Computacionales
856 ## - LOCALIZACIÓN Y ACCESO ELECTRÓNICOS
Nota pública	Ver recurso
Identificador Uniforme del Recurso (URI)	http://repositorio.yachaytech.edu.ec/handle/123456789/627
942 ## - ENTRADA PARA ELEMENTOS AGREGADOS (KOHA)
Fuente de clasificación o esquema de ordenación en estanterías	Clasificación Decimal Dewey
Koha [por defecto] tipo de item	Tesis

Existencias
Suprimido	Estado de pérdida	Fuente de clasificación o esquema de ordenación en estanterías	Estropeado	No para préstamo	Localización permanente	Localización actual	Fecha de adquisición	Número de inventario	Préstamos totales	Signatura completa	Código de barras	Fecha última consulta	Número de ejemplar	Fecha del precio de reemplazo	Tipo de item de Koha
		Clasificación Decimal Dewey			Biblioteca Yachay Tech	Biblioteca Yachay Tech	06/21/2023	T000555		ECMC0125	T000555	07/04/2023	1	07/04/2023	Tesis

Imprimir
Agregar a su carrito (remover)
Guardar registro
BIBTEX Dublin Core MARC (non-Unicode/MARC-8) MARCXML MODS (XML) MARC (Unicode/UTF-8) MARC (Unicode/UTF-8, Standard)
Más búsquedas

Buscar este título en:
Other Libraries (WorldCat) Other Databases (Google Scholar) Online Stores (Bookfinder.com) Open Library (openlibrary.org) BibliotecasEcuador.com