Detalles MARC
000 -CABECERA |
Campo de control de longitud fija |
03168nam a22003497a 4500 |
003 - IDENTIFICADOR DEL NÚMERO DE CONTROL |
Campo de control |
EC-UrYT |
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN |
Campo de control |
20231122170402.0 |
008 - CÓDIGOS DE INFORMACIÓN DE LONGITUD FIJA |
Campo de control de longitud fija |
150116t9999 mx r gr 000 0 spa d |
040 ## - FUENTE DE LA CATALOGACIÓN |
Centro transcriptor |
EC-UrYT |
041 ## - CÓDIGO DE LENGUA |
Código de lengua del texto/banda sonora o título independiente |
eng |
Código de lengua del sumario o resumen |
spa |
100 1# - PUNTO DE ACCESO PRINCIPAL - NOMBRE DE PERSONA |
Nombre de persona |
Román Niemes, Stadyn Josué |
9 (RLIN) |
15376 |
Término indicativo de función |
autor |
245 10 - MENCIÓN DE TÍTULO |
Título |
Illicit tweet detection using Transformers/ |
Mención de responsabilidad etc. |
Stadyn Josué Román Niemes, tutor Erick Eduardo Cuenca Pauta |
264 #4 - PRODUCCIÓN, PUBLICACIÓN, DISTRIBUCIÓN, FABRICACIÓN Y COPYRIGHT |
Lugar de producción |
Urcuquí, |
Fecha de producción |
2023 |
300 ## - DESCRIPCIÓN FÍSICA |
Extensión |
81 hojas : |
Otras características físicas |
ilustraciones (algunas a color) ; |
Dimensiones |
30 cm + |
Material anejo |
1 CD-ROM |
502 ## - NOTA DE TESIS |
Nota de tesis |
Trabajo de integración curricular |
Tipo de título |
(Tecnologías de la Información). |
Nombre de la institución que otorga el título |
Universidad de Investigación de Tecnología Experimental Yachay. |
Ciudad de la institución que otorga el título |
Urcuquí, |
Año de obtención del título |
2023 |
504 ## - NOTA DE BIBLIOGRAFÍA; ETC. |
Nota de bibliografía etc. |
Incluye referencias bibliográficas (páginas 49-59) |
506 ## - NOTA DE RESTRICCIONES AL ACCESO |
Limitaciones de acceso |
Trabajo de integración curricular con acceso abierto |
516 ## - NOTA DE TIPO DE ARCHIVO DE ORDENADOR O DE DATOS |
Nota de tipo de archivo de ordenador o de datos |
Texto (Hypertexto links) |
520 ## - NOTA DE SUMARIO; ETC. |
Sumario etc. |
Twitter es una red social muy amplia que permite a las personas comunicarse entre sí y expresar sus ideas gracias a su enfoque corto y rápido en las publicaciones. Desafortunadamente, no está exenta de asuntos ilícitos que ocurren en la plataforma. Un problema que surge en las redes sociales en general es cómo se utilizan para promover y difundir servicios ilegales, como la trata de personas, la prostitución, las drogas ilegales, entre otros, gracias al alcance de esas plataformas. Por lo tanto, es importante identificar esta clase de mensajes para detectar actividades ilegales y actuar al respecto. En este trabajo, se presenta y desarrolla un marco para dicha detección utilizando 4 modelos basados en Transformers, la arquitectura más potente actualmente para trabajar en procesamiento del lenguaje natural. Para alimentar y entrenar a los modelos, se seleccionó y etiquetó un dataset de tweets para identificar cuáles contienen ofertas o contenido ilícito en su texto. Dos modelos no basados en Transformers también fueron usados para propósitos de comparación. Los experimentos mostraron que los modelos basados en Transformers son bastante buenos para adaptarse a las particularidades del idioma español y a la estructura que suelen tener los tweets, siendo los modelos BERTweet y DistilBERT los mejores. Además, se observó que los modelos basados en Transformers se pueden adaptar a datasets que no tengan un desbalance fuerte (para este trabajo, una proporción de casi 2:1) y no son afectados cuando se usan datos sintéticos. |
546 ## - NOTA DE LENGUA |
Nota de lengua |
Textos en inglés con resúmenes en español e inglés |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento inicial |
Redes neuronales artificiales |
9 (RLIN) |
12691 |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento inicial |
Twitter |
9 (RLIN) |
15377 |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento inicial |
Procesamiento del lenguaje natural |
9 (RLIN) |
15378 |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento inicial |
Artificial Neural Networks |
9 (RLIN) |
12689 |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento inicial |
Natural language processing |
9 (RLIN) |
15379 |
650 #0 - PUNTO DE ACCESO ADICIONAL DE MATERIA - TÉRMINO DE MATERIA |
Término de materia o nombre geográfico como elemento inicial |
Tecnologías de la Información |
9 (RLIN) |
3891 |
Subdivisión de forma |
Trabajos y disertaciones académicas |
700 1# - PUNTO DE ACCESO ADICIONAL - NOMBRE DE PERSONA |
Nombre de persona |
Cuenca Pauta, Erick Eduardo |
9 (RLIN) |
12890 |
Término indicativo de función |
tutor |
710 1# - PUNTO DE ACCESO ADICIONAL - NOMBRE DE ENTIDAD |
Nombre de entidad o nombre de jurisdicción como elemento inicial |
Universidad de Investigación de Tecnología Experimental Yachay. |
9 (RLIN) |
11232 |
Unidad subordinada |
Escuela de Ciencias Matemáticas Computacionales |
856 ## - LOCALIZACIÓN Y ACCESO ELECTRÓNICOS |
Nota pública |
Ver recurso |
Identificador Uniforme del Recurso (URI) |
http://repositorio.yachaytech.edu.ec/handle/123456789/674 |
942 ## - ENTRADA PARA ELEMENTOS AGREGADOS (KOHA) |
Fuente de clasificación o esquema de ordenación en estanterías |
Clasificación Decimal Dewey |
Koha [por defecto] tipo de item |
Tesis |