Illicit tweet detection using Transformers/ Stadyn Josué Román Niemes, tutor Erick Eduardo Cuenca Pauta

Por: Colaborador(es): Tipo de material: TextoTextoIdioma: Inglés Idioma del resumen: Español Fecha de copyright: Urcuquí, 2023Descripción: 81 hojas : ilustraciones (algunas a color) ; 30 cm + 1 CD-ROMTema(s): Recursos en línea: Nota de disertación: Trabajo de integración curricular (Tecnologías de la Información). Universidad de Investigación de Tecnología Experimental Yachay. Urcuquí, 2023 Resumen: Twitter es una red social muy amplia que permite a las personas comunicarse entre sí y expresar sus ideas gracias a su enfoque corto y rápido en las publicaciones. Desafortunadamente, no está exenta de asuntos ilícitos que ocurren en la plataforma. Un problema que surge en las redes sociales en general es cómo se utilizan para promover y difundir servicios ilegales, como la trata de personas, la prostitución, las drogas ilegales, entre otros, gracias al alcance de esas plataformas. Por lo tanto, es importante identificar esta clase de mensajes para detectar actividades ilegales y actuar al respecto. En este trabajo, se presenta y desarrolla un marco para dicha detección utilizando 4 modelos basados en Transformers, la arquitectura más potente actualmente para trabajar en procesamiento del lenguaje natural. Para alimentar y entrenar a los modelos, se seleccionó y etiquetó un dataset de tweets para identificar cuáles contienen ofertas o contenido ilícito en su texto. Dos modelos no basados en Transformers también fueron usados para propósitos de comparación. Los experimentos mostraron que los modelos basados en Transformers son bastante buenos para adaptarse a las particularidades del idioma español y a la estructura que suelen tener los tweets, siendo los modelos BERTweet y DistilBERT los mejores. Además, se observó que los modelos basados en Transformers se pueden adaptar a datasets que no tengan un desbalance fuerte (para este trabajo, una proporción de casi 2:1) y no son afectados cuando se usan datos sintéticos.
Etiquetas de esta biblioteca: No hay etiquetas de esta biblioteca para este título. Ingresar para agregar etiquetas.
Valoración
    Valoración media: 0.0 (0 votos)
Existencias
Tipo de ítem Biblioteca actual Signatura Copia número Estado Fecha de vencimiento Código de barras Reserva de ítems
Tesis Tesis Biblioteca Yachay Tech ECMC0137 (Navegar estantería(Abre debajo)) 1 No para préstamo T000576
Total de reservas: 0

Trabajo de integración curricular (Tecnologías de la Información). Universidad de Investigación de Tecnología Experimental Yachay. Urcuquí, 2023

Incluye referencias bibliográficas (páginas 49-59)

Trabajo de integración curricular con acceso abierto

Texto (Hypertexto links)

Twitter es una red social muy amplia que permite a las personas comunicarse entre sí y expresar sus ideas gracias a su enfoque corto y rápido en las publicaciones. Desafortunadamente, no está exenta de asuntos ilícitos que ocurren en la plataforma. Un problema que surge en las redes sociales en general es cómo se utilizan para promover y difundir servicios ilegales, como la trata de personas, la prostitución, las drogas ilegales, entre otros, gracias al alcance de esas plataformas. Por lo tanto, es importante identificar esta clase de mensajes para detectar actividades ilegales y actuar al respecto. En este trabajo, se presenta y desarrolla un marco para dicha detección utilizando 4 modelos basados en Transformers, la arquitectura más potente actualmente para trabajar en procesamiento del lenguaje natural. Para alimentar y entrenar a los modelos, se seleccionó y etiquetó un dataset de tweets para identificar cuáles contienen ofertas o contenido ilícito en su texto. Dos modelos no basados en Transformers también fueron usados para propósitos de comparación. Los experimentos mostraron que los modelos basados en Transformers son bastante buenos para adaptarse a las particularidades del idioma español y a la estructura que suelen tener los tweets, siendo los modelos BERTweet y DistilBERT los mejores. Además, se observó que los modelos basados en Transformers se pueden adaptar a datasets que no tengan un desbalance fuerte (para este trabajo, una proporción de casi 2:1) y no son afectados cuando se usan datos sintéticos.

Textos en inglés con resúmenes en español e inglés

No hay comentarios en este titulo.

para colocar un comentario.

Ayuda

X

Correo: bibliotecayachaytech@yachaytech.edu.ec
Teléfono:+593 6299 9500 Ext. 2517

Horario de atención:

X

BIBLIOTECA UNIVERSIDAD YACHAY TECH

  • Área: Fondo Impreso
    Lunes a Viernes de 08h00 a 20h30
    Sábado de 08h00 a 16h30
  • Área: Ingenio
    Abierto 24 horas 7 días
  • Área: Bloque de Servicios, 2do. Piso
    Espacios de Estudio Grupal e Individual, abierto 24 horas 7 días

Recuerda que los espacios son compartidos por toda la comunidad, por lo que debes hacer un uso adecuado
del tiempo que los ocupes, mantenerlos limpios y evitar el daño a las instalaciones y bienes materiales.

También puedes usar nuestros canales de comunicación:

Correo: bibliotecayachaytech@yachaytech.edu.ec
Teléfono: +593 6299 9500 Ext. 2517
Ubicación: San Miguel de Urcuquí, Hacienda San José s/n y Proyecto Yachay

Video

X