Lingüística
Investigadores del grupo SINAI (Sistemas Inteligentes de Acceso a la Información) de la Universidad de Jaén (UJA) y de la Universidad de Alicante han creado una App para que la gente escriba insultos y realizar un listado de palabras malsonantes y así poder localizarlas luego en la red.
La aplicación, un 'bot' llamado FIERO, guarda los insultos y los almacena para crear uno de los recursos lingüísticos más usados en Tecnologías del Lenguaje Humano (TLH): los lexicones o listados de palabras.
Este 'diccionario de insultos' ayudará a entrar mediante algoritmos de aprendizaje automático sistemas de ordenadores basados en Tecnologías el Lenguaje Humano y dar solución a diversos problemas sociales con presencia en las redes. Entre ellos, la localización de 'fake news', ciberacoso, uso del discurso de odio en redes e incluso la detección de problemas de salud mental como trastornos alimenticios, depresión o suicidio.
"Para desarrollar estos sistemas es fundamental e imprescindible contar con recursos lingüísticos que permitan entrenar a los sistemas de aprendizaje automático, concretamente, para los sistemas de detección automática de lenguaje ofensivo, es muy interesante contar con distintos diccionarios y lexicones de insultos, palabras malsonantes", informan a los medios desde el grupo SINAI.
Cómo funciona
La aplicación está dentro de la investigación LIVING-LANG del grupo de investigación de la Universidad de Jaén dedicado a desarrollar diferentes modelos del lenguaje.
Ante la complicada situación de recopilar insultos, los investigadores del proyecto LIVING-LANG, han pedido la colaboración de la ciudadanía para poner sus insultos en FIERO, ejecutada dentro de la aplicación de Telegram disponible en Android e iOS.
La aplicación contesta de forma humorística con el objetivo de conseguir más improperios por parte del usuario. "El sistema va almacenando todos estos insultos que posteriormente serán procesados para ser incluidos en un recurso léxico que será puesto a disposición de la comunidad científica y que servirá además para entrenar a los sistemas de aprendizaje automático que se están desarrollando", han explicado los investigadores.