La hipótesis principal de este proyecto se basa en la existencia de una relación directa entre el uso del lenguaje humano (es decir, modelos de lenguaje) y el comportamiento del usuario en los medios digitales. Por tanto, modelando el lenguaje utilizado dentro de una contextualización en diferentes niveles lingüísticos, podemos establecer la relación entre diferentes entidades, así como la evolución de estas entidades y sus relaciones a lo largo del tiempo. Simultáneamente, puede ser posible inferir nuevas relaciones y predecir estados o comportamientos futuros.
La evolución de las entidades a lo largo del tiempo requiere la investigación de modelos de lenguaje de entidades, así como la representación del conocimiento basada en entidades digitales. Esta propuesta de investigación está orientada al tratamiento de la desinformación en términos de parámetros de calidad y/o mejora.
El objetivo principal del proyecto es utilizar tecnologías de lenguaje natural para tratar la desinformación. Para hacer esto, detectaremos la información errónea y la desacreditaremos automáticamente a través de la generación de lenguaje natural y el completamiento con información veraz. Se proponen los siguientes objetivos específicos:
O1 Obtener un modelo de lenguaje genérico a través de redes neuronales, a partir de los modelos de lenguaje de los proyectos MarIA, LEIA, Nós, AINA y C4 Dataset para español, catalán, gallego e inglés.
O2 Adaptar y crear modelos de lenguaje sin sesgos.
O3 Obtener un modelo lingüístico multilingüe para castellano, catalán, gallego e inglés.
O4 Identificar y desarrollar entidades digitales.
O5 Obtener representación del conocimiento a través de entidades digitales.
O6 Investigar y aplicar el descubrimiento y enriquecimiento de entidades digitales y sus atributos.
O7 Obtener un modelo de lenguaje aumentado por el conocimiento (modelo de lenguaje consciente de la entidad digital).
O8 Desarrollar técnicas de tratamiento de noticias falsas.
O9 Descubrir omisiones para el análisis de textos que son económicos con la verdad.
O10 Desarrollar un sistema de generación de lenguaje para refutación.
O11 Desarrollar un sistema de descubrimiento y generación de lenguaje para proporcionar las omisiones de textos que son económicos con la verdad.
O12 Promocionar y difundir las líneas de investigación del proyecto a través de la participación y organización de actividades en congresos, talleres, seminarios y redes temáticas de investigación, así como el aprovechamiento de la transferencia de tecnología en beneficio de la sociedad.