La desinformación es un problema grave en la actualidad que está aumentando a un ritmo vertiginoso con el crecimiento de la información en la web (Rubin, 2019). Aunque en español se utiliza únicamente el término desinformación, en inglés se distinguen como misinformation y disinformation. Ambos aluden a la inexactitud y falta de veracidad de cierta información. Sin embargo, misinformation se relaciona con un engaño que puede ser causado de manera no intencional principalmente por ignorancia (Wardle y Derakhshan, 2017), mientras que disinformation se refiere a información que se proporciona deliberadamente de manera incompleta o inexacta para inducir a error (Tudjmanand y Mikelic Preradovic, 2003). En el dominio de las noticias digitales, este fenómeno puede llevar a una confusión masiva sobre los hechos reales, que puede propagarse rápidamente (B. Huang y Carley, 2020).
La hipótesis principal de este proyecto se basa en la existencia de una relación directa entre el uso del lenguaje humano (es decir, modelos de lenguaje) y el comportamiento del usuario en los medios digitales. Por tanto, modelando el lenguaje utilizado dentro de una contextualización en diferentes niveles lingüísticos, podemos establecer la relación entre diferentes entidades, así como la evolución de estas entidades y sus relaciones a lo largo del tiempo. Simultáneamente, puede ser posible inferir nuevas relaciones y predecir estados o comportamientos futuros. La evolución de las entidades a lo largo del tiempo requiere la investigación de modelos de lenguaje de entidades, así como la representación del conocimiento basada en entidades digitales. Esta propuesta de investigación está orientada al tratamiento de la desinformación en términos de parámetros de calidad y/o mejora. Proponemos un proyecto para investigar e innovar en Tecnologías del Lenguaje Natural para hacer frente a la desinformación, el proyecto NL4DISMIS.