

Autoría: José Manuel Carbó, Claudia Toledo y Ángel Iván Moreno
Publica: Banco de España
Fecha: 30 de junio de 2025
Los diccionarios de sentimiento son una herramienta fundamental en el análisis automatizado de textos. Mientras que en inglés existen múltiples opciones para analizar textos económicos y financieros, en español las alternativas son más escasas. Dos de las más destacadas son los diccionarios desarrollados por el Banco de España y el Banco Central de Chile, diseñados para medir el sentimiento en los informes de estabilidad financiera. Este documento detalla el proceso para la obtención de un primer diccionario de consenso panhispánico, combinando ambos enfoques, que pueda ser utilizado en distintos países de habla hispana. Los resultados muestran que el diccionario resultante de la unión de ambos (diccionario «Unión») es una herramienta eficaz y equilibrada, capaz de captar el sentimiento de los textos en ambos países. Para validar su robustez, demostramos que el Unión es resistente a la eliminación de términos y que sus resultados son similares a los obtenidos con los modelos de lenguaje avanzado (LLM, por sus siglas en inglés). En general, mostramos que los diccionarios, y particularmente el mencionado diccionario Unión, pueden obtener resultados parecidos a los de los LLM en términos de sentimiento en los textos de estabilidad financiera, debido a la naturaleza estructurada y específica de estos documentos.