Micro-database for sustainability (ESG) indicators developed at the Banco de España (2022)

Micro-database for sustainability (ESG) indicators developed at the Banco de España (2022)

Serie: Notas Estadísticas. 17.

Autor: Borja Fernández-Rosillo San Isidro, Eugenia Koblents Lapteva y Alejandro Morales Fernández.

Documento completo

PDF
Micro-database for sustainability (ESG) indicators developed at the Banco de España (2022) (4 MB)

Resumen

En los últimos años, la preocupación por los temas sociales y medioambientales ha ido en aumento y, en consecuencia, la demanda de datos sobre sostenibilidad se ha incrementado exponencialmente. Por esta razón, se ha desarrollado en el Departamento de Estadística del Banco de España una base de microdatos sobre indicadores de sostenibilidad (ESG).

Este documento presenta dos artículos que analizan el proceso desarrollado para capturar esta información, así como las numerosas limitaciones y dificultades encontradas a lo largo del camino de búsqueda de microdatos sobre sostenibilidad. Concretamente, los dos temas que tratan los artículos son:

  1. “Analysing climate change data gaps” (presentado en la 11th Biennial IFC (Irving Fisher Committee) Conference on “Post-pandemic landscape for central bank statistics” durante los días 25-27 de agosto de 2022 en la sesión 3.B “Environmental statistics”)
  2. “Creation of a structured sustainability database from company reports: A web application prototype for information retrieval and storage” (presentado en el IFC Bank of Italy workshop on “Data science in central banking” los días 14-17 de febrero
    de 2022 en la sesión 4.3 “Text Mining and ML utilized in Economic Research”) (Koblents and Morales (2022))

El primer artículo se centra en las numerosas limitaciones encontradas y logros conseguidos en el proceso de desarrollo de la base de microdatos sobre indicadores de sostenibilidad para sociedades no financieras. Tras analizar detalladamente los estándares actuales de información ESG, consultar a expertos en la materia, analizar las obligaciones regulatorias y llevar a cabo un ejercicio práctico de búsqueda de esta información, se seleccionó una lista de los 39 indicadores más relevantes para comenzar la búsqueda. Actualmente se han recopilado más de 15.000 datos correspondientes al período 2019-2020 utilizando una herramienta semiautomática de búsqueda de información desarrollada internamente (presentado en detalle en el segundo artículo). Durante el proyecto se identificaron numerosas dificultades tales como el uso de diferentes métricas al reportar los indicadores, falta de información y de soporte digital para la descarga, así como dificultades de comparabilidad y restricciones regulatorias.

El segundo artículo se centra en la herramienta desarrollada para crear la base de microdatos presentada en el primer artículo. Esta aplicación web tiene como objetivo, mediante la extracción y almacenamiento semiautomático, obtener los indicadores de sostenibilidad de los estados no financieros anuales presentados por las sociedades no financieras españolas. El objetivo de la aplicación es facilitar a los usuarios el trabajo de búsqueda de indicadores de sostenibilidad en múltiples documentos y su almacenamiento en una base de datos estructurada. La herramienta desarrollada incorpora un conjunto de términos de búsqueda predefinidos para cada indicador que han sido seleccionados en base a conocimiento experto e inteligencia artificial en desarrollos posteriores. Para cada empresa e indicador, la herramienta sugiere los fragmentos de texto más relevantes al usuario, quien a su vez identifica el valor correcto del indicador y lo almacena en la base de datos utilizando la interfaz web de usuario. Esta herramienta ha sido creada por dos científicos de datos en tres meses, con el apoyo continuo de un equipo de expertos que ha contribuido a la definición de requisitos y propuestas de mejora, la recopilación de datos, así como la validación y prueba de la herramienta. A lo largo del artículo, se realiza una descripción del enfoque técnico y los principales módulos del prototipo implementado, incluyendo la extracción de texto, indexación y búsqueda, almacenamiento de datos y visualización.

Anterior Business Sector Classificat... Siguiente Notas estadísticas relativa...