Predicción de la Energía Eólica
Iberdrola, líder global en energía eólica, enfrenta el desafío crítico de predecir con exactitud la energía que sus parques eólicos dispersos por Europa y Estados Unidos generarán. En un sector donde la competitividad es clave, anticipar la producción energética es esencial para triunfar en las subastas de energía, asegurando márgenes de beneficio atractivos y optimizando tanto la operación como el mantenimiento de cada parque. El reto es monumental, dado el tamaño de los datos a procesar, incluyendo complejas mallas meteorológicas tridimensionales de institutos meteorológicos globales, como GFS, ECMWF y WRF, sumando varios terabytes de datos y requiriendo una infraestructura on-premise de última generación para distribuir la computación.
WhiteBox ha liderado el desarrollo de una solución innovadora, comenzando con un procesamiento avanzado de los extensos volúmenes de datos meteorológicos mediante Spark en su modalidad más rápida y eficaz (Scala). Tras un meticuloso proceso de selección de características, se implementó un conjunto de modelos de Gradient Boosting, personalizados para cada parque eólico con el apoyo de librerías open source como scikit-learn y LightGBM, aprovechando la distribución de los algoritmos con Spark y la orquestación mediante Apache Airflow. Además, se experimentó con modelos basados en redes neuronales convolucionales, tratando las mallas tridimensionales como imágenes, y obteniendo resultados alentadores.
Este proyecto ha marcado un antes y un después para Iberdrola, permitiéndole pasar de métodos predictivos tradicionales a un avanzado sistema de Machine Learning que aprovecha terabytes de datos meteorológicos y registros históricos para generar modelos de predicción altamente precisos. Esta innovación ha permitido a Iberdrola participar en el mercado energético con una confianza renovada, anticipando con precisión su capacidad de producción eólica y mejorando así la fiabilidad y la rentabilidad de sus operaciones.
- Parques Eólicos: 13 ubicaciones distintas.
- Datos Procesados: Más de 50 TB de información meteorológica.
- Capacidad de Procesamiento: Entrenamiento e inferencia en un clúster Hadoop de 25 nodos.
- Energía Gestionada: Más de 1 GW en total.