Control Inteligente de Voltaje: IA Gestiona Redes con Energía Solar y Vehículos Eléctricos
La integración masiva de energías renovables y vehículos eléctricos (VE) en las redes eléctricas de distribución representa uno de los desafíos más significativos y urgentes en la transición energética global. Mientras que la energía solar fotovoltaica (FV) y los vehículos eléctricos ofrecen una vía clara hacia la descarbonización del sector del transporte y la generación de electricidad, su adopción acelerada introduce complejidades operativas sin precedentes. La naturaleza intermitente de la generación solar, que alcanza su pico durante las horas centrales del día, y los patrones de carga de los vehículos eléctricos, que tienden a concentrarse en las tardes y noches, generan fluctuaciones extremas en la demanda y la oferta de electricidad. Estas fluctuaciones pueden provocar desviaciones de voltaje significativas, tanto sobretensiones como subtensiones, que amenazan la estabilidad, la seguridad y la calidad del suministro eléctrico. Las redes eléctricas tradicionales, diseñadas para un flujo unidireccional de energía desde grandes centrales hasta consumidores pasivos, no están equipadas para manejar esta bidireccionalidad dinámica. En este contexto, la innovación tecnológica no es solo deseable, sino esencial para garantizar un sistema energético resiliente y sostenible. Un equipo de investigadores de la Universidad de Shandong ha presentado una solución revolucionaria en la revista Power System Protection and Control, basada en una estrategia de aprendizaje por refuerzo profundo (deep reinforcement learning, DRL) jerárquico y multi-escala. Este enfoque de inteligencia artificial (IA) coordinado en tiempo real una variedad de recursos controlables, desde inversores solares hasta el comportamiento de carga de miles de vehículos eléctricos, para estabilizar de manera eficiente y fiable la calidad del voltaje en la red.
El estudio, liderado por QI Xianglong, CHEN Jian, ZHAO Haoran, ZHANG Wen y ZHANG Keyu del Laboratorio Clave de Despacho y Control Inteligente del Sistema Eléctrico de la Universidad de Shandong, marca un cambio de paradigma en la gestión de redes eléctricas. En lugar de depender de métodos de control tradicionales, que a menudo requieren modelos matemáticos precisos del sistema y condiciones de comunicación perfectas, los investigadores han desarrollado un sistema impulsado por datos. Su estrategia aborda el núcleo del problema: la diferente velocidad de respuesta de los diversos recursos de control disponibles. Dispositivos como los compensadores de var estáticos (SVC) o los inversores fotovoltaicos pueden ajustar su salida de potencia reactiva en cuestión de segundos o minutos, lo que los hace ideales para la regulación fina. Por el contrario, influir en el comportamiento de carga de los propietarios de vehículos eléctricos es un proceso mucho más lento, que se mide en horas, ya que depende de decisiones humanas. Intentar controlar todos estos recursos con una única estrategia unificada sería ineficiente y podría generar señales de control contradictorias.
Para resolver este dilema, los investigadores han diseñado una arquitectura de control jerárquica de dos niveles, que separa deliberadamente las tareas de control según su horizonte temporal y velocidad de respuesta. El nivel inferior, que opera en una escala de tiempo corta de 15 minutos, se encarga del control físico directo y de precisión. Controla la potencia reactiva de los inversores FV y de las instalaciones SVC. Estos dispositivos pueden generar o absorber potencia reactiva, lo cual es crucial para corregir problemas de voltaje local sin afectar la potencia activa transmitida. Este nivel utiliza un enfoque de múltiples agentes (Multi-Agent DRL, MADRL), donde cada inversor y cada instalación SVC tiene su propio agente inteligente. Estos agentes son entrenados de forma centralizada, lo que les permite aprender de las interacciones de toda la red y actuar de manera cooperativa. Sin embargo, en la operación práctica, actúan de forma descentralizada, basándose únicamente en mediciones locales en su punto de conexión a la red. Este concepto de «entrenamiento centralizado con ejecución descentralizada» (CTDE) es una ventaja clave, ya que aumenta la robustez del sistema. Incluso si falla la comunicación entre los diferentes dispositivos, los agentes locales pueden seguir cumpliendo sus tareas de control de forma autónoma y eficaz, lo que fortalece la resiliencia de toda la red.
El nivel superior de la arquitectura actúa en una escala de tiempo más larga, con intervalos de decisión de una hora. Su elemento de control principal no es un dispositivo físico, sino una señal económica: el precio de la electricidad en tiempo real. En lugar de controlar directamente la potencia de carga de los vehículos eléctricos, este nivel influye indirectamente en el comportamiento de los usuarios mediante la fijación dinámica de precios. Al ajustar el precio de la electricidad en tiempo real, el sistema crea incentivos financieros para que los usuarios trasladen sus sesiones de carga a momentos que sean beneficiosos para la red. Por ejemplo, si una alta producción solar al mediodía provoca una sobretensión, el precio puede reducirse para animar a los propietarios de vehículos eléctricos a cargar sus vehículos en ese momento, consumiendo así el exceso de energía verde. Por el contrario, el precio puede aumentarse por la tarde, cuando la producción solar disminuye y la demanda general de electricidad aumenta, para evitar una carga adicional causada por muchos vehículos eléctricos cargando simultáneamente. Este nivel trata la potencia de carga agregada de los vehículos eléctricos como un recurso de respuesta lenta y de gran escala que puede ser gestionado mediante incentivos económicos.
Un factor crítico de éxito de esta estrategia es la modelización precisa del comportamiento humano. La eficacia del nivel superior depende de la capacidad de predecir con precisión cómo responderán los usuarios a los cambios de precios. Los investigadores han desarrollado un modelo probabilístico detallado que tiene en cuenta los diferentes patrones de desplazamiento y estacionamiento de los propietarios de vehículos eléctricos. Han clasificado a los usuarios según su propósito principal de viaje: desplazarse al trabajo, regresar a casa o actividades de ocio, ya que cada uno tiene horarios de llegada y salida característicos en las estaciones de carga. Estos patrones se han modelado con distribuciones estadísticas (distribuciones normales). Además, el modelo considera el estado de carga actual (State of Charge, SOC) de la batería del vehículo y el alcance deseado al salir del punto de carga. Combinando estos factores, el modelo puede predecir las «ventanas de carga» de cada usuario. Calcula luego el incentivo financiero (la diferencia entre el costo de cargar al precio actual y el costo de un momento potencialmente más barato) y deriva de ello la probabilidad de que un usuario cambie su comportamiento de carga. Esto permite al nivel de control superior hacer predicciones fundamentadas sobre el impacto agregado de sus decisiones de precios.
Para evaluar la eficacia de su estrategia DRL jerárquica, los investigadores realizaron simulaciones extensas en una red de 33 nodos IEEE modificada, un modelo estándar en la investigación de redes eléctricas. La red de prueba incluía tres plantas FV de 1,5 megavatios, tres instalaciones SVC, bancos de condensadores conmutables (SC) y tres estaciones de carga, cada una sirviendo a 700 vehículos eléctricos. Para una simulación realista, se utilizaron datos reales de generación FV y carga de Bélgica. Los resultados fueron convincentes: la estrategia propuesta mantuvo el voltaje en todos los puntos de la red dentro del rango de operación seguro de 0,93 a 1,07 p.u. (por unidad), evitando así de forma eficaz tanto sobretensiones como subtensiones.
Para una evaluación objetiva, la nueva estrategia se comparó con varios escenarios de referencia. Un escenario básico que solo utilizaba los dispositivos rápidos (FV y SVC), sin influir en los vehículos eléctricos mediante incentivos de precios, provocó fluctuaciones de voltaje significativas, especialmente durante los picos de carga vespertinos. Un escenario con un precio de tiempo de uso (Time-of-Use) fijo establecido el día anterior mejoró la situación, pero no pudo compensar las fluctuaciones dinámicas del día. Otro escenario que intentaba controlar todos los dispositivos en la misma escala de tiempo horaria mostró un rendimiento deficiente, lo que subraya la necesidad de la separación basada en escalas de tiempo. Incluso un algoritmo de optimización establecido, el Particle Swarm Optimization (PSO), fue superado por la estrategia DRL.
La estrategia DRL jerárquica logró la menor desviación media de voltaje. En comparación con el escenario básico, la redujo en un 38%, y en comparación con las otras estrategias avanzadas, entre un 16% y un 18%. Esta mejora en el rendimiento significa una mejora significativa en la calidad, fiabilidad y eficiencia de la red. Las implicaciones de esta investigación son amplias. Para los operadores de red, ofrece una herramienta potente para gestionar la creciente penetración de energías renovables y vehículos eléctricos sin depender de costosas y largas ampliaciones de la infraestructura. Puede posponer o incluso evitar inversiones en nuevos transformadores o líneas eléctricas. Para los consumidores, abre la posibilidad de participar activamente en el mercado energético y reducir sus facturas de electricidad mediante una carga inteligente, al tiempo que contribuyen a la estabilidad de la red. Para los responsables políticos, proporciona una base tecnológica concreta para alcanzar objetivos climáticos ambiciosos con un alto grado de seguridad de suministro.
Este trabajo marca un avance significativo en la aplicación de la inteligencia artificial a infraestructuras críticas. A diferencia de muchos sistemas de IA que son «cajas negras», la estructura jerárquica de este controlador ofrece un cierto grado de interpretabilidad. Los ingenieros pueden entender cómo se separan las responsabilidades entre los incentivos económicos a largo plazo (nivel superior) y el control físico a corto plazo (nivel inferior). El uso del marco CTDE garantiza una robustez inherente frente a fallos de comunicación. Otra ventaja clave es que la estrategia es «libre de modelo». No requiere un modelo matemático perfecto y actualizado constantemente de toda la red eléctrica, lo cual es un desafío enorme, ya que la topología de la red cambia constantemente. En su lugar, el sistema aprende la estrategia de control óptima directamente de los datos, lo que lo hace extremadamente adaptable a condiciones cambiantes.
Las posibilidades de aplicación de esta tecnología van más allá del control de voltaje. El mismo marco DRL jerárquico podría aplicarse a otros desafíos de gestión de redes, como el control de frecuencia, la gestión de congestión o la optimización de la carga de una flota de vehículos eléctricos para un servicio de transporte compartido. También podría integrarse en controladores de microrredes para gestionar comunidades energéticas locales con un alto grado de autoconsumo. A medida que el mundo energético continúa evolucionando, la capacidad de tomar decisiones inteligentes en tiempo real a través de múltiples escalas de tiempo será fundamental. La investigación de QI Xianglong y sus colegas en la Universidad de Shandong proporciona un plan robusto y escalable para las redes eléctricas inteligentes, que se auto-optimizan en el futuro.
Este estudio es un ejemplo impresionante de investigación interdisciplinaria que combina un profundo conocimiento de la ingeniería de redes eléctricas con los últimos avances en inteligencia artificial. Va más allá de una exploración teórica y presenta una solución práctica y validada para uno de los desafíos más urgentes del sector energético moderno. Al aprovechar el poder de la IA para orquestar la compleja danza de electrones en una red de paneles solares, vehículos eléctricos y consumidores tradicionales, este trabajo allana el camino hacia un sistema energético más sostenible, resiliente y centrado en el consumidor. El futuro de la red inteligente no es solo una red conectada; es inteligente, adaptativa y aprende de cada interacción.
QI Xianglong, CHEN Jian, ZHAO Haoran, ZHANG Wen, ZHANG Keyu, Key Laboratory of Power System Intelligent Dispatch and Control, Shandong University. Power System Protection and Control, DOI: 10.19783/j.cnki.pspc.240122