Estrategia de precios para carga de vehículos eléctricos impulsa ciudades inteligentes

Estrategia de precios para carga de vehículos eléctricos impulsa ciudades inteligentes

En la búsqueda global por ciudades más sostenibles, una investigación pionera ha revelado un nuevo enfoque para la carga de vehículos eléctricos (VE) que podría transformar la forma en que se gestionan los sistemas energéticos y de transporte urbanos. El estudio, liderado por Lu Siyue y un equipo de ingenieros de State Grid Beijing Electric Power Company, presenta un modelo innovador de fijación de precios diseñado para armonizar la integración de energías renovables con el flujo de tráfico urbano. Publicado en la edición de septiembre de 2024 de Computer Applications and Software, este trabajo introduce un marco de optimización de dos niveles que no solo minimiza los costos sociales totales, sino que también mejora la estabilidad de la red eléctrica y reduce la congestión en las áreas metropolitanas.

La investigación aborda uno de los desafíos más urgentes en la planificación urbana moderna: la creciente interdependencia entre las redes de distribución eléctrica (DN) y las redes de transporte urbano (UTN). A medida que aumenta la adopción de vehículos eléctricos, un comportamiento de carga descoordinado puede provocar sobrecargas locales en la red, un uso ineficiente de los recursos renovables y un aumento de la congestión en las estaciones de carga. Los modelos de precios tradicionales a menudo no tienen en cuenta estas interacciones sistémicas, centrándose en aspectos aislados como las tarifas por hora o las tarifas fijas por ubicación. Sin embargo, el equipo de Lu Siyue reconoció la necesidad de un enfoque más holístico, uno que considere tanto la naturaleza dinámica de la generación eólica como los patrones estocásticos de la demanda de viajes.

En el corazón de su metodología se encuentra un modelo de optimización de dos niveles. El nivel superior se centra en determinar las tarifas óptimas de servicio de carga (CSF) dentro de una red de distribución que incorpora energía eólica. Este nivel se formula como un problema de programación de cono de segundo orden (SOCP), lo que permite una modelización precisa de las restricciones eléctricas al tiempo que tiene en cuenta la incertidumbre inherente en la producción eólica. Al tratar las CSF como una variable de decisión, el modelo permite a los operadores de la red influir en el comportamiento de carga de los vehículos eléctricos en tiempo real, desviando la carga de los períodos de baja disponibilidad renovable o de alta tensión en la red.

El nivel inferior del modelo simula el comportamiento del usuario a través de un problema de asignación de tráfico basado en el principio de equilibrio del usuario (UE). A diferencia de los modelos tradicionales que asumen patrones de viaje deterministas, este marco incorpora aleatoriedad en los flujos de tráfico de origen-destino (OD), reflejando la naturaleza impredecible de los desplazamientos diarios y las tareas. Se asume que los conductores toman decisiones racionales, eligiendo rutas y paradas de carga que minimicen sus costos individuales, incluyendo el tiempo de viaje, el tiempo de espera y los gastos de electricidad. La interacción entre estos dos niveles crea un bucle de retroalimentación en el que las señales de precios moldean los patrones de tráfico, lo que a su vez afecta la demanda de energía y las condiciones de la red.

Lo que distingue a esta investigación es su integración del aprendizaje por refuerzo profundo (DRL) para resolver el problema estocástico de dos niveles resultante. Las técnicas de optimización convencionales tienen dificultades con sistemas tan complejos y acoplados, especialmente cuando hay incertidumbre. Sin embargo, el DRL ofrece una alternativa potente al aprovechar redes neuronales para aproximar políticas óptimas mediante prueba y error. El equipo implementó algoritmos de entrenamiento basados en gradientes y sin gradientes, comparando su rendimiento en términos de velocidad de convergencia y calidad de la solución. Destacablemente, la estrategia genética profunda sin gradientes (DGP) demostró un rendimiento superior, alcanzando resultados más cercanos al óptimo teórico que su contraparte basada en gradientes, el gradiente determinista profundo (DDPG).

Las implicaciones prácticas de este trabajo son significativas. En un sistema de prueba de cinco nodos, la aplicación de las CSF optimizadas redujo el costo social promedio en un 14,9%, de 10.022,6 yuanes a 8.543,2 yuanes. Más importante aún, la utilización de la energía eólica mejoró dramáticamente, con las tasas de desviación disminuyendo del 31,1% al 4,8%. Esto significa que casi toda la energía eólica disponible se integró con éxito en la red, reduciendo el desperdicio y mejorando la sostenibilidad. El flujo de tráfico también se volvió más equilibrado en toda la red, aliviando los cuellos de botella en los corredores más transitados y aumentando la capacidad de las rutas subutilizadas. Aunque los costos individuales de los conductores aumentaron ligeramente, de 1,43 yuanes a 1,45 yuanes por viaje, el beneficio social general fue sustancial, demostrando que pequeños compromisos a nivel individual pueden generar grandes ganancias colectivas.

Para validar la escalabilidad, los investigadores aplicaron su marco a un escenario urbano real que involucra 39 nodos y 10 estaciones de carga para vehículos eléctricos. La red a escala de la ciudad incluía diversos tipos de carreteras, desde vías periféricas hasta arterias urbanas, y era alimentada por una red de distribución con ocho generadores distribuidos y tres parques eólicos. Bajo una demanda OD incierta y una producción eólica fluctuante, la estrategia de precios impulsada por DRL logró una reducción del 2,05% en el costo total del sistema, reduciéndolo de 35.158,0 yuanes a 34.436,9 yuanes. Las tasas de consumo de energía eólica aumentaron significativamente en nodos clave: del 21,3% al 62,6% en el nodo 15 y del 31,6% al 95,3% en el nodo 33. Estas mejoras fueron acompañadas por reducciones medibles en la congestión del tráfico, particularmente en enlaces de alta capacidad que anteriormente se acercaban a la saturación.

Uno de los aspectos más convincentes del estudio es su énfasis en el rendimiento fuera de la muestra. Las condiciones del mundo real rara vez coinciden perfectamente con los datos históricos, por lo que cualquier estrategia de precios debe ser robusta ante variaciones imprevistas. El equipo probó su modelo bajo distribuciones de probabilidad alteradas tanto para la demanda de tráfico como para la generación eólica, simulando escenarios en los que los volúmenes promedio de OD pasaron de 1.000 a 1.100 vehículos y la producción eólica disminuyó de 10 MW a 8 MW. A pesar de estos cambios, el sistema mantuvo un buen rendimiento, indicando que la política aprendida generaliza bien más allá del entorno de entrenamiento. Esta resiliencia es crucial para la implementación en el mundo real, donde los patrones meteorológicos y los comportamientos de viaje son inherentemente volátiles.

La investigación también destaca las limitaciones de los métodos sin aprendizaje por refuerzo profundo en aplicaciones a gran escala. En comparación con un algoritmo de iteración Q ajustada (FQI) con un espacio de acción discretizado, el enfoque DRL superó significativamente. Mientras que FQI logró converger para algunas estaciones de carga, no pudo identificar niveles óptimos de precios en toda la red, logrando finalmente solo una reducción de costos del 0,20%, menos de una décima parte de lo logrado por el método DRL. Este contraste tan marcado subraya la importancia de los espacios de acción continuos y las representaciones de estado de alta dimensión para gestionar sistemas complejos e interconectados.

Desde una perspectiva política, los hallazgos sugieren que la coordinación centralizada entre los operadores de servicios públicos y las autoridades de transporte puede desbloquear eficiencias sustanciales. En muchas ciudades, estos dominios operan de forma independiente, lo que lleva a resultados subóptimos. Por ejemplo, una empresa de servicios públicos podría ofrecer precios más bajos de electricidad durante las horas de poca demanda sin considerar si los conductores están dispuestos o pueden cargar en ese momento. De manera similar, los planificadores de tráfico podrían ampliar la capacidad de las carreteras sin tener en cuenta la distribución espacial de la infraestructura de carga. El marco propuesto cierra esta brecha al permitir la optimización conjunta de los recursos energéticos y de movilidad.

Además, el modelo apoya un cambio de una gestión reactiva a una proactiva. En lugar de esperar a que ocurra la congestión o la inestabilidad de la red, los operadores pueden anticipar problemas y ajustar las señales de precios en consecuencia. Por ejemplo, si un pronóstico predice una alta generación eólica durante la tarde, las CSF pueden reducirse en las estaciones de carga cercanas para incentivar a los propietarios de vehículos eléctricos a cargar durante esa ventana. Por el contrario, si los sensores de tráfico detectan un aumento de la congestión cerca de una estación de carga popular, las tarifas pueden aumentar temporalmente para desviar a los conductores hacia alternativas menos concurridas. Esta capacidad de respuesta dinámica mejora la flexibilidad del sistema y mejora la experiencia del usuario.

El papel de la inteligencia artificial en esta transformación no puede subestimarse. Mientras que intentos anteriores de carga inteligente dependían de sistemas basados en reglas o rutinas de optimización simples, la integración del aprendizaje profundo permite una toma de decisiones adaptativa y basada en datos. La red neuronal aprende relaciones complejas entre variables, como cómo un aumento del 10% en la generación eólica afecta el precio óptimo en diferentes ubicaciones, y aplica este conocimiento en tiempo real. A lo largo de iteraciones sucesivas, la política se vuelve cada vez más refinada, aproximándose a un rendimiento casi óptimo incluso en entornos altamente estocásticos.

Otra ventaja del enfoque DRL es su capacidad para manejar la observabilidad parcial. En la práctica, los operadores no tienen información perfecta sobre el estado de carga de cada vehículo, su destino o su ruta preferida. El modelo tiene en cuenta esta incertidumbre tratando los datos observados, como el flujo de tráfico agregado y la velocidad del viento, como estadísticas suficientes para tomar decisiones. A través de la interacción repetida con el entorno, el agente aprende a inferir estados ocultos y actuar en consecuencia, de manera similar a como lo haría un despachador humano.

Las implicaciones se extienden más allá de la carga de vehículos eléctricos. El mismo marco podría aplicarse a otros sistemas de infraestructura compartida, como el transporte público, el uso compartido de bicicletas o los servicios de micromovilidad. Al tratar los precios como una variable de control y utilizar el aprendizaje automático para optimizarlos, las ciudades pueden lograr una mejor asignación de recursos, reducir su impacto ambiental y mejorar la calidad de vida. A medida que las poblaciones urbanas continúan creciendo, tales herramientas se volverán esenciales para mantener la habitabilidad y la sostenibilidad.

Crucialmente, el estudio se adhiere a principios de transparencia y reproducibilidad. Todas las simulaciones se realizaron utilizando solucionadores de código abierto (Mosek y Baron) dentro de un entorno Python, y el marco DRL se construyó utilizando PyTorch, una biblioteca de aprendizaje profundo ampliamente adoptada. La inclusión de comparaciones de referencia, contra tanto la programación estocástica basada en escenarios como los métodos de RL sin profundidad, garantiza que las afirmaciones sobre el rendimiento estén rigurosamente sustentadas. Además, el uso de topologías de red del mundo real y valores de parámetros realistas mejora la validez externa, haciendo que los resultados sean más aplicables a entornos urbanos reales.

Las consideraciones éticas también se abordan implícitamente a través del enfoque en la minimización del costo social. En lugar de maximizar las ganancias para los operadores de estaciones de carga o minimizar los costos para usuarios individuales, la función objetivo prioriza el bienestar colectivo. Esto se alinea con la misión de servicio público de las empresas de servicios públicos y los gobiernos municipales, asegurando que los avances tecnológicos sirvan a la comunidad en general. Además, el ligero aumento en los costos individuales observado en el sistema de cinco nodos sugiere que se equilibraron las preocupaciones de equidad con las ganancias de eficiencia, evitando escenarios en los que solo un subconjunto de usuarios soporta la carga de la optimización del sistema.

En conclusión, el trabajo de Lu Siyue y sus colegas representa un paso significativo hacia adelante en la integración de los sistemas energéticos y de transporte. Al combinar una modelización matemática rigurosa con técnicas de vanguardia de aprendizaje automático, han desarrollado una estrategia de precios que es técnicamente sólida y prácticamente viable. Los resultados demuestran beneficios claros en términos de reducción de costos, utilización de energías renovables y gestión del tráfico. A medida que las ciudades de todo el mundo buscan descarbonizar sus sectores de transporte y modernizar sus redes, esta investigación proporciona un plan para la operación inteligente y coordinada de la infraestructura. Con más refinamiento y pruebas en el campo, tales modelos podrían convertirse pronto en herramientas estándar en la caja de herramientas del planificador urbano, ayudando a construir ciudades más inteligentes, verdes y resilientes.

Lu Siyue, Ji Hongquan, Zhang Lu, Xu Hui, Wang Peiyi, State Grid Beijing Electric Power Company, Computer Applications and Software, DOI: 10.3969/j.issn.1000-386x.2024.09.053