Redes neuronales híbridas mejoran la identificación de protocolos en carga de vehículos eléctricos

Redes neuronales híbridas mejoran la identificación de protocolos en carga de vehículos eléctricos

La revolución de la movilidad eléctrica avanza a pasos agigantados, transformando no solo la forma en que conducimos, sino también cómo interactuamos con la infraestructura que alimenta nuestros vehículos. A medida que el parque automotor eléctrico crece exponencialmente, uno de los desafíos más críticos deja de ser la autonomía de la batería para convertirse en la interoperabilidad entre vehículos y estaciones de carga. Un obstáculo fundamental en este camino es la diversidad de protocolos de comunicación que regulan el intercambio de datos entre el coche y el punto de carga. Un fallo en esta comunicación puede derivar en tiempos de espera innecesarios, errores en la facturación, incompatibilidades técnicas e incluso riesgos para la seguridad del sistema eléctrico.

En este contexto, una investigación pionera liderada por Lü Xiaorong y Hui Qi de NARI-TECH Nanjing Control Systems Co., Ltd., en colaboración con Xu Zimin del College of Automation y College of Artificial Intelligence de la Nanjing University of Posts and Telecommunications, ha presentado una solución innovadora basada en inteligencia artificial. Su estudio, publicado en la revista Modern Electronics Technique, introduce un nuevo método de identificación de protocolos para sistemas de carga y descarga de vehículos eléctricos (VE) que alcanza una precisión del 97,68%. Este logro no es solo un avance técnico, sino un paso decisivo hacia una red de carga universal, segura y eficiente.

El problema que aborda esta investigación es fundamental: no todos los vehículos eléctricos hablan el mismo «idioma» digital. Mientras algunos utilizan protocolos de campo como CAN o Modbus, otros dependen de estándares industriales como RS 485, y muchos más emplean redes inalámbricas como IEEE 802.11g o 802.11ac para la gestión remota y la autenticación. Esta diversidad, resultado de un desarrollo fragmentado y de estándares regionales o propietarios, crea una barrera invisible para el usuario final. Imaginemos un conductor que, al intentar cargar su vehículo en una estación pública, recibe un mensaje de error simplemente porque el sistema no reconoce el protocolo de su coche. Este escenario, aunque cada vez menos común, sigue siendo una posibilidad real en un mercado globalizado.

La solución tradicional ha sido el uso de métodos basados en firmas, que comparan el tráfico de red con una base de datos de patrones conocidos. Sin embargo, estos métodos son ineficaces frente a protocolos encriptados, variantes modificadas o nuevos estándares. Además, requieren actualizaciones constantes, lo que los hace poco escalables. Ante esta limitación, la comunidad científica ha explorado el aprendizaje automático, especialmente las redes neuronales profundas (Deep Learning Networks, DLN), que pueden aprender a reconocer patrones complejos directamente de los datos brutos, sin necesidad de reglas predefinidas.

La contribución de Lü, Hui y Xu va más allá de aplicar una red neuronal estándar. Su innovación radica en el diseño de una red híbrida que combina el poder de las DLN con una técnica matemática avanzada conocida como regularización l1/2. Este enfoque es clave para abordar uno de los mayores males de las redes neuronales: el sobreajuste (overfitting). El sobreajuste ocurre cuando un modelo se «aprende de memoria» los datos de entrenamiento, perdiendo su capacidad para generalizar y fallando con datos nuevos o ligeramente diferentes. En el mundo real de la carga de vehículos, donde los modelos de coches, sus software y las configuraciones de las estaciones cambian constantemente, un modelo que no pueda generalizar es inútil.

La regularización l1/2 actúa como un mecanismo de disciplina para la red neuronal. Al introducir una penalización en la función de pérdida durante el entrenamiento, fuerza al modelo a utilizar solo las conexiones más importantes y significativas entre las neuronas, promoviendo una estructura más «esparcida» y eficiente. Esto significa que el modelo aprende las características esenciales de cada protocolo de comunicación, ignorando el ruido y los detalles irrelevantes. El resultado es un sistema más robusto, que no solo reconoce lo que ha visto antes, sino que también puede inferir y adaptarse a nuevas variaciones, lo que es esencial para la longevidad y fiabilidad de la infraestructura de carga.

El proceso de desarrollo de este sistema fue meticuloso y riguroso. Todo comenzó con la recopilación de datos del mundo real. El equipo utilizó Wireshark, una herramienta de análisis de red ampliamente utilizada, para capturar el tráfico de comunicación entre vehículos eléctricos y estaciones de carga. Este conjunto de datos inicial, descrito como «sucio» en términos de ciencia de datos, contenía información incompleta, ruido y datos irrelevantes. Por lo tanto, una etapa crucial fue la preprocesamiento de datos, un proceso que transformó el caos inicial en un recurso valioso para el entrenamiento.

Este preprocesamiento se llevó a cabo en cuatro fases clave. Primero, la limpieza: se filtraron todos los paquetes de datos que no pertenecían a los cinco protocolos objetivo (CAN, Modbus, RS 485, IEEE 802.11g, IEEE 802.11ac). Segundo, la segmentación: los datos se dividieron en fragmentos de una longitud fija. Un hallazgo crucial del estudio fue que una longitud de 784 bytes era óptima. Segmentos más cortos carecían de contexto suficiente, mientras que segmentos más largos introducían redundancia que degradaba el rendimiento. Tercero, la normalización: todos los valores de los datos se escalonaron al rango entre 0 y 1, asegurando que ninguna característica individual dominara el proceso de aprendizaje simplemente por su magnitud. Cuarto, la codificación: las etiquetas de los protocolos se convirtieron en vectores numéricos mediante una técnica llamada codificación one-hot, que permite a la red neuronal procesar eficientemente información categórica.

El conjunto de datos final constaba de 50 000 muestras, cuidadosamente etiquetadas y balanceadas. Este conjunto se dividió en un 70% para entrenamiento (35 000 muestras) y un 30% para pruebas (15 000 muestras). Esta división es fundamental para evaluar de manera imparcial el rendimiento del modelo, ya que la prueba se realiza con datos que el modelo nunca ha visto durante su entrenamiento.

La arquitectura de la red neuronal híbrida se basa en una red profunda con múltiples capas ocultas. Cada capa aplica una transformación no lineal a la salida de la capa anterior, construyendo una representación jerárquica de la información. Las capas inferiores pueden capturar patrones simples, como secuencias de bytes específicas, mientras que las capas superiores integran esta información para formar una comprensión más abstracta del protocolo subyacente. La función de activación tanh (tangente hiperbólica) se utilizó para introducir la no linealidad necesaria para modelar relaciones complejas.

El verdadero núcleo del sistema, sin embargo, es el algoritmo de entrenamiento que incorpora la regularización l1/2. Para resolver la función de pérdida no convexa y no suave que resulta de esta regularización, el equipo empleó un método de descenso por coordenadas. Este algoritmo es computacionalmente eficiente porque, en cada iteración, solo actualiza un parámetro (un peso de la red) a la vez, manteniendo los demás fijos. Esta estrategia no solo hace el cálculo manejable, sino que también es particularmente adecuada para manejar la esparsidad que la regularización l1/2 induce en los pesos de la red, lo que contribuye directamente a su capacidad de generalización.

Los resultados de la evaluación fueron contundentes. Al someter el modelo entrenado al conjunto de pruebas, el sistema alcanzó una precisión general (Overall Accuracy, OA) del 97,68%. Este número, por sí solo, es impresionante, pero el análisis detallado revela un panorama aún más alentador. La métrica F1, que equilibra la precisión (qué porcentaje de identificaciones positivas fueron correctas) y el recall (qué porcentaje de instancias reales de un protocolo fueron correctamente identificadas), mostró valores excepcionales para varios protocolos. CAN, Modbus y IEEE 802.11ac superaron el 99% en F1, lo que indica un rendimiento casi perfecto para estos estándares. Aunque los protocolos RS 485 y IEEE 802.11g tuvieron valores ligeramente más bajos, su rendimiento sigue siendo muy alto y superior al de los modelos de referencia.

Para demostrar la superioridad de su enfoque, los investigadores realizaron una comparación directa con tres modelos diferentes. El primero fue una red neuronal profunda estándar sin regularización l1/2, que mostró una caída significativa en el rendimiento, confirmando la vulnerabilidad de los modelos no regularizados al sobreajuste. El segundo fue un modelo basado en redes neuronales convolucionales (CNN), popularizado en tareas de visión por computadora, que obtuvo los peores resultados, lo que sugiere que su arquitectura no es óptima para capturar las características temporales y estructurales de los flujos de protocolo. El tercero fue un modelo híbrido avanzado basado en SENet y Transformer, tomado de la literatura científica reciente, que fue un competidor fuerte pero que finalmente fue superado por el modelo propuesto. Esta comparación de tres vías subraya no solo la efectividad del modelo, sino también la importancia de la regularización l1/2 como el factor diferenciador clave.

Las implicaciones de esta investigación trascienden el laboratorio. Desde una perspectiva industrial, este sistema puede integrarse directamente en los controladores de las estaciones de carga. Un punto de carga equipado con esta tecnología podría identificar automáticamente el protocolo del vehículo que se conecta, ajustar su interfaz y proceder con la carga sin intervención del usuario. Esto no solo mejora drásticamente la experiencia del cliente, sino que también reduce los costos operativos al minimizar las llamadas de soztech por problemas de conexión.

Además, esta capacidad de identificación inteligente abre nuevas vías para la ciberseguridad. Una estación de carga puede usar este modelo como un sistema de detección de anomalías. Si el tráfico de red no coincide con ningún protocolo conocido o muestra patrones extraños, el sistema puede alertar a los operadores o incluso bloquear la conexión, protegiendo así tanto la infraestructura como el vehículo de posibles ataques. A medida que las estaciones de carga se convierten en nodos críticos de la red eléctrica, esta capa de seguridad proactiva es esencial.

La escalabilidad del modelo es otra de sus fortalezas. Si surge un nuevo protocolo de comunicación, el sistema no necesita ser rediseñado desde cero. En su lugar, se puede reentrenar con un nuevo conjunto de datos que incluya el nuevo protocolo, permitiendo una actualización rápida y eficiente. Esta capacidad de adaptación es vital en un campo tecnológico que evoluciona con tanta rapidez.

El hecho de que este trabajo sea el resultado de una colaboración entre una empresa líder en tecnología de control (NARI-TECH) y una universidad de prestigio (Nanjing University of Posts and Telecommunications) es un ejemplo perfecto de cómo la investigación académica y la innovación industrial pueden unirse para resolver problemas del mundo real. Esta sinergia asegura que la solución no solo sea teóricamente sólida, sino también práctica, robusta y lista para su despliegue en el campo.

Mirando hacia el futuro, los autores identifican varias direcciones prometedoras. Una de ellas es la extensión del modelo para manejar tráfico completamente encriptado, donde el contenido del paquete está oculto, pero los patrones de encabezado o la secuencia de paquetes podrían seguir siendo indicativos del protocolo subyacente. Otra área es la incorporación de arquitecturas que tengan en cuenta la dimensión temporal de la comunicación, como las redes recurrentes o los transformadores, para analizar flujos de datos a lo largo del tiempo. Finalmente, mejorar la interpretabilidad del modelo para que los ingenieros puedan entender por qué se tomó una decisión de identificación específica sería un gran avance para la confianza y la adopción en entornos críticos.

En última instancia, la investigación de Lü Xiaorong, Hui Qi y Xu Zimin representa un avance significativo en la infraestructura invisible que sostiene la movilidad eléctrica. No se trata de una batería más grande o de un motor más potente, sino de una inteligencia más aguda en el corazón de la red de carga. Al garantizar que el coche y la estación puedan comunicarse sin fisuras, este tipo de tecnología elimina una de las mayores fricciones en la transición hacia los vehículos eléctricos. Contribuye a una experiencia de usuario más fluida, a una red eléctrica más estable y a un ecosistema de movilidad más seguro y eficiente. A medida que el mundo se mueve hacia un futuro sostenible, innovaciones como esta, que operan en segundo plano, serán fundamentales para hacer que la conducción eléctrica no solo sea posible, sino también verdaderamente conveniente para todos.

Publicado en Modern Electronics Technique por Lü Xiaorong, Hui Qi y Xu Zimin. DOI: 10.16652/j.issn.1004⁃373x.2024.17.007