En este artículo haremos un recorrido por diferentes proyectos del Internet de las Cosas en el mundo ferroviario, así como por los retos que plantea: procesamiento escalable, computación en el edge, convivencia entre arquitecturas batch y en streaming, modelos predictivos de averías, y visualizaciones ad-hoc. Por Javier Rodríguez, CTO de OpenSistemas.
Por Javier Rodriguez, CTO de OpenSistemas
Un tren está plagado de sensores. Estos sensores sirven para conocer su velocidad, su geolocalización, la tensión de catenaria, la temperatura de los vagones, las vibraciones de los bujes, temperaturas de rodamientos, los elementos del motor y un largo etcétera de magnitudes que son medibles y útiles para conocer en cada momento el estado de los vehículos.
Todas esas magnitudes las podemos enviar a tierra vía 3G o 4G en tiempo casi-real y ya tenemos que ese tren del que hablábamos antes ahora es un dispositivo conectado. Pero ojo, es un dispositivo conectado un tanto particular si volvemos a considerar esa gran cantidad de magnitudes que podemos monitorizar a través de la sensórica. Es decir, monitorizar una flota de trenes es una problemática de IoT en tanto en cuanto a cosas sensorizadas y conectadas.
Y como cada tren genera un volumen muy grande de datos también plantea las problemáticas habituales de almacenamiento, consulta y procesamiento escalable añadiendo entonces la vertiente de Big Data. Si además conseguimos que la latencia con la que recibimos los datos en tierra sea pequeña podremos crear un gemelo digital del tren para monitorizar en tiempo casi real su estado. La casuística de tiempo real nos lleva a tratar toda esa telemetría en vuelo, y las técnicas a aplicar se basan fuertemente en procesamiento en streaming.
Observar el tren en tiempo casi-real y desde cualquier parte del mundo sirve para mejorar la eficiencia de operación de la flota de trenes. Se minimiza el tiempo entre la observación de un problema y la organización de recursos para su solución (taller, operarios, etc.).
Sin embargo, queremos llevar la eficiencia operativa más allá. Apoyándonos en el histórico de telemetría acumulada podemos buscar estrategias de mantenimiento basado en la condición. Se trata de predecir averías de elementos críticos del tren antes de que ocurran y planificar su sustitución por adelantado a la vez que alargamos la vida útil de las piezas. Para el mantenimiento predictivo necesitamos utilizar técnicas de aprendizaje máquina para obtener modelos de predicción de fallos. Esos modelos de predicción se alimentarán de la telemetría en tiempo real para identificar deterioros y averías por anticipado. Los modelos operan sobre series temporales de una gran variedad de magnitudes físicas y otras señales.
Conseguir un modelo predictivo de la condición de un elemento del tren constituye en muchas ocasiones un reto no menor. Es sencillo entrenar un algoritmo de aprendizaje supervisado cuando dispones de un gran histórico de fallos, pero eso no es realista. La fiabilidad de los trenes hace que las observaciones de fallos ocurran con muy poca frecuencia de modo que el conjunto de datos no sea viable. Cobran especial importancia en ese caso las aproximaciones no supervisadas y los algoritmos que aprenden de la normalidad para inferir cuándo se comienza a producir un desvío relevante que puede acabar en un fallo grave.
Un proyecto de monitorización de flotas de trenes tiene muchas vertientes tecnológicas interesantes:
- IoT: el tren como generador de datos en tiempo real que permite poner el foco en aumentar la eficiencia de la explotación de los vehículos por parte de los operadores de transporte y del propio fabricante.
- Big Data: el tren genera un volumen muy grande de datos y plantea las problemáticas habituales de almacenamiento, consulta y procesamiento escalable.
- Procesamiento en streaming: son proyectos que se conciben desde el inicio con arquitectura Kappa, que en muchas ocasiones tiene que convivir y complementar una arquitectura orientada a batch más clásica.
- Machine Learning: con el histórico de datos se pretende mejorar la operativa de mantenimiento yendo hacia modelos predictivos de averías de las piezas claves del tren.
- Visualización: los ingenieros mantenedores del tren tienen unas necesidades muy concretas de representación de la información generada por el tren (series temporales, downsampling, rabioso real time, «flashback», etc.).
Sobre Javier Rodriguez | CTO OpenSistemas
Javier Rodríguez acumula cerca de dos décadas de experiencia en arquitecturas empresariales y tiene experiencia en soluciones IoT usando servicios en cloud. Licenciado en CC. Físicas, y postgrado en Data Science por U-Tad. Profesor colaborador en postgrados en diversas escuelas de negocios y universidades, así como en cursos de innovación digital.
Sobre OpenSistemas
OpenSistemas es una compañía especializada en el desarrollo de proyectos y productos globales altamente innovadores relacionados con la gestión, transformación, análisis, almacenamiento y visualización de datos en entornos de Data Intelligence, Visual Knowledge, Content Management y Cloud Integration, ayudando a nuestros clientes a potenciar el valor estratégico de su información.
OpenSistemas fundamenta esta capacidad en su experiencia de más de una década ofreciendo soporte, soluciones y servicios relacionados con entornos Cloud, Education y Content Management en grandes cuentas a nivel internacional y en la pasión de su equipo por las tecnologías Open Source, siempre bajo un enfoque de vocación de servicio al cliente y de compromiso con la comunidad. Más info en www.opensistemas.com.
Si te interesa saber más sobre este sector, inscríbete en el webinar Big Data Skills 4 New Digital Challenges, que tendrá lugar el miércoles 24 de junio, de 18:00h hasta las 19:30h. PINCHA AQUÍ PARA INSCRIPCIONES.