Datasets
Datos de la prueba de concepto con Regenera
Los datos utilizados provienen de la Red Eléctrica Española (REE) y se han extraído mediante la API de eSIOS (Sistema de Información del Operador del Sistema). Una API o interfaz de programación de aplicaciones facilita la integración de software de diversas aplicaciones ya que permite acceder a los datos o funciones disponibles. Para extraer la información se han realizado diversas llamadas a la API indicando el identificador del dato a extraer y el intervalo de fechas correspondiente.
A continuación se describe la información extraída, indicando el identificador asociado a cada dato, su descripción y el momento aproximado en el que está disponible a través de la API.
-Precio mercado SPOT Diario (600): Precio resultante del acoplamiento de los mercados diarios europeos (SDAC por sus siglas en inglés) en algunas de las zonas más representativas del mismo: MIBEL (España y Portugal), Francia, Bélgica, Países Bajos, Italia y Alemania. Este indicador está georreferenciado a nivel de país. Las principales fuentes de información son la Plataforma de Transparencia de ENTSO-E y el Operador del Mercado Ibérico, Polo Español (OMIE). Publicación: en torno a las 14:00 horas con la información el día .
-Energía asignada en Mercado SPOT Diario España (602): Energía asignada en el mercado diario en el polo español. La fuente de la información que proporciona este dato es el Operador del Mercado Ibérico, Polo Español (OMIE). Publicación: en torno a las 14:00 horas con la información el día D+1 .
-Previsión diaria de la demanda eléctrica peninsular (460): Previsión de consumo que REE elabora teniendo en cuenta los valores de consumo registrados en periodos precedentes similares, así como otros factores con influencia en el consumo eléctrico como la laboralidad, la climatología y la actividad económica. Publicación: diariamente se actualiza la previsión del día D hasta D+7. Valores horarios.
-Previsión de la producción eólica peninsular (541): Previsión horaria de energía eólica según el Modelo de Predicción Eólica del Operador del Sistema. Publicación: cada hora con la previsión desde la hora en curso del día D hasta la última hora del día D+1.
-Generación prevista Solar fotovoltaica (542): Previsión horaria de generación de energía solar recibida de los Modelos de Predicción. En concreto este indicador se refiere a la previsión de energía solar fotovoltaica. Publicación: cada hora con la información del día D desde la hora H +1 hasta el final del día D+1 completo.
-Generación prevista Solar térmica (543): Previsión horaria de generación de energía solar recibida de los Modelos de Predicción. En concreto este indicador se refiere a la previsión de energía solar térmica. Publicación: cada hora con la información del día D desde la hora H+1 hasta el final del día y el día +1 completo . Los datos asociados a los indicadores se han extraído de forma horaria para el periodo comprendido entre 2013-12-31 23:00:00 y 2022-08-30 00:00:00 por lo que el conjunto de datos creado contiene 75914 instancias.
Datasets usados para entrenar y evaluar modelos globales de previsión
Los datasets que aparecen a continuación forman parte del Monash Time Series Forecasting Repository, y se pueden usar para entrenar modelos globales de previsión.
Consumo Eléctrico
Contiene el consumo eléctrico (kW) horario de 321 casas medidas entre 2012 to 2014. Es una versión reducida de otro dataset de consumo eléctrico de 370 clientes medido cada 15 minutos entre 2011 y 2014.
Tráfico de páginas Wikipedia
Contiene la retirada en efectivo diario de 111 máquinas bancarias en el Reino Unido. Se usó en la competición NN5 de previsión de series temporales.
Retirada de dinero de cajeros
Contiene el tráfico diario de 145063 páginas de Wikipedia medido entre 2015-07-01 y 2017-09-10. Se usó en la competición de Kaggle <>.
Consumo energético con contadores inteligentes en Londres
Contiene el consumo energético (kWh) medido cada media hora en 5560 casas en Londres entre noviembre de 2011 hasta febrero de 2014.
Producción de energía eólica
Contiene la producción energética horaria de 339 parques eólicos en Australia. Los datos fueron obtenidos de la plataforma en línea de la AEMO (Australian Energy Market Operator).
Número de peatones
Contiene el número horario de peatones medidos por 66 sensores localizadas en la ciudad de Melbourne (Australia) entre mayo de 2009 y abril de 2020.
Calidad del aire en Londres y Beijing
Contiene 270 series temporales horarias que miden aspectos de la calidad de aire obtenidos de sensores localizados en Beijing y Londres. Las mediciones se tomaron entre 2017-01-01 y 2018-03-31. Se usó en la competición KDD Cup 2018.
Tiempo atmosférico en Australia
Contiene 3010 series temporales diarias con datos meteorológicos medidos en Australia.
EPIC + Blaq0
EPIC (Electric Power Intelligent Control): es un banco de pruebas que imita un sistema de energía del mundo real en una smart grid de pequeña escala. Los datos recopilados del entorno de pruebas EPIC constan de 8 escenarios en funcionamiento normal, donde para cada escenario, el entorno se pone en funcionamiento durante aproximadamente 30 minutos. El tráfico de red se guardó en archivos en formato PCAP. Blaq0: Tráfico de red generado durante un hackathon en el cual los equipos independientes diseñan y lanzan ataques sobre el entorno de pruebas EPIC.
Enlace dataset EPIC
UCoimbra
Conjunto de datos recopilado a través de capturas de tráfico en un entorno de pruebas compuesto por una HMI, un PLC, un RTU basado en Arduino, un VFD (Variable Frequency Drive) y un motor de 3 fases que simula un proceso ciberfísico controlado por un sistema SCADA a través del protocolo Modbus/TCP. Sobre este entorno se realizan diversos ataques de denegación de servicio (DoS), que tienen por objetivo el PLC, destacando: Modbus Query Flooding: opera en la capa de aplicación contra el protocolo MODBUS, inundando el dispositivo con solicitudes de lectura. Esto puede originar efectos secundarios como el agotamiento de los recursos del dispositivo, desviaciones de latencia del ciclo de escaneo o incluso pérdida de conectividad. TCP SYN Flooding: el atacante utiliza características del propio protocolo TCP para llevar a cabouna denegación de servicio, enviando un flujo de paquetes maliciosos al PLC con la intención de sobrecargarlo, ocupando recursos (puertos) que dejan de estar disponibles para el uso real. ICMP Ping Flooding: este ataque involucra el envío masivo de solicitudes ICMP de tipo "ping" al dispositivo objetivo con el fin de saturar su capacidad de respuesta. Esto puede llevar a una sobrecarga del dispositivo y a la interrupción de la conectividad.
Enlace dataset Universidad de Coimbra