Digital Innovation Hub

Agriculture Timber Energy

Überblick

 

Ausgangspunkt waren drei Lastprofile (Stromverbrauchs) typischer Verbraucher über die Dauer von jeweils einem Jahr im 15 Minten Takt. Im Zuge einer Explorativen Datenanslyse wurde versucht anhand von kurzen Abschnitten von 4 Stunden wiederkehrende Muster mit Hilfe einer umfangreichen Korrelationsanalyse festzustellen. Innerhalb eines Verbrauchertyps (z.B. Privathaushalt oder Gewerbebetrieb, o.dgl.) konnten zahlreiche Muster gefunden werden, die sich in den Aufzeichnungen des selben Verbrauchers häufig wiederholen (Autokorrelation) Diese Abschnitte konnten als typische  und wiederkehrende Verbrauchs-Charakteristik weiterverarbeitet werden. Im Vergleich zweier Verbraucher-Typen war der Zusammenhang erwartungsgemäß deutlich schwächer (Kreuzkorrelation). Erkenntnis daraus war, dass typische Verbrauchsmuster z.B. eines Gewerbebetriebes in den Aufzeichnungen eines Privathaushaltes deutlich seltener gefunden werden. In der Implementierung war auf eine äußerst effiziente und parallelisierte Verarbeitung der Daten zu achten, da das simple Berechnen der Korrelationsmatrix zweier Jahresverläufe mit Fokus auf 4-Stunden-Merkmalen mehr als 600 Mio. Korrelations-Paare nach sich zog. 

Die extrahierten Merkmale mit häufigen Vorkommen in den Aufzeichnungen wurden zur weiteren Analyse herangezogen. In den Verbrauchaufzeichnungen gelingt es bereits ohne weitere Vorverarbeitung Zeitfenster zu bestimmen, in welchen bekannte Muster auftreten. In einer weiteren Analyse oder mit Hilfe des Anwenders, könnten diese Charakteristika einzelnen Vorkommnissen oder Verbrauchern zugewiesen werden. 

Aufgrund der Vielzahl gefundener Muster, die zueinander sehr ähnlich sind, d.h. ein bestimmtes Charakteristikum wurde N mal gefunden, da es N mal im Datensatz auftritt, war die Strategie, eine Clusterbildung durchzuführen und die unter sich sehr ähnlichen Muster auf einen repräsentativen Prototypen der Charakteristik zu reduzieren. Im ersten Schritt wurden die Merkmale jedes gefundenen Musters mit Hilfe multivariater Statistik, im Konkreten Multidimensionaler Skalierung, in einen N-dimensionalen Raum transformiert (N=8 erwies sich als praktikabel). Mit Hilfe von Unsupervised Clustering konnten Häufungen erkannt werden, die jeweils für eine bestimmte Verbrauchs-Charakteristik stehen und eine Anzahl M von Beispielen dieser Charakteristik enthalten. Zur Anwendung kamen K-Means und dichtebasierte Clustering Algorithmen. Dichtebasierte Algorithmen erwiesen sich als Vorteil, da sie die Anzahl der resultierenden Muster ebenfalls unsupervised aus dem Datensatz ermitteln und hierüber keine Vorkenntnis erforderlich ist. Mit Hilfe eines Hyperparameters für den Clustering Algorithmus – ein Ähnlichkeits-Schwellwert – kann bestimmt werden wie fein segmentiert das Resultat sein soll.  

In einer Visuellen Darstellung wurden die Ergebnisse qualitativ erfolgreich verifiziert. Die Augenmerke lagen auf zwei Kriterien. „Sind die gefundenen Verbrauchs-Abschnitte, die einer Charakteristik angehören unter sich ähnlich genug“ und „Sind die gefundenen Verbrauchs-Abschnitte unterschiedlicher Charakteristiken verschieden genug zueinander“. 

Die Veranstaltung fand im Rahmen des European Digital Innovation Hub Programms statt und wurde von der Europäischen Kommission, dem Bundesministerium für Arbeit und Wirtschaft sowie der FFG gefördert.

Wir verwenden Cookies, um Ihnen ein optimales Website-Erlebnis zu bieten. Weitere Informationen finden Sie in unserer Datenschutzerklärung.