Ausgangslage und Zielsetzung

Das Land Berlin plant eine deutliche Ausweitung der Leistungen des öffentlichen Personennahverkehrs (ÖPNV). Vor dem Hintergrund des hohen Finanzierungsbedarfs, der sich aus diesen Zielen in den nächsten Jahren ergibt, kommt der Planung, Prognose und Steue-rung der erwirtschafteten Erträge aus Fahrschein- und Abonnementverkäufen eine zentrale Bedeutung zu. Das Ertragscontrolling im Berliner ÖPNV beinhaltet kurz- und langfristige Prognosen basierend auf dem Vorjahr. Dabei ist die Bewertung der zugehörigen Ein-flussgrößen (Treiber) meist nur durch Expertenannahmen und -erfahrungen gestützt. Als „Verkehrserträge“ werden selbst erwirt-schaftete Umsatzerlöse inkl. Zuschüssen für ermäßigte Fahrkarten vom Land Berlin verstanden. Weiterhin hat die Covid19-Pandemie in 2021 große Auswirkungen auf den ÖPNV und somit auch auf das Projekt. Die Verkehrserträge sind noch nicht wieder auf den Stand von 2019 gestiegen. Zudem ist nicht abzusehen, inwieweit mit einer langfristigen Änderung des Nutzerverhaltens im ÖPNV zu rech-nen ist.
Ziel war es, verbesserte hybride Methoden der Ertragsprognose des ÖPNV sowohl für den Gesamtmarkt als auch für einzelne Pro-duktgruppen zu entwickeln. Ein zusätzliches Ziel war die Nutzung und Implementierung eines Prototyps zur Erstellung von Prognosen mit mehreren ausgewählten mathematischen Methoden. Eine weitere Zielsetzung des Projekts war es, die Auswirkungen von Trei-bern (z.B. Wetter, Bevölkerungs-, Pendler-, Touristen- und Arbeitsmarktentwicklung, konkurrierende Mobilitätsformen) auf die Fahr-gelderträge statistisch zu belegen und quantitativ zu bestimmen. Um diese Ziele gemeinsam zu erreichen, wurden von der BVG die monatlichen Verkaufs- und Umsatzdaten seit 2005 bereitgestellt.

Projektpartner:

  • Berliner Hochschule für Technik
  • Hochschule für Wirtschaft und Recht Berlin
  • Berliner Verkehrsbetriebe AöR
  • Lufthansa Systems GmbH & Co. KG
  • Lufthansa Industry Solutions AS GmbH
  • Internationaler Controller Verein e. V. (Arbeitskreis Berlin-Brandenburg)

Projektlaufzeit: 01.10.2019- 31.12.2022

Ergebnisse

  • Prognoseergebnisse:
    Die verfeinerten Prognosen basieren auf den aufgearbeiteten Daten bis 2021. Teilweise waren die Treiberdaten erst ab 2012 verfügbar, sodass die Prognosen unter Einbeziehung von exogenen Variablen einen kürzeren Trainingszeitraum hatten. Für eine erste Be-wertung der Methoden wurde das Jahr 2018 als Validierungsjahr genutzt, das Jahr 2019 wurde prognostiziert und mit den vorhan-denen Werten verglichen.
    Beim Vergleich aller verwendeten Methoden und nach Verfeinerung dieser sowie der Bereinigung der Daten bezüglich der Schülertickets wurden die Umsätze ab 2005 des Gesamtmarkts und der zwei umsatzstärksten Produktgruppen betrachtet. Daben ergaben sich z.B. folgende Prognosefehler (MAPE) für das Jahr 2019
    • im Bereich von 1,90% bis 7,44% bzgl. des Gesamtumsatzes
    • im Bereich von 0,28% bis 4,54% bei Abonnements
    • im Bereich von 3,08% bis 13,85% bzgl. der Einzelfahrscheine
  • ​​​​​​​​​Einige der verwendeten Methoden können ein reguläres Jahr relativ gut prognostizieren, sind aber bei Schocks nicht robust genug..
  • ​​​​​​​Die Prognosen für die Jahre 2020 und 2021 fielen aufgrund des Corona-Schocks schlechter aus. Vor allem bei den Methoden, die nur aus der Vergangenheit lernen und keine Treiber mitberücksichtigen, lag der Prognosefehler deutlich höher. Beim (besten) Holt-Win-ters-Modell für den Gesamtumsatz im Jahr 2020 lag der Fehler beispielsweise bei 33,58%. Die Methoden, welche Treiber mitberück-sichtigen, wiesen einen deutlich geringeren Fehler auf. Der Prognosefehler z.B. beim SARIMAX-Modell lag bei 8,81%. Maßgeblich für den geringen Prognosefehler war die Berücksichtigung der Treiber Arbeitslosenquote und Übernachtungen. Im Jahr 2021 konnte der Prognosefehler durch die Berücksichtigung des Treibers Mobilitätsdaten auf 2,94% beim multiplen linearen Regressionsmodell ge-senkt werden. Die Mobilitätsdaten haben sich über alle Prognosemethoden hinweg als geeignetes Mittel erwiesen, um den Corona-Schock auf die Erträge der BVG zu modellieren. So waren die Prognosefehler für alle Methoden im Jahr 2021 geringer, wenn der Treiber Mobilitätsdaten anstatt des Treibers Google Trends verwendet wurde. Die entwickelten Prognosemethoden wurden in einen auf Streamlit/Python basierenden Prototyps implementiert, mit dessen Hilfe die Prognoseergebnisse berechnet wurden.
  • Spannungsfelder zwischen Controllingpraxis und Predictive Analytics
    Im Laufe des Projektes stellten sich in diversen Gesprächen mit den Praxispartnern mehrere Spannungsfelder zwischen Erwartung und Realität bei der Anwendung von PA-Ansätzen heraus.
    • Das wohl am meisten diskutierte Thema, das die Praktikabilität einer Prognose mithilfe von PA beeinträchtigen könnte, ist der Wunsch der Controller und der Manager, die Prognose erklären zu können. Das steht im Kontrast zu einigen Methoden (z.B. neuronale Netze), welche als sogenannte Black Box-Modelle keine Erklärbarkeit liefern. Ein essentieller Aspekt für die Akzeptanz von Prog-noseergebnissen ist die Erklärbarkeit der resultierenden Werte. Dies ist ein aktueller Forschungsgegenstand.
    • Ein anderes Spannungsfeld ist die Bewertung der Wirtschaftlichkeit der Implementierung von PA: Am Anfang stehen hohe Investiti-onskosten, um die erforderlichen Daten und Methoden bereitzustellen. Dem gegenüber steht ein noch unbekannter zukünftiger Mehrwert, der jedoch nicht nur in prognostizierten Werten besteht. In langfristiger Perspektive wird es unausweichlich sein, dass Unternehmen eine Digitalisierungsstrategie in Richtung eines datenbasierten und -getriebenen Unternehmens verfolgen.
    • Das dritte Spannungsfeld betrifft den Wunsch, die Prognose möglichst automatisiert ablaufen zu lassen – auch ohne tieferes statistisches Wissen. Um das zu gewährleisten, muss aber das Tool, welches am Ende die Prognose erzeugt, durch einen Data Scientist oder einen entsprechend (nach-)qualifizierten Controller gepflegt werden.
      Selbstverständlich wünschen sich Controller und Manager eine zuverlässige Performance bezüglich der Prognosegenauigkeit. Aber auch eine datengetriebene Prognose kann bei unerwarteten Ereignissen keine zuverlässige Qualität gewährleisten. Gerade die Co-vid19-Pandemie und deren Auswirkungen kann und wird ein Algorithmus nicht sofort antizipieren können. Das liegt vor allem daran, dass die Methoden aus der Historie lernen und nichts lernen können, was es noch nie gab. Aber selbst wenn es eine Historie gibt (z.B. BVG-Streiks), lässt sich der Zeitpunkt des Eintretens eines solchen Ereignisses nicht prognostizieren.
    • Eine umfangreiche Aufklärungsarbeit für die erfolgreiche Implementierung eines PA-basierten Prognosemodells ist unumgänglich. Dies impliziert neben einem grundlegenden Verständnis über die zugrundeliegenden Technolo-gien auf allen beteiligten Fachebenen ebenfalls ein ausgeprägtes Erwartungsmanagement, welches Potenziale und Grenzen der ver-wendeten Methoden aufzeigt. Ferner wurde deutlich, dass die erfolgreiche Implementierung durch eine gut ausgeprägte BI-Infra-struktur enorm beschleunigt werden kann. Insbesondere ein etabliertes Data Warehouse kann dabei den Prozess erleichtern und gleichzeitig die Erfolgschancen signifikant erhöhen.

Veröffentlichungen

  1. Jonas Krembsler (29.06.2021): Comparison of different prediction methods for fare revenues in public transportation in Berlin within the ReComMeND project. 41st International Symposium on Forecasting.
    url: youtu.be/3NuDzBSyKsA (besucht am 13.01.2022)
  2. Nicki Kämpf (29.06.2021): Bayesian Optimization for Neural Networks with Small Sample Size Data: A Combined Approach for Feature Selection and Hyperparameter Tuning. 41st International Symposium on Forecasting.
    url: youtu.be/4AatmZo-oNHM (besucht am 13.01.2022)
  3. Robert Knappe, Jonas Krembsler (7.11.2020): Ertragscontrolling mit mathematischer Modellierung im öffentlichen Personen-nahverkehr am Beispiel der Berliner Verkehrsbetriebe. Controlling Inspiration Berlin – CIB 2020.
    url: www.icv-control-ling.com/de/events/cib-controlling-inspiration-berlin-d/programm.html (besucht am 04.08.2022)
  4. Robert Knappe, Jonas Krembsler, Sandra Spiegelberg (17.9.2021): ReComMeND. Ertragscontrolling 4.0 mithilfe von Predictive Analytics am Beispiel des ÖPNV. ICV Nord-Ost-Tagung.
    url: www.icv-controlling.com/fileadmin/Veranstaltungen/VA_Dateien/Regionaltagung_Nord/Vortr%C3%A4ge/2021/Knappe_Krembsler_Spiegelberg_ReComMeND.pdf (besucht am 12.01.2022)
  5. Robert Knappe, Jonas Krembsler, Sandra Spiegelberg (01.10.2021): Ertragscontrolling 4.0 mithilfe von Predictive Analytics – am Beispiel des ÖPNV [Audio-und Video-Podcast]. In Der Performance Manager Podcast.
    www.y-outube.com/watch / https://open.spotify.com/episode/0gkd6jYXW3TjzT7v2tMrCc
  6. Robert Knappe, Nicki Kämpf (11.11.2021): ReComMeND. Impulsvortrag. 66 Arbeitskreistagung Berlin Brandenburg.
    url: www.icv-controlling.com/fileadmin/Assets/Content/AK/Berlin%20Brandenburg/Images/AK-Tagungen/66/Impulsvor-trag_ICV_Tagung_11.1121.pdf (besucht am 13.01.2022)
  7. Jonas Krembsler, Sandra Spiegelberg, Nicki Kämpf (12.11.2021): Ein Kochrezept für die Controlling-Praxis am Beispiel der Besu-cherprognose für ein Sommerbad der Berliner Bäder-Betriebe. 66 Arbeitskreistagung Berlin Brandenburg.
    url: www.icv-controlling.com/fileadmin/Assets/Content/AK/Berlin%20Brandenburg/Images/AK-Tagungen/66/Kochre-zept_Berliner_B%C3%A4der.pdf (besucht am 13.01.2022)
  8. Robert Knappe, Jonas Krembsler, Sandra Spiegelberg, Nicki L. Kämpf, Nicola Winter, Thomas Winter: Erlösprognose mit Pre-dictive Analytics. In Controller Magazin Ausgabe 4, 2021, S. 58-62
  9. Krembsler, Jonas; Spiegelberg, Sandra; Hasenfelder, Richard; Kämpf, Nicki Lena; Winter, Thomas; Winter, Nicola; Knappe, Robert: Fare revenue forecast in public transport: a comparative case study, Research in Transportation Economics, Elsevier, Volume 105, Juli 2024,