Datenmanagement - Projektbeschreibung

Versionsnummer 1
Berichtsreferenz Projekt Kick-Off
Projekttitel KI-basierte Entscheidungsplattform für klimaneutrale urbane Mobilität
FFG Förderprogramm Städte & Digitalisierung 2022
Projektbeschreibung: Digital change is leading to fundamental transformations in urban mobility. To consider these transformations in cross-modal planning and monitoring processes in a timely manner, KI.M will provide access to a portfolio of datasets and algorithms for different tasks in the context of transport and mobility. The added value of the project lies in the use of Artificial Intelligence (AI) for validating, enriching, linking, and interactively visualizing this data. Thereby, KI.M will support a uniform data ecosystem for climate-friendly urban mobility and will help to avoid isolated solutions.
Projekt Webseite: t.b.d.
Weitere projektbezogene Links (z.B. Services) www.weblyzard.com (API and Dashboard Documentationj)
Mobilitätsart: Personenverkehr; Individualverkehr; öffentliche Verkehr; Radsharing; Carsharing; Taxi/Ridesharing
Themengebiete: Informationsdienst; Wissensextraktion; Entscheidungsmodelle; Vorhersage; Klimaneutralität
Projektleiter:in
Organisation Ansprechperson E-Mail Telefonnummer
weblyzard technology gmbh Arno Scharl scharl@weblyzard.com 0043 664 8463919
Projektteilnehmer:in
Organisation Ansprechperson E-Mail Telefonnummer
weblyzard technology gmbh Arno Scharl scharl@weblyzard.com 0043 664 8463919
Data Intelligence Offensive (DIO) Marcos Moschovidis marcos.moschovidis@dataintelligence.at 0043 664 453 01 18
Hutchison Drei Austria GmbH Alexander Populorum alexander.populorum@drei.com 0043 666066062306
MO.Point Mobilitätsservices GmbH Stefan Melzer stefan.melzer@mopoint.at 0043 677 61210595
MODUL Technology GmbH Lyndon Nixon nixon@modultech.eu 0043 680 2361191
nast consulting ZT GmbH Daniel Elias elias@nast.at 0043 676 88 62 78 004
UBIMET GmbH Markus Jech mjech@ubimet.com 0043 66488257304
Relevante Vorprojekte
Projektname
Projektbeschreibung
Projektlink

Datenmanagementplan - Datenquellenbeschreibung

Q_ID Subprojekt ID Titel Textbeschreibung Link Datenart Verfügbarkeit Entgelt Lizenz/Nutzungsbedingung Datenformat Daten gültig ab Daten gültig bis Nutzungszeitraum Personenbezogenen Daten enthalten Wichtigkeit für das Projekt Arbeitspaket Speicher und Backup Methoden Organisation Ansprechpartner E-Mail Telefonnummer
Q1 KI.M Content Repository (metadata about Webpages, social media) The digital content acquisition pipeline of MOD and WLT will be extended to cover specific topics and sources relevant for KI.M. Collected documents are filtered for relevance and redundancy, pre-processed with Natural Language Processing (NLP) methods, and annotated along multiple semantic dimensions - including document keywords, geotags, sentiment, and referenced named entities. Aggregated Data Public Nein None Text, Metadata (JSON) M3-34 Nein Hoch WP2, WP4 The webLyzard platform uses a secure and scalable infrastructure to store and backup documents. The database and sharded indices run on a distributed and hybrid infrastructure where the data storage can be dynamically scaled at any time. The data is backed up daily via local storage servers and dedicated remote servers. The backup concept includes distributed snapshots of server and VM instances on independent networks, which can be restored within two hours. For productive environments, crucial systems, and data nodes, we have the capability to run idling instances with recent backups for an immediate switch in case of emergency. webLyzard Arno Scharl scharl@weblyzard.com
Q2 DREI Anonymisierte Bewegungsdaten With Motion Insights Drei provides anonymized and aggregated network data and analysis of movement based on SIM cards within the mobile network. Every activity like a phonecall, a login on the networkcell or a datatransfer produces an activity with a timestamp and a Mobile-Cell-ID. With this data a time and geopgraphical footprint is anonymized and calculated. The provided Data consists of raster-orientated, anonymised & aggregated movement data based on mobile network data. Aggregated anonymized Data Not Public Ja None CSV M3-30 Nein Hoch AP 2.2 Redundant System Hutchison Drei Austria GmbH Alexander Populorum alexander.populorum@drei.com 0043 660 660 62306
Q3 MO.Point Nutzungsdaten Für unsere Sharing-Dienstleistungen verwenden wir die MOQO-Plattform der Firma Digital Mobility Solutions aus Deutschland. Auf dieser Plattform werden Daten zu den Buchungen (Nutzer:innen, Fahrten, Fahrtdauer, Erlöse, etc.) gespeichert. Rohdaten & aggregiert Not Public Nein None CSV Nov.23-Jun.26 Nein Hoch AP 2.2, AP 3.2 Redundante Systeme auf MOQO-Plattform (Online-Server) MO.Point Stefan Melzer stefan.melzer@mopoint.at
Q4 NAST Radverkehrsdaten Radverkehrsdaten der Dauerzählstellen der Stadt Wien Aggregated Data Public Nein None CSV Nov.23-Jun.26 Nein Niedrig AP 2.2, AP 3.2 Redundante Systeme auf NAST-Server (Online-Server) nast consulting Daniel Elias elias@nast.at 0043 676 88 62 78 004
Q5 UBIMET Wetterdaten Durch eine Vielzahl von Wetterinformationen, z.B. durch Radar- und Satellitendaten, Blitzmessungen und Wetterstationen, werden hochaufgelöste räumliche (bis zu 100 x 100 m) und zeitliche (bis zu 1 h) Reanalysen sowie Prognosen von meteorologischen Parametern erstellt. Rohdaten & aggregiert/verschnitten Not Public Nein None CSV, GeoTiff Nov.23-Jun.26 Nein Mittel AP2.3, AP3.2, AP3.4, AP4.1, AP4.2, AP5.2, AP5.3 Redundante Systeme auf UBIMET-Servern
Q6 WLT Umweltindikatoren Extraktion der gewünschten Indikatoren von semistrukturierten Web-Dokumenten wie beispielsweise die Luftgüteberichte der Stadt Wien. Diese Web Scraping Funktion wird als Erweiterung der von WLT entwickelten Inscriptis.org Open Source Bibliothek implementiert. Statistical Public Nein None CSV M3-28 Nein Mittel WP2 Stored via the webLyzard platform (see Q1) webLyzard Arno Scharl scharl@weblyzard.com
Q7 NAST Route chains Surveys of route chains of anonymous individuals at MO.Point Stations or events Aggregated Data Not Public Nein None SHP Nov.23-Jun.26 Ja Hoch AP 2.2, AP 3.2 Redundante Systeme auf NAST-Server (Online-Server) nast consulting Daniel Elias elias@nast.at 0043 676 88 62 78 004

Datenmanagementplan - Methodenbeschreibung

M_ID Subprojekt ID Quellen ID's Titel Textbeschreibung Methodenart Methodenreferenz Öffentlich verfügbar
M1 Q1 Apache Strom A distributed Web crawler will collect and update Web pages to be added to the KI.M content repository. We will use the Java-based open-source Apache Storm Crawler to perform this task (released under the terms of the ASF 2.0 License), using bandwidth limits to minimize the resulting load on third-party servers. Extraktion Nein
M2 Q1 Harvest To collect forum and social media data we will use the Harvest open-source application (Apache 2.0 license) developed jointly by MOD, WLT and FH Graubünden; and setup bandwidth and thread limits Extraktion Ja
M3 Q1 Transformers models We will use Transformer models for generating NLP annotations for the Knowledge Graph. AI Training Nein
M4 Q1-Q7 (all) Graph Neural Networks We will use graph PyTorch graph neural network libraries for mobility predictions. AI Training Nein
M5 Q3, Q4 Mobilitätsdaten Datenexport von MOQO-Plattform und NAST-Server via CSV-Downloads Auswertung, Verschneidung Nein
M6 Q7 Mobilitätsdaten The VeStat system will be used with a multi-client/server topology with trajectory analysis. Auswertung, Verschneidung Nein
M7 Q6 Inscriptis A layout-aware extraction of information from HTML based on page structure using our own developed Inscriptis Web crawler, which is available under an open source license. Extraktion Ja
M8 Q5 Weather Processing Aufbauend auf den Rohdaten (Satelliten- und Radardaten, Blitzmessungen und Wetterstationsdaten) werden unterschiedliche Algorithmen zur Reanalyse (z.B. VERA – Vienna Enhanced Resolution Analysis) sowie zur Prognose (numerisches Wettermodell RACE und UCM – UBIMETs eigens entwickelte Vorhersagemodelle) und Downscaling (MOS - Model Output Statistics) eingesetzt. Auswertung, Verschneidung, statistische Methoden Nein
M9 Q1-Q7 (potenziell) Data Space Komponenten/Schnittstellen Die Anbindung an nationale Data Spaces und die Systeme von Bedarfsträgern sowie die Bereitstellung von Datendiensten wird über (i) den EDS Connector, (ii) bestehende Anbindungen der Projektpartner an den nexyo Data Hub und (iii) die webLyzard REST API ermöglicht werden. Daten-Integration/Verschneidung Nein

Datenmanagementplan - Ergebnisbeschreibung

E_ID Methoden ID's Subprojekt ID Titel Textbeschreibung Datenart Datenformat Öffentlich verfügbar Voraussichtliches Erstellungsdatum Räumliche Auflösung Zeitliche Auflösung Link zu Daten Vorhaltezeitraum Qualitätsbeschreibung Nutzungsbedingungen Organisation Ansprechperson E-Mail Telefonnummer
E1 M1, M2 KI.M Knowledge Graph We will analyse the collected Web sources (Q1) through NLP, NER, NEL and relation extraction to build and evolve an RDF-based knowledge graph - incl. lexical knowledge (translations, word senses, part-of-speech, descriptions), key concepts (and statistical metrics on their mentions), as well as named entities with a rich set of metadata (persons, organizations, geographic locations and events). Aggregated Data Knowledge Graph (RDF) Nein 31.5.2024 Austria regelmässig aktualisiert MOD Lyndon Nixon nixon@modultech.eu
E2 M1-9 (potenziell) Infografiken/ Visualisierbare Projektergebnisse Visualisierbare Projektergebnisse oder Infografiken, die im Projektzusammenhang entstehen, werden in einer anonymiserten/aggregierten Form und mit Zustimmung der Projektpartner verwendet, um den sozio-ökonomischen Mehrwert des Projektes in das Netzwerk innerhalb Österreichs Digitalwirtschaft zu kommunizieren. Aggregated/Anonymzed Data Various Ja 30.6.2026 various Various DIO Lisa Kolar lisa.kolar@dataintelligence.at
E3 M6 Mobilitätsdaten The results of the GDPR-compliant VeStat camera surveys of route chains of anonymous individuals at MO.Point Stations or Events will be presented on digital background maps. The data format for the results of the quantitative surveys will be defined in WP2 bearing in mind standard vector formats such as SHP, DXF or DWG among others in order to provide potential sharing opportunities. Aggregated Data Various Nein 30.6.2026 Vienna one time analyze nast consulting Daniel Elias elias@nast.at 0043 676 88 62 78 004
E4 M8 historische Wetterzeitzeihen, Reanalysen Reanalysen beschreiben durch die Verschneidung einer Vielzahl von Datenquellen den IST-Zustand der Atmosphäre in der Vergangenheit. Darauf aufbauend können Korrelationsanalysen mit meteorologischen Ereignissen und Parametern durchgeführt werden. Aggregated Data Various Nein 31.8.2025 various various
E5 M5 Mobilitätsdaten Aufbauend auf den Analysen der unterschiedlichen Eingangsvariablen sollen bestehende Shared-Mobility Angebote besser ausgelastet und zusätzliche Angebote effizienter konzipiert werden können. Aggregated Data Various Nein 30.6.2026 Standortbezogen Intervall MO.Point Stefan Melzer stefan.melzer@mopoint.at

Datenmanagementplan - Ergänzende Projektbeschreibung

1 AI-CENTIVE www.aicentive.eu
Kooperation mit anderen Projekten Projektname: Webseite: E-Mail
1 webLyzard dashboard www.weblyzard.com/visual-analytics-dashboard
Operative Ergebnis- und Datenverwendung Anwendung: Link: E-Mail