Mobilitätsvergleich: innerdeutsch Bahn an erster Stelle (Allgemeines Forum)
Waldbahn, Sonntag, 27.04.2025, 08:47 (vor 240 Tagen)
Hallo
o2-Telefnoica hat Mobilfunkdaten (anonymisiert) ausgewertet und stellt in der Analyse fest, dass auf innerdeutschen Langstrecken - insbesondere zwischen Berlin und München - die Bahn an erster Stelle ist. Die knapp 4h Fahrzeit über die SFS schlägt das Auto (laut falk.de schnellste Route über die A9 5:09h) und das Flugzeug. https://www.schiene.de/news-8972/Bahn-gefragtestes-Verkehrsmittel-auf-innerdeutschen-La...
--
Gruß
Waldbahn
Fragezeichen
Hustensaft, Sonntag, 27.04.2025, 12:35 (vor 240 Tagen) @ Waldbahn
Rein technisch würde mich doch stark interessieren, wie man das auswerten kann, dürfen Mobiltelefone doch mindestens während der Starts und Landungen nicht online sein, mithin kann man eigentlich nur mutmaßen ...
Ähnlich bei der Bahn, beispielsweise die SFS Frankfurt - Köln oder München - Ingolstadt, die de facto direkt neben der Autobahn verlaufen, da könnte man höchstens aus der Schnelligkeit des Wechsels der Funkzelle Rückschlüsse ziehen.
Fragezeichen
JanZ, HB, Sonntag, 27.04.2025, 15:33 (vor 240 Tagen) @ Hustensaft
Das dürfte doch aber reichen, zumal wenn du mehrere hundert Handys hast, die exakt zur selben Zeit exakt dasselbe Muster zeigen.
Fragezeichen
JoeO, Braunschweig, Sonntag, 27.04.2025, 16:16 (vor 240 Tagen) @ Hustensaft
Rein technisch würde mich doch stark interessieren, wie man das auswerten kann, dürfen Mobiltelefone doch mindestens während der Starts und Landungen nicht online sein
Wenn ein Mobilgerät um 7:05 Uhr letztmalig in einer Funkzelle beim Münchener Flughafen eingeloggt ist und sich gegen 8:40 in Hamburg Fuhlsbüttel wieder einloggt, dann kann mit ausreichender Wahrscheinlichkeit davon ausgegangen werden, das Flug LH 2079 genutzt wurde.
Fragezeichen
Hustensaft, Sonntag, 27.04.2025, 19:36 (vor 240 Tagen) @ JoeO
Wenn ein Mobilgerät um 7:05 Uhr letztmalig in einer Funkzelle beim Münchener Flughafen eingeloggt ist und sich gegen 8:40 in Hamburg Fuhlsbüttel wieder einloggt, dann kann mit ausreichender Wahrscheinlichkeit davon ausgegangen werden, das Flug LH 2079 genutzt wurde.
Womit aber keine anonyme Auswertung erfolgen könnte, weil wie sollte man sonst wissen, dass das dieselben Geräte sind - und in die Funkzelle in Fuhlsbüttel können sich ja auch Neuankömmlinge mit Bus und Bahn oder aus anderen Fliegern einloggen ...
Fragezeichen
JoeO, Braunschweig, Sonntag, 27.04.2025, 22:05 (vor 240 Tagen) @ Hustensaft
Womit aber keine anonyme Auswertung erfolgen könnte, weil wie sollte man sonst wissen, dass das dieselben Geräte sind
Es sind zwei Schritte:
Zuerst eine Anonymisierung, dann eine Auswertung.
Das technisch der Handyprovider die Daten zur Erstellung eines Bewegunbgsprofils hat, das ist klar. Er kann es, darf es aber (im Normalfall) nicht erstellen.
Eine Beziehung von Datensätzen kann man aber auch anonymisiert herstellen. Das ist Standard bei anonymen Datenauswertungen.
Eine klassische Anwendung ist z.B. auch die Auswertung von Daten im zeitlichen Verlauf.
Ich erfasse 1000 individuelle Datensätze (z.B. soziologische Befragung 1000 Angestellter in einem Konzern). Diese Datensätze werden mehrfach (z.B. für 3 Jahre jeden Monat) erhoben. Es ist durchaus möglich (und üblich) den zeitlichen Verlauf jedes einzelnen Datensatzes anonym zu analysieren.
Erste Stufe - Datenerfassung (Fragebogen Fritz Meier, Fragebogen Otto Müller, Fragebogen Anna Schulz..)
Zweite Stufe - Anonymisierung (Fritz Meier -> AA01, Otto Müller -> AB02, Anna Schulz -> AC03..)
Dritte Stufe - Transfer der anonymisierten Daten zu Auswertern die keinen Zugang zur Anonymisierung haben)
Vierte Stufe Analyse der Daten (Datensatz AA01, Datensatz AB02, Datensatz AC03)
Genauso erfolgt erst eine Anonymisierung der Daten (0177-2345345 -> AAB002, 0163-3323378 -> AAC003, 0171-6633864 -> AAD004...
Herausgegeben zur Auswertung werden dann die Ort-Zeit-Datensaätze AAB002, AAC003, AAD004..
Wenn es Daten AAC003:München0705 und AAC003:Hamburg0840 gibt, dann kann das bei der Auswertung zugeordnet werden ohne einen Bezug zu einem konkreten Nutzer zu haben.
Angaben wie die Anonymisierung gewährleistet wird, werden in der Regel vorab im Datenschutzteil des Studiendesigns angegeben und können von Datenschutzbehörden überprüft werden.
Fragezeichen
gnampf, Montag, 28.04.2025, 09:01 (vor 239 Tagen) @ JoeO
wenn, wie bei dir, eine eindeutige Kennziffer vergeben wird, dann wäre das nur eine Pseudonymisierung. Erstrecht wenn aufgrund restlicher Kriterien Rückschlüsse auf die konkrete Person zu ziehen sind, wie z.B. Start und Ende der Arbeitszeit, Anzahl Kinden, Höhe Gehalt, oder im Fall der Handyüberwachung die Orte an denen man sich aufgehalten hat, incl. Häufigkeit. Hier findet man z.B: recht fix den Wohnort der Person raus, und den Arbeitsort. Darüber ist dann auch leicht ein Rückschluss auf die konkrete Person möglich.
Bei anonymisierten Werten darf so ein Rückschluss nicht zu erwarten sein, was heisst die Hürde muss min. entsprechend hoch liegen. Jeden Tag eine neue Kennziffer mag da helfen, würde aber trotzdem noch die Auswertung der Reisendenströme am Tag erlauben.
Mobilitätsvergleich: innerdeutsch Bahn an erster Stelle
JoeO, Braunschweig, Sonntag, 27.04.2025, 18:47 (vor 240 Tagen) @ Waldbahn
eine Analyse des Mobilfunkanbieters O2 Telefónica auf Grundlage anonymisierter Nutzungsdaten
Das heisst die Daten werden vor der Auswertung anonymisiert. Durch die Anonymisierung ist keine Zuordnung zu einen konkreten Nutzer möglich.
Mobilitätsvergleich: innerdeutsch Bahn an erster Stelle
Hustensaft, Sonntag, 27.04.2025, 19:29 (vor 240 Tagen) @ JoeO
eine Analyse des Mobilfunkanbieters O2 Telefónica auf Grundlage anonymisierter Nutzungsdaten
Das heisst die Daten werden vor der Auswertung anonymisiert. Durch die Anonymisierung ist keine Zuordnung zu einen konkreten Nutzer möglich.
Dass das Unfug ist, sollte allerdings bereits seit der Volkszählung 1987 bekannt sein ... Auch eine Anonymisierung von Daten bewirkt keineswegs immer, dass eine Zuordnung zu einem konkreten Nutzer auch wirklich zwangsläufig ausgeschlossen ist, schon kleine Details wie etwa das Gerät und die Version des Betriebssystems, also Daten, die gleichfalls anfallen, können da schon vollkommen ausreichen, kommen noch die installierten Apps und womöglich sogar deren Version dazu, ist das sofort eindeutig und nur im Ausnahmefall noch anonym.