Big Data Sammler und Analysten halten sich vor den Wahlen meist zurück, gemäß der Devise von Mark Twain „Prognosen sind schwierig besonders wenn sie die Zukunft betreffen“. Nach der Wahl sind sich aber Partei- und Marketingstrategen einig, daß ihre Kampagnen die Wahl entscheidend beeinflusst haben. Man möchte ja seine Dienste bei der nächsten anstehende Wahl wieder verkaufen. Was weiß man im Internet eigentlich über uns?
Alice Greschkow weist in ihrem Blog Alice in Wonderland auf zwei Methoden zur Erstellung von Persönlichkeitsprofilen aus Facebook Daten hin. Die Systeme wurden an der University of Cambridge entwickelt und eignen sich für einen Selbsttest. Bei beiden Systemen muss man in Facebook das Profile und die Like Daten offenlegen oder angeforderte Daten eingeben.
Magic Sauce kann aus meinen minimalen Facebook Aktivitäten – ich „Like“ offensichtlich zu wenig – keine vernünftigen Schlussfolgerungen ziehen:
Response to Facebook Account: Sorry, we are unable to generate a prediction. An insufficient number of your Likes match with those in our database, and we don’t believe in guesswork. Please take our take more psychometric tests if you would still like to receive scientific feedback on your traits. Thanks!
Interessanter ist da das System Predictive World (Chrome Browser benutzen!). Das System stellt zunächst fest, daß meine Facebook Daten nicht ausreichen. Gibt man dann aber einige wenige Daten ein, erstellt Predictive World ein umfangreiches Profil. Offensichtlich nutzt dieses System nicht nur Facebook Daten sondern auch allgemeine Daten aus dem Web wie z.B. Alter, Wohnort usw. Zunächst werden aus den Ortsdaten (IP Adresse) allgemeine Statistikwerte abgeleitet – wie z.B. Einkommen (das macht die Schufa auch), Wahrscheinlichkeiten für Unfall, Einbruch etc. Das schafft Vertrauen. Positiv stimmt meine prognostizierte Lebenserwartung von 99 Jahren bei einem angenommenen Bierkonsum von 10 Flaschen pro Woche. Da kommen schon Zweifel auf – ich trinke lieber Wein. Überrascht ist man dann doch, dass das System meine Körpergröße und meine Gewicht ziemlich genau weiß. Meine Frau ist sicher beruhigt, liegt doch die Wahrscheinlichkeit einer Trennung unter 1%.
Der Anteil der richtigen Werte liegt ingesamt etwa bei 50%. Dieser Wert ist wahrscheinlich notwendig um über die Vertrauensschwelle beim Kunden solcher Psychogramme zu kommen. Die Kunst besteht darin, simple und komplexe Attribute gekonnt zu mischen. Komplexere Attribute sind meist falsch oder sind so allgemein, daß man daraus wenig über mein Verhalten aussagen kann.
Der Stand der Technik scheint mir aber ähnlich wie bei anderen Big Data Auswertungen zu sein. Die Methoden und Verfahren zur systematischen Auswertung von persönlichen Daten sind bereits auf hohem Stand. Es fehlen aber zuverlässige Daten über komplexe Verhaltensmuster. Je mehr Prozesse aber automatisiert werden, desto mehr detaillierte Daten fallen an und können dann analysiert werden. Selbst wenn man wie ich nur wenig persönliche Daten ins Netz gibt, werden durch den Beruf und durch Freunde und Geschäftspartner immer mehr Daten für die Analyse im Netz auftauchen. Man wird sich dagegen kaum wehren können. Bei jedem „Like“ sollte man sich aber überlegen, wie das von automatischen Analyseprogrammen ausgewertet wird.
Gegen die Datenflut wird man sich als Einzelner kaum wehren können. Zum Schutz der Bürger sollte aber die Nutzung von persönlichen Daten in einer freien Gesellschaft eingeschränkt werden (ähnlich wie der Gebrauch von Waffen).
Du muss angemeldet sein, um einen Kommentar zu veröffentlichen.