Immer wieder stehe ich vor dem Problem, Menschen meinen Beruf zu erklären. Ich bin Data Scientist – Data was? Und was machst du da den ganzen Tag? Und was ist daran so schwierig – macht das der Computer nicht von alleine? Es heißt ja nicht umsonst „Künstliche Intelligenz“? In Zukunft werde ich dank diesem Buch hoffentlich bessere Antworten parat haben.
Titel: Ein Algorithmus hat kein Taktgefühl von Katharina Zweig
Genre: Sachbuch (aus der Kategorie: Was zur Hölle mache ich auf der Arbeit eigentlich den ganzen Tag?)
Verlag: Heyne
Seiten: 320
Katharina Zweig weiß aus ihrem eigenen Lebenslauf was es bedeutet, zwischen Informatikern und Nicht-Informatikern zu vermitteln. Genau darin liegt auch die Stärke dieses Buchs. Mit anschaulichen Beispielen und meist sinnvollen Illustrationen erklärt Zweig, wo die Faszination in der Arbeit mit Computern, Algorithmen und Formeln liegt, und an welchen Stellen Vorsicht geboten ist. Selbst ich (einigermaßen tief in der Materie) hatte Spaß beim Lesen und habe noch Dinge dazu gelernt. Die Kapitel sind sinnvoll getrennt und werden mit passenden Einleitungen in den richtigen (oftmals nicht ganz trivialen) Kontext gesetzt. Vor allem aber wurden mir mit Zweigs Erläuterungen, Beschreibungen und Beispiele Wege aufgezeigt, wie ich die komplexen Prozesse, mit denen ich mich tagtäglich beschäftige, in Zukunft vielleicht klarer kommunizieren kann.
Neben den fachlichen Einführungen und Definitionen, die ein solches Buch einfach braucht, waren für mich folgende Aspekte besonders wichtig zu lesen: In den meisten Fällen, in denen diskutiert wird, ob Algorithmen und Data Science eingesetzt werden soll, ist es vor allem wichtig, über die Daten und die Operationalisierung wichtiger (Ziel-)Konzepte sowie der Fehlerrate zu diskutieren, und nicht über den Algorithmus selbst. Der ist oftmals zu vernachlässigen und so gesehen nur eine weitere Variable, die es zu optimieren gilt. Zweig greift diese Punkte auf und gibt Beispiele, was falsche Operationalisierungen oder unpassende Fehlerraten im konkreten Fall anrichten können. Natürlich deckt das Buch nicht alle Möglichkeiten, nicht alle Formeln ab (dazu gibt es schließlich uns Data Scientists und Statistiker:innen), aber es bietet eine Checkliste mit relevanten Entscheidungen, die von allen Involvierten zumindest kritisch hinterfragt und zu denen Erklärungen angefordert werden können.
Die Algorithmen, oder besser: die Entscheidungssysteme, sollten den Menschen als Unterstützung dienen, indem sie beispielsweise den entscheidenden Personen eine zweite Meinung anbieten. In den meisten Fällen sei der Differenzierungsgrad der Systeme dabei wesentlich höher, weil sie es schaffen, mehr Daten und Spezialfälle zu überblicken. Wichtig sei dabei vor allem, dass die Prozesse dahinter transparent gemacht würden (und dazu gehört auch das Verständnis von Konzepten wie accuracy und thresholds), sodass die Entscheidenden und die Betroffenen verstehen, „wie das System funktioniert“ (S. 260).
Ich könnte die Liste an wichtigen Punkten wahrscheinlich noch ewig weiterführen (und mein Umfeld stöhnt wahrscheinlich jetzt schon, weil ich alle fünf Minuten etwas spannendes aus dem Buch erzählen oder diskutieren möchte), aber ein paar Dinge sind mir noch wichtig hervorzuheben: Zweig macht deutlich, dass Data Scientists auch über Dinge wie Datenschutz, Inklusion und Diversität (zum Beispiel das in Frage Stellen binärer Geschlechterkonzepte und weißer/westlicher Weltanschauung) nachdenken sollen und müssen. Wir haben die Aufgabe, die Zukunft mitzugestalten, teilweise in einem nicht unerheblichen Ausmaß. Wir sollten nicht ohne zu hinterfragen nur Modelle errechnen, und wir sollten die betroffenen Menschen (die Nutzer:innen, die Bürger:innen, die Entscheider:innen) in unsere Welt mitnehmen und unsere Systeme transparent machen.
Und wer sich jetzt immer noch fragt: Was machen diese Data Scientists eigentlich den ganzen Tag? Der fragt entweder mich (und hofft auf eine verständliche Erklärung :P) oder liest dieses Buch.