Beweisen Sie, dass Sie ein Mensch sind!

Der Streit um UKW ist das falsche Schlachtfeld >
< Was ich als Mann zu einer geschlechtergerechten Sprache zu sagen habe

Übersicht >

Publiziert am 28. Mai 2021 von Matthias Zehnder

Wie oft haben Sie im Internet schon bestätigen müssen, dass Sie kein Roboter sind? Früher mussten Internetbenutzer:innen dafür verzerrte Buchstaben entziffern. Heute geht es meistens darum, auf kleinen Bildern Motorradfahrer, Fussgängerstreifen oder Schulbusse zu erkennen. Doch die Rätsel werden immer schwieriger. Denn Computer haben stark dazugelernt: Beim Erkennen von Buchstaben sind sie den Menschen längst weit überlegen. Entsprechend wird es immer schwieriger, zu beweisen, dass Sie ein Mensch sind. Das ist nicht nur unangenehm im Einzelfall, es hat weitreichende Konsequenzen für die Medienwelt – und die medialisierte Welt des Digitalen.

Die kleinen Bilderrätsel im Internet kennen Sie sicher: Meist muss man auf neun Bilder alle Fussgängerstreifen oder alle Lichtsignale anwählen und so bestätigen, dass man kein Roboter ist. «Captcha» heisst diese Technik. Das ist eine Abkürzung für «Completely Automated Public Turing tests to tell Computers and Humans Apart» – also etwa: «Komplett automatischer, öffentlicher Turing-Test, um Computer und Menschen voneinander zu unterscheiden». Und genau das soll das kleine Bilderrätsel leisten: Es soll verhindern, dass sich Computer als Menschen ausgeben, sich in eine Website einloggen und zum Beispiel automatisiert Kommentare hinterlassen.

Der angesprochene Turing-Test ist der berühmteste Intelligenztest für Maschinen. Die Idee dazu stammt vom britischen Mathematiker Alan Turing, einem Wegbereiter der Kryptotechnik und der Informatik. Turing hat von 1912 bis 1954 gelebt. Er war während des Zweiten Weltkriegs im berühmten Bletchley Park einer der führenden Wissenschaftler, denen es gelang, die deutsche Verschlüsselungsmaschine Enigma zu knacken. 1952 wurde Turing wegen seiner Homosexualität zur chemischen Kastration verurteilt. Zwei Jahre später hat er sich tief deprimiert umgebracht. Turing schlug vor, die Frage, ob eine Maschine «denken» könne und also intelligent sei, zu ersetzen durch die Frage, ob sie sich in einem Spiel so bewähren könne, dass es für einen beteiligten Menschen nicht zu entscheiden sei, ob es sich bei der Maschine um einen Menschen oder um einen Computer handle. Konkret funktioniert das so, dass eine Maschine A und ein Mensch B mit einem Beobachter C chatten. Natürlich nur über die Tastatur, es gibt weder Sicht- noch Hörkontakt. C versucht nun herauszufinden, welcher von den beiden Teilnehmern, A oder B, die Maschine ist. Wenn C auch nach längerer Befragung nicht sagen kann, ob A oder B die Maschine ist, gilt der Turing-Test für die Maschine als bestanden.

Texterkennung per Roboter-Test

Die kleinen Captcha-Rätsel kehren die Situation quasi um: Am anderen Ende sitzt ein Computer, der entscheiden muss, ob auf unserer Seite der Leitung ein Mensch oder ein anderer Computer sitzt. Der Test gilt als bestanden, wenn der Computer auf «Mensch» entscheidet. Die Idee, einen automatisierten Test zu verwenden, um zu prüfen, ob der Benutzer einer Website wirklich ein Mensch ist, geht auf die 90er-Jahre zurück. Damals war AltaVista die wichtigste Suchmaschine im Internet. AltaVista betrieb die erste grosse Datenbank mit Links und Websites. Allerdings wurde diese Datenbank bald missbraucht: Spam-Roboter meldeten im grossen Stil Werbelinks und bösartige Internetadressen. AltaVista entwickelte deshalb das erste Captcha: Wer eine Webadresse anmelden wollte, musste den stark verzerrten Text in einer kleinen Grafik lesen und ins Textfeld darunter eintippen. Computer waren dazu in den 90er-Jahren nicht in der Lage – ergo war, wer den Text richtig eingab, ein Mensch.

Die verzerrten Textbilder verbreiteten sich rasch im Internet. Yahoo! konnte mit ihrer Hilfe zum Beispiel unterscheiden, ob es ein Mensch oder ein Bot war, der da einen Mailaccount registrieren wollte. Der Texterkennungstest machte sich zu nutzen, dass das Gehirn von uns Menschen darauf trainiert ist, die Welt aus den unmöglichsten Winkeln zu sehen. Text kann schief, krumm, verzerrt und ausgebleicht sein und es können sogar Buchstaben fehlen. Trotzdem schaffen wir es, das Wort zu lesen, weil wir meistens eine Vorstellung davon haben, was der Text bedeuten könnte. Menschen sind also richtig gut im Erkennen von Text.

Bald lösten Millionen von Menschen die kleinen Texträtsel im Internet, um als Mensch anerkannt zu werden und sich auf einen Webdienst einloggen zu können. Das brachte den Informatiker Luis von Ahn auf die Idee, diese Arbeitsleistung zu nutzen. In den 2000er-Jahren entwickelte er deshalb «reCaptcha». Der neue Test bestand aus zwei Wörtern: einem verzerrten Wort, das der Computer kannte, und einem verzerrten Wort aus einem Texterkennungsprozess, das der Computer nicht kannte. Auf diese Weise wollte von Ahn die Arbeitsleistung der Menschen nutzen, die sich dem Test unterzogen. Mit durchschlagendem Erfolg: Mit dem System waren 2009 innert weniger Monate 20 Jahrgänge der «New York Times» digitalisiert.

Der grosse Haken im System

2009 kaufte Google reCaptcha. Seither helfen die menschlichen Rätsellöser:innen dabei, den optischen Datenbestand von Google zu digitalisieren. Weil reCaptcha auf Tausenden von grossen Websites installiert war und deren Benutzer:innen jeden Tag Dutzende Millionen Rätsel lösten, digitalisierte Google mit deren Hilfe bis 2011 das gesamte Google-Books-Archiv und 13 Millionen Artikel aus dem Archiv der «New York Times», die bis ins Jahr 1851 zurückreichten. Langsam aber sicher gingen Google die Texte aus. Also griff die Suchmaschine auf andere Bilder mit Buchstaben zurück: Strassenschilder und Hausnummern aus Google Street View etwa. Mittlerweile helfen die reCaptcha-Anwender:innen Google auch dabei, Fussgängerstreifen und Feuerwehrautos zu identifizieren und so die künstliche Intelligenz für selbstfahrende Fahrzeuge zu programmieren. Immer häufiger ist die Beschäftigung mit dem Bilderrätsel am Bildschirm aber ein frustrierender Prozess: Die Rätsel werden immer schwieriger. Die Texträtsel sind mittlerweile kaum mehr lösbar. Was ist da los? Ist das System kaputt?

Man könnte es sagen, ja. Die Menschen, die all die kleinen Texträtsel lösten, haben dem Computer dabei nämlich nicht nur geholfen, die verzerrten Buchstaben (und mittlerweile auch viele verzerrten Bilder) zu entziffern. Sie haben gleichzeitig und ohne es zu wissen auch die AI-Systeme von Google trainiert. Sie haben also die künstliche Intelligenz von Google gelehrt, verzerrte Buchstaben und Bilder zu erkennen. Schon 2014 waren die AI-Systeme von Google den Menschen im Erkennen von Text krass überlegen. Bei einem Test mit besonders stark verzerrten Wörtern erkannte der Google-Computer die Texte in 99.8 Prozent der Fälle, – die Menschen schafften nur gerade 33 Prozent. Der Computer hatte also den Menschen überflügelt: Der Test war nicht mehr in der Lage, die Menschlichkeit eines Benutzers zu überprüfen.

Computer haben die Menschen überflügelt

Das gilt mittlerweile auch für die Bilderrätsel: Der Computer ist so gut geworden im Erkennen von Hydranten, Strassenschildern oder Lichtsignalen (und übrigens auch im Aussortieren von Schweinen, Katzen oder Hunden), dass die Tests nicht mehr funktionieren. Das heisst (noch) nicht, dass der Computer jeden Menschen überflügelt. Es liegt auch an der Natur der Tests: Sie sollen so einfach sein, dass jeder Mensch ohne Vorbildung und ungeachtet von Sprache, Herkunft oder kulturellem Kontext sie lösen kann. Das geht fast nur mit Texterkennung und Bilderrätseln – und genau darin ist der Computer sehr gut. Anders gesagt: Das Problem ist nicht nur, dass Computer extrem viel besser geworden sind im Erkennen von Bildern und Buchstaben – das Problem ist auch, dass der durchschnittliche Mensch darin limitierte Fähigkeiten hat.

Google und das reCaptcha-Team haben das Problem inzwischen mit einer neuen Version ihres Tests gelöst: reCaptcha V3 arbeitet nicht mehr mit Rätseln, sondern beobachtet die Benutzer:innen einer Website im Hintergrund und analysiert, wie sie sich auf der Website so verhalten. Wenn die Maus sich langsam auf dem Bildschirm bewegt und die Buchstabeneingaben stockend erfolgen, dann ist es wahrscheinlich ein Mensch. Im Hintergrund arbeitet dafür ein Javascript-Program, das Webentwickler auf ihrer Website einbauen können. Das Script bewertet die Wahrscheinlichkeit, ob es sich beim Besucher um einen Roboter oder einen Menschen handelt, auf einer Skala von 0 bis 1. Je höher der Wert, desto eher handelt es sich um einen Menschen. Der Anbieter kann den Grenzwert für seine Besucher:innen selber festlegen.

Verhaltensbeobachtung statt Bilderrätsel

Die neue Version reCaptcha V3 beseitigt vielleicht das Problem der unscharfen Schulbusfotos in den Bilderrätseln. Das grundsätzliche Problem, dass es online immer schwieriger ist, Menschen und Roboter voneinander zu unterscheiden, bleibt aber. Und das betrifft nicht nur die kleinen Eintrittsformulare. Die Zahl der maschinell erstellten Facebook-Profile zum Beispiel explodiert – ich erhalte jeden Tag «Freundschaftsanfragen» von jungen Frauen mit so fantasievollen Namen wie Ingeborg Kielholz Hellmuth, Elsbeth Mannheim Kadelburg oder Eva Kästner Jonas – Bots, die meist für Sexangebote werben. Wer im Internet per Tastatur mit jemandem plaudert, kann sich heute nicht mehr sicher sein, dass es sich um einen Menschen handelt. Wenigstens auf Englisch und auf Deutsch nicht: Wenn Sie sicher sein wollen, chatten Sie auf Schweizerdeutsch. Das beherrschen die Roboter nicht. Oder besser: Noch nicht. Mehrere Schweizer Hochschulen arbeiten an Spracherkennungssystemen für Schweizer Dialekte. Wenn sie Erfolg haben, werden Sprachassistenten wie Alexa und Siri künftig auch Anweisungen auf Schweizerdeutsch entgegennehmen – und es wird nicht lange gehen, bis auch die Roboter im Internet Schweizerdeutsch beherrschen.

Wie also lassen sich künftig im Internet Menschen und Computer voneinander unterscheiden? Die Antwort wird sehr schwierig. Denn jeder Kontakt im Netz ist ein medialisierter Kontakt. Ob per Mail, Chat, Voicemail oder Videotelefonie – es sind immer Zeichen, Töne und Bilder, die per Internet übertragen werden. Ob die von einem Menschen oder einem Computer stammen, lässt sich immer schwieriger unterscheiden. Vor allem wir Menschen sind anfällig für Täuschungen. Google hat schon länger ein System namens «Google Duplex» vorgestellt, das automatisch per Telefon Termine bei einem Coiffeur oder einen Tisch in einem Restaurant bestellen kann – und zwar so, dass das Gegenüber nicht merkt, dass es mit einer Maschine redet. Auch hier: noch funktioniert das nur auf englisch. Aber es ist nur eine Frage der Zeit, dass Google Duplex auch andere Sprachen beherrscht.

Wie können wir von Zukunft Menschen und Computer voneinander unterscheiden? Die Antwort dürfte lauten: Es wird eine Zeit kommen, da das nur noch in der Realität möglich ist. Im Internet können sich Roboter als Menschen ausgeben, – wenn einem eine Maschine aus Metall und Gummi gegenübersteht, ist das nicht möglich. Noch nicht – und wohl noch länger nicht. Ich bin deshalb sicher, dass in der Geschäftswelt und vor allem in der Politik, wo Vertrauen besonders wichtig ist, persönliche Treffen nach der Coronakrise wieder wichtig sein werden. Das World Economic Forum, die Konferenzen der G7 oder die EU-Konferenzen, aber auch Messen wie die Art Basel oder der ganz normale Business-Lunch werden deshalb wieder aufleben. Das hat auch etwas Tröstliches: Die Digitalisierung führt dazu, dass die reale Gegenwart von Menschen wieder wichtig wird.

Basel, 28. Mai 2021, Matthias Zehnder mz@matthiaszehnder.ch

PS: Nicht vergessen – Wochenkommentar abonnieren. Kostet nichts, bringt jede Woche ein Mail mit dem Hinweis auf den neuen Kommentar und einen Buchtipp. Einfach hier klicken. Und wenn Sie den Wochenkommentar unterstützen möchten, finden Sie hier ein Formular, über das Sie spenden können.

PPS: Wenn Sie den Wochenkommentar hören möchten, finden Sie hier eine Hörversion (noch im Experimentalstadium):

Quellen

Meirem Guerar et al: Gotta CAPTCHA ’Em All: A Survey of Twenty years of the Human-or-Computer Dilemma. 2021: University of Genoa, Italy; https://arxiv.org/pdf/2103.01748.pdf

James O’Malley: Captcha if you can: how you’ve been training AI for years without realising it. 12.01.2018: «Techradar.com»; https://www.techradar.com/news/captcha-if-you-can-how-youve-been-training-ai-for-years-without-realising-it

Josh Dzieza: Why Captchas Have Gotten So Difficult. Demonstrating you’re not a robot is getting harder and harder. 01.02.2019: «The Verge». https://www.theverge.com/2019/2/1/18205610/google-captcha-ai-robot-human-difficult-artificial-intelligence

Vinay Shet: Street View and reCaptcha technology just got smarter. 16.04.2014: Google Security Blog. https://security.googleblog.com/2014/04/street-view-and-recaptcha-technology.html

Rugare Maruzani: Are You Unwittingly Helping to Train Google’s AI Models? How Google is using your reCaptcha entries to train machine learning models. 26.01.2021: «Towards Data Science»; https://towardsdatascience.com/are-you-unwittingly-helping-to-train-googles-ai-models-f318dea53aee

Schreiben Sie einen Kommentar Antworten abbrechen

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.