Buchtipp

Letzter Tipp: Lernen kann jeder

Die Eloquenz der Computer

Publiziert am 9. März 2026 von Matthias Zehnder

Im November 2022 veröffentlichte OpenAI eher beiläufig ein kleines Forschungsprojekt. Es war keine grosse Sache, ein «low-key research preview»: Das war ChatGPT. Die Firma veröffentlichte dazu nicht einmal eine Pressemitteilung. Doch das System schlug ein wie eine Bombe. Innert fünf Tagen hatte ChatGPT eine Million Nutzerinnen und Nutzer. Über Nacht mauserte sich ChatGPT vom Experiment zum kulturellen Phänomen. Plötzlich beschäftigte sich die breite Öffentlichkeit mit zentralen Fragen der Sprachphilosophie: Was ist Sprache? Warum kann eine Maschine fliessend schreiben, erklären, dichten und programmiern? Und: Heisst dass, dass sie denken kann? Johannes Oster, KI-Ingenieur und Dozent an der Technischen Universität Wien, widmet sich in diesem Buch diesen Fragen. Er schaut hinter die Fassade von ChatGPT und fragt, was macht Sprachmodelle so wirkungsmächtig macht, wie sie technisch funktionieren und welche gesellschaftlichen Konsequenzen ihre rasche Verbreitung mit sich bringt. Er schaut aus drei Perspektiven auf die Fragen: Er blickt von aussen auf die Geschichte und gesellschaftliche Bedeutung der KI, er nimmt das Innere und die technischen Grundlagen unter die Lupe und schaut schliesslich auf das grosse Ganze: auf Machtfragen, Risiken und geopolitische Dynamiken. Das Buch, sagt er selbst, will keine zukunftssichere Enzyklopädie sein, sondern eine «Weitwinkel-Momentaufnahme». Jetzt ein Buch über grosse Sprachmodelle zu verfassen, dass sei wie ein «Versuch, ein Aquarellbild eines Sonnenuntergangs vom Dach eines fahrenden Zuges zu malen», schreibt Johannes Oster. Er erklärt in seinem Buch die technische Zusammenhänge mit gut verständlichen Beispielen. Nach der Lektüre verstehen Sie besser, warum Sprachmodelle gleichzeitig so fähig und so fehleranfällig sind.

PDF-Version

Den Ausgangspunkt von Osters Darstellung bildet der Traum von sprechenden, denkenden Maschinen. Er ist so alt wie die menschliche Vorstellungskraft selbst. Schon im antiken Griechenland gab es die Idee künstlich erschaffener Wesen. Den modernen wissenschaftlichen Rahmen dafür schufen John McCarthy, Marvin Minsky und Kollegen im Sommer 1956 auf dem legendären Dartmouth-Symposium, wo der Begriff «Artificial Intelligence» geprägt wurde. Was folgte, waren Jahrzehnte des Wechsels zwischen überschwänglichem Optimismus und enttäuschten Erwartungen. Die Folge war ein langer «KI-Winter», in dem Forschungsgelder versiegten und die Disziplin in Nischenrollen gedrängt wurde.

Den Durchbruch brachten erst die 2010er-Jahre: Rasant gestiegene Rechnerleistung und grössere Datenmengen machten endlich Deep Learning möglich. Und dann kam es im November 2022 zu jenem Moment, der alles veränderte: ChatGPT ging online. Oster beschreibt, wie OpenAI das System zunächst als unscheinbare Forschungsvorschau lancierte und wie es innerhalb weniger Tage Millionen von Nutzerinnen und Nutzern anzog. Sie schrieben damit Gedichte, formulierten E-Mails, generierten Code oder spielten schlicht damit herum. Die zentrale Erkenntnis, die sich dabei aufdrängte: Nahezu jedes Problem, das in Sprache ausgedrückt werden kann, lässt sich auch in Sprache lösen.

Im technischen Kernteil des Buches erklärt Oster, was hinter dieser scheinbaren Magie steckt. Ein Sprachmodell ist im Kern ein mathematisches Werkzeug, das eine einzige Aufgabe löst: Gegeben eine Folge von Wörtern – genauer: von «Tokens», also von kleinsten Sprachbausteinen –, berechnet es die Wahrscheinlichkeit, welches Token als nächstes folgen wird. Alles, was Sprachmodelle tun – erklären, argumentieren, dichten, übersetzen –, wird auf diese eine Operation reduziert. Oster macht diesen abstrakten Mechanismus mit einem einfachen Gedankenexperiment greifbar: Wer nur zwei Sätze kennt – «Die Katze sitzt auf der Matte» und «Die Katze sitzt auf der Wiese» –, kann für jedes folgende Wort eine Wahrscheinlichkeit berechnen. Aus Millionen solcher Kontexte entsteht dann das, was wir als Sprachverständnis wahrnehmen.

Faszinierend ist dabei, wie Oster die sogenannte «distributionelle Hypothese» erklärt: Wörter erhalten ihre Bedeutung nicht durch eine Definition, sondern durch den Kontext, in dem sie vorkommen. Ein «Hund» ist etwas, das Futter frisst, gestreichelt wird und bellt. Die Bedeutung des Wortes ergibt sich aus der Nachbarschaft der Wörter, in denen er auftaucht. Sprachmodelle kodieren diese Nachbarschaftsbeziehungen in hochdimensionalen Vektorräumen. Das sind «Karten der Bedeutung», auf denen «Hund» und «Katze» eng beieinanderliegen, weit entfernt von «Raumschiff». Eine berühmte Konsequenz dieses Ansatzes: König minus Mann plus Frau ergibt, erstaunlich präzise, Königin.

Den Trainingsprozess beschreibt Oster in zwei Phasen. Im «Pre-Training» wird das Modell mit gewaltigen Textmengen konfrontiert. Heute ist es das gesamte öffentlich zugängliche Internet, wissenschaftliche Abhandlungen, Bücher, Webseiten, insgesamt rund eine Billion Tokens, was Oster anschaulich mit über zweihundert gefüllten Schiffscontainern vergleicht. Das Modell lernt, das nächste Wort vorherzusagen, und verinnerlicht dabei die Logik, Struktur und den Rhythmus menschlicher Sprache. Das Ergebnis dieser ersten Phase ist jedoch ein sogenannter «stochastischer Papagei»: linguistisch brillant, aber unfähig, ein nützliches Gespräch zu führen. Erst das «Post-Training» mit menschlich bewerteten Antworten und Reinforcement Learning verwandelt den Textvervollständiger in einen Assistenten.

Dabei beschreibt Oster auch, was Sprachmodelle nicht können. Das Phänomen der «Halluzinationen»., also erfundene Fakten, fingierte Quellen, selbstsichere Falschaussagen, erklärt Oster nicht als Fehler im System, sondern als dessen Konsequenz: Das Modell kennt keine Repräsentation von Unsicherheit. Ein falsches Token wird zur feststehenden Prämisse der nächsten Vorhersage, der Fehler zementiert sich in die Erzählung. «Das Sprachmodell wird zum ultimativen Sophisten», schreibt Oster, also einem Meister der Rhetorik, dem das Verständnis von Wahrheit fehlt. Ebenso scheitern Modelle verlässlich an scheinbar trivialen Aufgaben wie dem Zählen von Konsonanten, weil solche Operationen symbolische Manipulation erfordern, die ausserhalb des statistischen Mustererkennens liegt.

Im letzten Teil wendet sich Oster den grossen gesellschaftlichen Fragen zu. Die ökologischen Kosten sind erheblich: Das Training eines einzelnen grossen Sprachmodells verbraucht so viel Energie wie eine Kleinstadt in einem Jahr, das Kühlwasser eines mittelgrossen Sees. Die Machtfrage ist ebenso drängend: Wer kontrolliert die Daten, die in ein Modell einfliessen? Welche kulturellen Prägungen werden durch das Training weitergegeben? Oster zeigt, dass jedes Sprachmodell ein Produkt seiner Schöpfer ist – deren Werte, blinde Flecken und Prioritäten werden unweigerlich in die Parameter eingeschrieben. Dazu kommt das Urheberrechtsdilemma: Grosse KI-Firmen haben Millionen geschützter Werke für ihr Training verwendet, ohne Lizenzen erworben zu haben – ein ungelöster rechtlicher Konflikt, dessen Ausgang die Kreativwirtschaft grundlegend verändern könnte.

Geopolitisch zeichnet Oster ein klares Bild: Die USA dominieren mit privaten Investitionen von über 109 Milliarden Dollar im Jahr 2024, zwölfmal so viel wie China. Doch der Abstand schrumpft. Chinesische Modelle wie DeepSeek haben die angebliche Überlegenheit der US-Giganten in Frage gestellt und mit erheblich effizienteren Trainingsmethoden für Überraschungen gesorgt. Die Methoden wurden teilweise als direkte Antwort auf westliche Hardware-Exportkontrollen entwickelt. Europa hinkt weit hinterher, versucht aber mit dem EU AI Act, wenigstens regulatorisch globale Standards zu setzen.

Johannes Osters Einführung in die grossen Sprachmodelle ist technisch redlich, ohne den Leser mit Formeln zu erschlagen. Was besonders gelingt, ist die Verbindung von mechanischer Erklärung und gesellschaftlicher Einordnung. Oster belässt es nicht bei der Frage, wie Sprachmodelle funktionieren, er fragt auch, wem sie gehören, wen sie bevorzugen und was sie kosten. Das Buch blickt damit über den Tellerrand der rein technischen Betrachtung hinaus.

Für Leserinnen und Leser, die verstehen wollen, womit sie es täglich zu tun haben, wenn sie ChatGPT, Gemini oder Claude nutzen, bietet das Buch einen guten Einstieg. Es setzt keine Vorkenntnisse voraus, bloss intellektuelle Neugier. Sicher ist: Nach der Lektüre dieses Buchs lesen sie die nächste Antwort eines Sprachmodells mit anderen Augen.

Johannes Oster: Die Eloquenz der Computer. Macht, Magie und Mechanik. Picus, 72 Seiten, 18.50 Franken; ISBN 978-3-7117-3038-1

Erhältlich ist das Buch hier: https://www.biderundtanner.ch/detail/ISBN-9783711730381

Eine Übersicht über sämtliche Buchtipps finden Sie hier: https://www.matthiaszehnder.ch/buchtipp/

Basel, 09.03.2026, Matthias Zehnder

PS: Wenn Sie keinen Buchtipp mehr verpassen möchten,   abonnieren Sie meinen Newsletter. Dann erhalten Sie jede Woche:

  • den neuen Sachbuchtipp
  • den aktuellen Buchtipp
  • den Hinweis auf den Wochenkommentar
  • das aktuelle Fragebogeninterview

Nur dank Ihrer Unterstützung ist der Buchtipp möglich. Herzlichen Dank dafür!