Vogt am Freitag: Vernebelt

Googles KI-Zusammenfassungen in der Suche sind fehlerhaft, intransparent und bald Standard. Kolumnist Reto Vogt erklärt, was das für die Demokratie bedeutet.

Es ist kein neues Phänomen, aber dennoch ein erklärungsbedürftiges: Googles «Übersicht mit KI», englisch «AI Overviews» genannt, gibt keine faktenbasierten Antworten auf gestellte Fragen. Die Texte sind immer KI-generiert, übrigens bei jeder Suchanfrage aufs Neue, und können entsprechend Fehler und erfundene Quellen enthalten. Und zwar nicht wenige.

Eine der aktuelleren Studien zum Thema stammt vom Herbst 2025 (PDF). Zusammenfassung: Statistisch war in einer grossen Untersuchung von Mitte 2025 fast jede zweite KI-Antwort fehlerhaft. Bei der damals aktuellen Version von Googles KI-Modell – der Basis für die Übersicht mit KI – wiesen sogar drei von vier Antworten signifikante Mängel auf. Zwar entwickeln sich die Modelle rasant weiter, doch das Prinzip bleibt: Menschen sollten ihr nicht per se vertrauen und die KI-Übersicht beim Googeln gedanklich rausfiltern. Oder nicht weiter Google nutzen. Oder wenigstens bei jeder Suche «-noai» hinten anhängen. Dann erscheint die KI-generierte Übersicht nicht mehr. Aber item.

Das Problem ist nicht marginal, es kann demokratiepolitische Konsequenzen haben. Das zeigte sich zuletzt bei der Abstimmung zur 10-Millionen-Schweiz vom 15. Juni. Wer «10 Millionen Schweiz Initiative Pro Contra» oder «Nachhaltigkeitsinitiative Argumente» eingab, bekam von Google oft eine fertige Antwort. Eine Antwort, die neutral wirkt, es aber nicht ist.

Die Frage kann die Antwort bestimmen

Zwei Studien haben das systematisch untersucht. Die Agentur Feinheit stellte über fast drei Monate und mehr als 12’000 Abfragen fest: ChatGPT und Gemini neigten in ihren Antworten zur Nein-Seite, Googles KI-Übersicht zur Ja-Seite. Eine gleichzeitige Untersuchung von Algorithmwatch und der Universität Zürich analysierte über 170’000 Suchanfragen zwischen April und Juni 2026 und die Quellen hinter diesen Zusammenfassungen. Die SVP wurde von Googles KI viermal häufiger zitiert als jeweils alle anderen Parteien.

Dabei zeigt sich ein bemerkenswertes Paradoxon: Obwohl die Algorithmwatch-Studie zeigt, dass Googles KI-Übersichten Webseiten der Contra-Seite dreimal häufiger zitierten als solche der Pro-Seite, kam die Feinheit-Untersuchung dennoch zum Schluss, dass der generierte Inhalt inhaltlich zur Ja-Seite neigte. Zwei Studien, ein Paradoxon: Wer zitiert wird, bestimmt nicht zwingend, was gesagt wird.

Zwei mögliche Erklärungen dafür:

Die unterschiedliche Methodik der beiden Studien: Feinheit testete primär mit Begriffen wie «10-Millionen-Initiative» und «Nachhaltigkeitsinitiative». Algorithmwatch verwendete zusätzlich den Begriff «Chaosinitiative», den primär die Gegenseite einsetzte und der deshalb in Suchresultaten naturgemäss zu Quellen der Contra-Seite führt. Die scheinbar widersprüchlichen Ergebnisse erklären sich also zumindest teilweise durch unterschiedliche Suchbegriffe.
Die «KI-Übersicht» generiert die Texte nicht durch logisches Schlussfolgern, sondern durch statistische Wahrscheinlichkeiten. Selbst wenn die zitierten Quellen mehrheitlich der Contra-Seite entstammen, kann der generierte Text trotzdem zur Pro-Seite neigen. Das Modell reproduziert also Muster, die nichts mit den konkreten Quellen zu tun haben.

Ob das im Fall der 10-Millionen-Initiative zufällig oder systematisch geschah, lässt sich von aussen nicht beurteilen. Genau das ist das Problem. Und es gibt noch ein weiteres – die sprachlichen Ungleichheiten: Google beantwortete laut Algorithmwatch 56 Prozent der französischsprachigen Suchanfragen mit der KI-Übersicht, aber nur 33 Prozent der deutschsprachigen und 23 Prozent der italienischsprachigen. Rätoromanische Anfragen wurden oft gar als Italienisch interpretiert und entsprechend beantwortet. Wer in der Schweiz auf Französisch nach Abstimmungsinformationen suchte, bekam also mit höherer Wahrscheinlichkeit eine KI-generierte Antwort als jemand, der auf Deutsch suchte.

Aus München in die Welt?

Die Konsequenz davon? Eine mögliche Antwort findet sich in München. Das dortige Landgericht entschied kürzlich, dass Google für Falschinformationen haftbar gemacht werden kann. Noch ist das Urteil nicht rechtskräftig, und im politischen Kontext ist die Definition von «Falschinformation» eine Stufe komplexer als bei anderen Themen, dennoch wird das letztinstanzliche Urteil in dieser Causa weitreichende Wirkungen haben.

Weitreichende Wirkungen deshalb, weil Google die KI-Funktion nativ in die Suche integriert. Das nach eigenen Angaben «grösste Upgrade seit 25 Jahren». Bald sehen Userinnen und User also standardmässig KI-generierte Antworten statt einer Liste mit Links. Was heute noch eine Ergänzung ist, wird morgen die einzige Option sein. Und die Google-Suche wird, das ist die Konsequenz dieser Änderung, unzuverlässiger. Und das bleibt auf absehbare Zeit so.

KI-Halluzinationen gehören zu den Sprachmodellen wie der Wind zum Meer. Solange KI-Systeme nach dem Wahrscheinlichkeitsprinzip funktionieren, werden sie immer Dinge erfinden, die plausibel klingen, aber nicht wahr sind. Die Modelle werden zwar besser, grösser und schneller, aber die Grundmechanik bleibt. Wer das ändern wollte, müsste die Architektur von Grund auf neu denken.

Strukturelles Risiko

Fehlerhafte Antworten auf Fragen wie «wie viel Milch gibt eine Kuh pro Tag» sind das eine, die Suche nach Abstimmungsempfehlungen das andere. Wer bei politischen Fragen einer fehlerhaften KI-Zusammenfassung vertraut, trifft möglicherweise eine Entscheidung auf falscher Grundlage. In einer direkten Demokratie, in der Stimmbürger:innen regelmässig zu komplexen Sachfragen befinden, wird unregulierte KI zu einem strukturellen Risiko für die Meinungsbildung.

Disclaimer: Ich bin Vorstand von Algorithmwatch, einer der in diesem Text zitierten Organisationen.