DNIP Briefing #41: KI-Futter wird teurer

Die Redaktion präsentiert jeden Dienstag die Geschichten, die sie bewegt, aufgerüttelt oder zum Nachdenken angeregt hat.

Dass LLMs mit praktisch allen im Internet zugänglichen Texten trainiert werden, dürfte allgemein bekannt sein. Und es dürfte ebenso wenig überraschen, dass viele gängige LLMs auch mit Büchern trainiert werden, für welche ein Copyright besteht. Kein Wunder, haben Autor:innen in den USA gegen die Anbieter dieser LLMs Sammelklagen eingereicht. Anthropic, das Unternehmen hinter Claude, hat nun einem Vergleich zugestimmt und sich dabei zur Zahlung von 1,5 MIlliarden Dollar für Copyright-Verstösse verpflichtet. Dies entspricht rund 3000 Dollar pro Buch (das Teil der Sammelklage war). Teil des Vergleichs ist auch, dass dieser nur für bereits verwendete Bücher gilt und keine zukünftige Nutzung abdeckt.

Auch wenn dies sicher als Erfolg für die involvierten Autor:innen zu werden ist: Man muss sich auch bewusst sein, dass solche Summen nur grosse LLM-Anbieter aufbringen können. Neben Anthropic dürften das OpenAI und allenfalls xAI sein, und all die Branchengrössen wie Google, Facebook, Microsoft etc. Startups hingegen dürften es schwer haben, unter diesen Bedingungen an Trainingsmaterial zu kommen.

Inhalte

Heilsversprechen der KI-Chefs

Die WoZ hat ein Interview mit Alex Hanna und Emily M. Bender veröffentlicht, unter dem Titel «Der Hype war schon immer der Modus Operandi der KI-Forschung». Da wird erklärt, wieso Vergleiche zwischen den aktuellen Entwicklungen bei KI-Systemen (genauer: grossen Sprachmodellen, also LLMs) und dem frühen Internet irreführend sind; wieso Leute, die predigen, «die KI wird uns retten!» und die, die warnen, «die KI wird uns alle töten!» eigentlich die gleiche Geschichte erzählen; und dass nicht alle Leute mit viel Geld clever sind.

Demokratische Prozesse verstehen

Auch in der Schweiz steigt die Tendenz, mit Dekreten regieren zu wollen. Hier heisst es noch „Verordnung“, aber auch damit wird versucht mehr und mehr, die gesetzlichen Grenzen auszudehnen oder gar zu überschreiten. Watson hat ein tolles Interview mit Daniel Kübler, Professor für Demokratieforschung und Public Governance, geführt. Da erfährt man viel über den Rechtsstaat, die zur Verfügung stehenden demokratischen Mittel und wieso manche Diskussionen so aufgeladen sind. Das Interview wurde am Beispiel der geplanten Tempo-30-Verordnung des Bundesrats geführt. Es passt aber in grossen Teilen auch auf die VÜPF-Diskussion.

Wieso funktioniert eigentlich Wikipedia?

Wieso geht es nicht völlig im Chaos unter? Und wie lange klappt das noch? Das alles sind Fragen, die man sich rund um die wohl beste Informationsquelle der heutigen Zeit stellen sollte. Denn Wikipedia ist bedroht von Machtstrukturen in der globalen Politik («Golf von Mexiko» oder «Golf von Amerika», weshalb US-Anschuldigungen, z.B. zum Thema Wokeness und rund um Desinformation, immer relevanter werden.

Zwei Personen haben unabhängig voneinander in der letzten Woche versucht, die Gründe dafür zu verstehen und aufzuschreiben.

Josh Dzieza hat für The Verge einen langen, detaillierten Artikel über die Redaktionscommunity hinter Wikipedia verfasst. «Wikipedia ist widerstandsfähig, weil es langweilig ist,» so der Titel. Und wahrscheinlich ist dieses Faktenbewusstsein auch einer der Gründe, wieso Wikipedia immer noch lebt, auch wenn es inzwischen unter Druck steht. Laut Dzieza ist eines der Erfolgsrezepte sei, dass bei Disputen klare Regeln gelten.

Cory Doctorow hat sich ebenfalls der Frage angenommen, wieso Wikipedia funktioniere. Er führt es unter anderem darauf zurück, dass man nicht versuche, selbst die Fakten zu überprüfen, sondern die Faktenüberprüfung an die eigentlichen Quellen delegiere. Und dafür strikte Qualitätsprüfung der Quellen selbst vornehme.

Beide Artikel sorgen für mehr Verständnis. Hoffentlich sorgt dieses Verständnis dafür, dass wir noch lange, auf zuverlässige, offene Informationsquellen vertrauen dürfen. Auch die Wikipedia.

Das Strafe-Strafzölle-Pingpong

Die EU hat Google wegen wettbewerbsfeindlicher Praktiken eine Busse von knapp 3 Milliarden Euro auferlegt. Der US-Präsident hat in seiner unnachahmlichen Art Gegenzölle angedroht, wenn diese Busse bestehen bleibe. Übrigens hat auch das US-Justizministerium vor zwei Jahren ein Kartellverfahren gegen Google gestartet, mit dem möglichen Resultat der Aufspaltung des Internetgiganten. Das Verdikt nach zwei Jahren: Google muss ein paar Daten mit der Konkurrenz teilen; der Rest bleibt wie vorher. Die Hoffnung auf Milde scheint aufgegangen zu sein, die sich die grossen US-Unternehmen durch Spenden an Trumps Inauguration im Wert von 200 Millionen Dollar erhofften. Die Nähe der CEOs dieser Konzerne ist auf eindrückliche Weise in diesem Video zu sehen.

Infiziert eine KI alle Rechner mit Ransomware?

So lautet zumindest die aktuelle Erzählung. Die stammt aber von einigen Leuten, die übereifrig Klicks auf ihre Webseiten bringen wollen. Und (deshalb?) nicht zu genau nachgeforscht haben. Denn eine kurze Recherche (wie z. B. bei The Register) hätte gezeigt: Das ist ein Forschungsprototyp, der nur in einer genau definierten Laborumgebung funktioniert. Auch andere «KI hackt deinen Computer!»-Stories sind weit von der Realität erzeugt; einige sogar selbst KI-generiert.

Unabhängig von diesen Schlagzeilen sollte man die üblichen Sicherheitsmassnahmen auf seinen Laptops und Servern immer wieder überprüfen. Und dafür sorgen, dass man informiert wird, wenn etwas Ungewöhnliches passiert. Oder durch gute Passwörter und wenige, dafür aktuelle Software möglichst wenig angreifbar ist. Und für den Fall der Fälle wenigstens ein Ransomware-sicheres Backup hat. Das möglichst aktuell und vollständig ist, versteht sich von selbst.

Mit dem Urheberrecht gegen Sicherheitslücken

Ein Sicherheitsforscher findet gravierende Sicherheitslücken in der Software von Burger King, die unter anderem Zugriff auf die Audioaufzeichnungen aller Drive-Thru-Bestellungsgespräche ermöglichten, inklusive der automatischen KI-Bewertungen der Mitarbeitenden. Auch, ob die Mitarbeitenden genügend häufig «you rule» gesagt hätten, was scheinbar für ein Drive-Thru-Erlebnis unverzichtbar ist. Er meldet die Lücken und der Hersteller schliesst die Lücken. Daraufhin schreibt er einen Blog-Post, damit wir alle etwas davon lernen können und diese Fehler zukünftig hoffentlich vermeiden können. So weit, so normal: Tagesgeschäft im IT-Sicherheitsbusiness.

Eine von Burger King beauftragte Firma Cyble sieht das aber nicht so. Die Verwendung der Marke «Burger King» sei unautorisiert und würde die Öffentlichkeit verwirren, sogar so weit, dass diese glauben würde, das Blog sei von Burger King empfohlen («endorsed»). Unter Berufung auf das Digital Millenium Copyright Act (DMCA) solle der Forscher seine Seite umgehend löschen. Der Forscher hat keine Lust auf Rechtsstreitigkeiten und entfernt die Seite.

Interessant auch die weitere Begründung: So hätte der Sicherheitsforscher Falschinformationen verbreitet und der Reputation von Burger King geschadet und würde den Wettbewerb damit grob unfair («gross unfair competition») verzerren.

Das letzte Argument wirkt besonders befremdlich, wenn man bedenkt, dass derselbe Sicherheitsforscher vor einigen Wochen gravierende Sicherheitslücken bei McDonald’s fand (DNIP berichtete). Und mit diesem Artikel eigentlich den fairen Wettbewerb zwischen den zwei Burger-Platzhirschen wieder hergestellt hat. Zumindest aus IT-Sicherheitssicht.

Und schliesslich:

Manchmal gibt es Meldungen, bei denen das Überraschende weniger deren Inhalt als deren Zeitpunkt ist. So berichtete der Guardian letzte Woche, dass ICE (die US-amerikanische Behörde, welche sich um das Finden und Ausschaffen von Migranten kümmert und dabei, gelinde gesagt, nicht gerade zimperlich vorgeht) Smartphone-Spyware des israelischen Anbieters Paragon gekauft hat. Wir sind wohl nicht die einzigen, die primär überrascht sind, dass dies erst jetzt geschieht und ICE nicht schon länger entsprechende Überwachungs-Tools einsetzt.
Microsoft hat den Quellcode ihres BASIC-Interpreters unter einer MIT-Lizenz Open Source gestellt. Desselben BASIC, welches in leichten Änderungen in vielen der Heimcomputer oder PCs der 80er-Jahre steckte, von IBM über Commodore bis zu Apple. Bill Gates hatte – mutmasslich nach einer Meinungsverschiedenheit mit dem Commodore-Chef – auch ein kleines Gimmick darin versteckt, mit dem er falls nötig beweisen wollte, dass das, was sich den Benutzern als «Commodore Basic» präsentierte, in Wirklichkeit von Microsoft stamme. Ein schönes Kapitel Computerarchäologie.
Man glaubt, dass sich Softwareentwicklung in 40 Jahren völlig geändert haben müsse. Das scheint aber nur sehr bedingt der Fall zu sein. Zumindest sind viele Regeln, die vor 40 Jahren aufgeschrieben wurden, heute immer noch gültig, wie Terence Eden in seinem Blog am Beispiel von Jon Bentleys Aphorismensammlung «Programming Pearls» aus 1985 aufzeigt.
Wer die Sendung „Arena“ von SRF letzten Freitag verpasst hat, kann die Sendekritik bei Watson oder beim Tages-Anzeiger nachlesen.

4 Antworten

Daniel Berger sagt:

9. September 2025 um 07:08 Uhr

Der folgende Satz ist etwas krumm:

«Denn Wikipedia ist bedroht von Machtstrukturen in der globalen Politik … aber auch rund um Desinformation immer relevanter werden.»

Antworten
1. Reto Vogt sagt:
  
  9. September 2025 um 08:07 Uhr
  
  Danke für den HInweis, wir haben ihn wieder gradegebogen.
  
  Antworten
das lektorat sagt:

9. September 2025 um 08:48 Uhr

’soll der Forscher solle‘ klingt auch ä weng holprig.

Antworten
Rolf Wilhelm sagt:

12. September 2025 um 07:39 Uhr

Made my day – mit ein wenig Verzögerungen.
Am CBM4016 (der Business-Version/Nachfolger des Commodore Pet) habe ich meine ersten Gehversuche an Computern gemacht und „wait 6502,1“ war uns schon damals bekannt. Auf dem CBM4016 hat der Microsoft-Text extrem schnell den ganzen Bildschirm gefüllt. Und war, ohne den Code zu kennen, damals schon klar, dass die direkt den Bildschirmspeicher füllen mussten, weil alle andere Textausgaben doch deutlich gemütlicher unterwegs waren.

Ich fühle mich gerade sehr alt.

Antworten

Schreibe einen Kommentar Antworten abbrechen

Weitere Beiträge

Stilisierte Illustration eines orangefarbenen @-Zeichens auf beigem Hintergrund mit grober Textur und oranger Umrandung.

DNIP Briefing #43: Affenschwanz

Die Redaktion 30. September 2025

Die Redaktion präsentiert jeden Dienstag die Geschichten, die sie bewegt, aufgerüttelt oder zum Nachdenken angeregt hat.

Vogt am Freitag: Parlamentslop

Reto Vogt 26. September 2025

KI-generierte Dokumente generieren in vielen Unternehmen Leerläufe und kosten Millionen. Der Begriff dafür heisst «Workslop». Kolumnist Reto Vogt findet: Slop