DNIP Briefing #41: KI-Futter wird teurer

Ein Haufen Bücher
Foto: Robert Anasch auf Unsplash

Die Redaktion präsentiert jeden Dienstag die Geschichten, die sie bewegt, aufgerüttelt oder zum Nachdenken angeregt hat.

Dass LLMs mit praktisch allen im Internet zugänglichen Texten trainiert werden, dürfte allgemein bekannt sein. Und es dürfte ebenso wenig überraschen, dass viele gängige LLMs auch mit Büchern trainiert werden, für welche ein Copyright besteht. Kein Wunder, haben Autor:innen in den USA gegen die Anbieter dieser LLMs Sammelklagen eingereicht. Anthropic, das Unternehmen hinter Claude, hat nun einem Vergleich zugestimmt und sich dabei zur Zahlung von 1,5 MIlliarden Dollar für Copyright-Verstösse verpflichtet. Dies entspricht rund 3000 Dollar pro Buch (das Teil der Sammelklage war). Teil des Vergleichs ist auch, dass dieser nur für bereits verwendete Bücher gilt und keine zukünftige Nutzung abdeckt.

Auch wenn dies sicher als Erfolg für die involvierten Autor:innen zu werden ist: Man muss sich auch bewusst sein, dass solche Summen nur grosse LLM-Anbieter aufbringen können. Neben Anthropic dürften das OpenAI und allenfalls xAI sein, und all die Branchengrössen wie Google, Facebook, Microsoft etc. Startups hingegen dürften es schwer haben, unter diesen Bedingungen an Trainingsmaterial zu kommen.

Heilsversprechen der KI-Chefs

Die WoZ hat ein Interview mit Alex Hanna und Emily M. Bender veröffentlicht, unter dem Titel «Der Hype war schon immer der Modus Operandi der KI-Forschung». Da wird erklärt, wieso Vergleiche zwischen den aktuellen Entwicklungen bei KI-Systemen (genauer: grossen Sprachmodellen, also LLMs) und dem frühen Internet irreführend sind; wieso Leute, die predigen, «die KI wird uns retten!» und die, die warnen, «die KI wird uns alle töten!» eigentlich die gleiche Geschichte erzählen; und dass nicht alle Leute mit viel Geld clever sind.

Demokratische Prozesse verstehen

Auch in der Schweiz steigt die Tendenz, mit Dekreten regieren zu wollen. Hier heisst es noch „Verordnung“, aber auch damit wird versucht mehr und mehr, die gesetzlichen Grenzen auszudehnen oder gar zu überschreiten. Watson hat ein tolles Interview mit Daniel Kübler, Professor für Demokratieforschung und Public Governance, geführt. Da erfährt man viel über den Rechtsstaat, die zur Verfügung stehenden demokratischen Mittel und wieso manche Diskussionen so aufgeladen sind. Das Interview wurde am Beispiel der geplanten Tempo-30-Verordnung des Bundesrats geführt. Es passt aber in grossen Teilen auch auf die VÜPF-Diskussion.

Wieso funktioniert eigentlich Wikipedia?

Wieso geht es nicht völlig im Chaos unter? Und wie lange klappt das noch? Das alles sind Fragen, die man sich rund um die wohl beste Informationsquelle der heutigen Zeit stellen sollte. Denn Wikipedia ist bedroht von Machtstrukturen in der globalen Politik («Golf von Mexiko» oder «Golf von Amerika», weshalb US-Anschuldigungen, z.B. zum Thema Wokeness und rund um Desinformation, immer relevanter werden.

Zwei Personen haben unabhängig voneinander in der letzten Woche versucht, die Gründe dafür zu verstehen und aufzuschreiben.

Josh Dzieza hat für The Verge einen langen, detaillierten Artikel über die Redaktionscommunity hinter Wikipedia verfasst. «Wikipedia ist widerstandsfähig, weil es langweilig ist,» so der Titel. Und wahrscheinlich ist dieses Faktenbewusstsein auch einer der Gründe, wieso Wikipedia immer noch lebt, auch wenn es inzwischen unter Druck steht. Laut Dzieza ist eines der Erfolgsrezepte sei, dass bei Disputen klare Regeln gelten.

Cory Doctorow hat sich ebenfalls der Frage angenommen, wieso Wikipedia funktioniere. Er führt es unter anderem darauf zurück, dass man nicht versuche, selbst die Fakten zu überprüfen, sondern die Faktenüberprüfung an die eigentlichen Quellen delegiere. Und dafür strikte Qualitätsprüfung der Quellen selbst vornehme.

Beide Artikel sorgen für mehr Verständnis. Hoffentlich sorgt dieses Verständnis dafür, dass wir noch lange, auf zuverlässige, offene Informationsquellen vertrauen dürfen. Auch die Wikipedia.

Das Strafe-Strafzölle-Pingpong

Die EU hat Google wegen wettbewerbsfeindlicher Praktiken eine Busse von knapp 3 Milliarden Euro auferlegt. Der US-Präsident hat in seiner unnachahmlichen Art Gegenzölle angedroht, wenn diese Busse bestehen bleibe. Übrigens hat auch das US-Justizministerium vor zwei Jahren ein Kartellverfahren gegen Google gestartet, mit dem möglichen Resultat der Aufspaltung des Internetgiganten. Das Verdikt nach zwei Jahren: Google muss ein paar Daten mit der Konkurrenz teilen; der Rest bleibt wie vorher. Die Hoffnung auf Milde scheint aufgegangen zu sein, die sich die grossen US-Unternehmen durch Spenden an Trumps Inauguration im Wert von 200 Millionen Dollar erhofften. Die Nähe der CEOs dieser Konzerne ist auf eindrückliche Weise in diesem Video zu sehen.

Infiziert eine KI alle Rechner mit Ransomware?

So lautet zumindest die aktuelle Erzählung. Die stammt aber von einigen Leuten, die übereifrig Klicks auf ihre Webseiten bringen wollen. Und (deshalb?) nicht zu genau nachgeforscht haben. Denn eine kurze Recherche (wie z. B. bei The Register) hätte gezeigt: Das ist ein Forschungsprototyp, der nur in einer genau definierten Laborumgebung funktioniert. Auch andere «KI hackt deinen Computer!»-Stories sind weit von der Realität erzeugt; einige sogar selbst KI-generiert.

Unabhängig von diesen Schlagzeilen sollte man die üblichen Sicherheitsmassnahmen auf seinen Laptops und Servern immer wieder überprüfen. Und dafür sorgen, dass man informiert wird, wenn etwas Ungewöhnliches passiert. Oder durch gute Passwörter und wenige, dafür aktuelle Software möglichst wenig angreifbar ist. Und für den Fall der Fälle wenigstens ein Ransomware-sicheres Backup hat. Das möglichst aktuell und vollständig ist, versteht sich von selbst.

Mit dem Urheberrecht gegen Sicherheitslücken

Ein Sicherheitsforscher findet gravierende Sicherheitslücken in der Software von Burger King, die unter anderem Zugriff auf die Audioaufzeichnungen aller Drive-Thru-Bestellungsgespräche ermöglichten, inklusive der automatischen KI-Bewertungen der Mitarbeitenden. Auch, ob die Mitarbeitenden genügend häufig «you rule» gesagt hätten, was scheinbar für ein Drive-Thru-Erlebnis unverzichtbar ist. Er meldet die Lücken und der Hersteller schliesst die Lücken. Daraufhin schreibt er einen Blog-Post, damit wir alle etwas davon lernen können und diese Fehler zukünftig hoffentlich vermeiden können. So weit, so normal: Tagesgeschäft im IT-Sicherheitsbusiness.

Eine von Burger King beauftragte Firma Cyble sieht das aber nicht so. Die Verwendung der Marke «Burger King» sei unautorisiert und würde die Öffentlichkeit verwirren, sogar so weit, dass diese glauben würde, das Blog sei von Burger King empfohlen («endorsed»). Unter Berufung auf das Digital Millenium Copyright Act (DMCA) solle der Forscher seine Seite umgehend löschen. Der Forscher hat keine Lust auf Rechtsstreitigkeiten und entfernt die Seite.

Interessant auch die weitere Begründung: So hätte der Sicherheitsforscher Falschinformationen verbreitet und der Reputation von Burger King geschadet und würde den Wettbewerb damit grob unfair («gross unfair competition») verzerren.

Das letzte Argument wirkt besonders befremdlich, wenn man bedenkt, dass derselbe Sicherheitsforscher vor einigen Wochen gravierende Sicherheitslücken bei McDonald’s fand (DNIP berichtete). Und mit diesem Artikel eigentlich den fairen Wettbewerb zwischen den zwei Burger-Platzhirschen wieder hergestellt hat. Zumindest aus IT-Sicherheitssicht.

Und schliesslich:

dnip.ch mit Deiner Spende unterstützen

Wir wollen, dass unsere Inhalte frei verfügbar sind, weil wir es wichtig finden, dass möglichst viele Menschen in unserem Land die politischen Dimensionen der Digitalisierung erkennen und verstehen können.

Damit das möglich ist, sind wir auf deine Unterstützung angewiesen. Jeder Beitrag und sei er noch so klein, hilft uns, unsere Aufgabe wahrzunehmen.

4 Antworten

  1. Der folgende Satz ist etwas krumm:

    «Denn Wikipedia ist bedroht von Machtstrukturen in der globalen Politik … aber auch rund um Desinformation immer relevanter werden.»

  2. Made my day – mit ein wenig Verzögerungen.
    Am CBM4016 (der Business-Version/Nachfolger des Commodore Pet) habe ich meine ersten Gehversuche an Computern gemacht und „wait 6502,1“ war uns schon damals bekannt. Auf dem CBM4016 hat der Microsoft-Text extrem schnell den ganzen Bildschirm gefüllt. Und war, ohne den Code zu kennen, damals schon klar, dass die direkt den Bildschirmspeicher füllen mussten, weil alle andere Textausgaben doch deutlich gemütlicher unterwegs waren.

    Ich fühle mich gerade sehr alt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Weitere Beiträge