DNIP Briefing #25: Zuckerbergs Sammelwut (und was man dagegen tun kann)

Erstellt mit Midjourney.

Die Redaktion präsentiert jeden Dienstag die Geschichten, die sie bewegt, aufgerüttelt oder zum Nachdenken angeregt hat.

Ab sofort strukturieren wir das Briefing und beginnen mit leicht verdaulichen und verständlichen Inhalten – und enden mit technologisch-komplexen Artikeln. Ziel ist es, dass sich unsere Leser:innen schneller zurechtfinden und besser einschätzen können, was sie erwartet.

Was hältst du davon? Schreibe es uns.

Meta will persönliche Daten für KI-Training nutzen

Meta – Zuckerbergs Imperium hinter Facebook, WhatsApp, Instagram, Threads etc. – hat angekündigt, ab 27. Mai die persönlichen Daten seiner Nutzer:innen in Europa für KI-Training zu verwenden. Dazu gehören alle Beiträge (auch die zutiefst persönlichen), Bilder (auch die peinlichen) und Kommentare (auch die blöden Sprüche) auf Facebook und Instagram, die Interaktionen mit dem KI-Chatbot «Meta AI», Information aus dem Internet und sonstigen Datensammlungen.

Wer das nicht will, muss bis spätestens 26. Mai aktiv widersprechen (Widerspruch bei Facebook, Widerspruch bei Instagram). Für WhatsApp gibt es auch eine Widerspruchsmöglichkeit, die bezieht sich aber nicht auf KI.

In der EU laufen gerade – auf Basis der EU-Datenschutz-Grundverordnung DSGVO bzw. des Digital Markets Act der EU – eine Abmahnung von noyb wegen fehlendem Opt-In und durch die Verbraucherzentrale Nordrhein-Westfalen ein Antrag auf eine einstweilige Verfügung.

Auch falls diese Schritte (oder auch noch später mögliche Schritte wie Unterlassungs- und Sammelklagen) erfolgreich sein sollten: Auf die Nutzung von persönlichen Daten von Schweizerinnen und Schweizer dürften sie keine Auswirkungen haben, ausser Meta gewähre allfällige in der EU erstrittene Rechte auch freiwillig in der Schweiz.

Mit der gegenüber internationalen Tech-Konzernen unzulänglichen Eigenverantwortungs-«Strategie» des Bundesrats durch Herauszögern von Plattform- und KI-Regulierungen muss nun jeder und jede selbst aktiv werden, wenn er/sie Meta nicht ein quasi ewiges Recht an den eigenen Daten geben will. Und beim Datenschutz gibt es auch keine Hoffnung; dem sollen ja laut Willen des Bundesrats noch weitere Zähne gezogen werden.

Deshalb: Auch wenn du noch unentschlossen bist, vorsorglich gleich jetzt bei Facebook, WhatsApp und Instagram widersprechen und Freunde und Familie informieren. Sonst geht es vergessen. Und dann gibt es kein Zurück mehr.

Löschen ist nicht immer Löschen

OpenAI, die Firma hinter ChatGPT & Co., verspricht ihren Nutzer:innen, dass diese die Chatverläufe löschen können bzw. dass ihre Interaktionen mit den KI-Chatbots unter bestimmten Umständen gar nicht erst aufgezeichnet werden. Etliche Personen und Firmen verlassen sich auf diese Zusicherung, da zum Teil sehr private oder andersweitig schützenswerte Informationen ausgetauscht werden.

Schon länger läuft ein Rechtsstreit, in dem die New York Times (und anderen Firmen) OpenAI (und Microsoft) Urheberrechtsverletzungen vorwerfen. Nun hat die zuständige Richterin verfügt, dass OpenAI alle LLM-Outputs aufbewahren müsse. Die Aufbewahrungspflicht gilt für alle Chats, auch wenn der/die Kund:in diese löschen möchte oder eine Löschung/Nicht-Aufbewahrung-Pflicht vertraglich vereinbart hat.

Damit haben wir, wie Martin Steiger aufzeigt, ein neues Risiko bei der Nutzung von Diensten Dritter, insbesondere von Software-Dienstleistungen aus der Cloud: Dass nämlich – neben Lock-In und Datenzugang durch fremde Regierungen und Geheimdienste – weitere Risiken bestehen.

Das Risiko, dass ein Anbieter wie OpenAI aufgrund einer behördlichen oder gerichtlichen Verfügung bestimmte Daten aller Nutzer aufbewahren muss bzw. nicht mehr löschen darf, war bislang allerdings kein gängiger Bestandteil von Risikobeurteilungen. Das wird sich jetzt ändern müssen, nicht nur mit Blick in die USA.

Martin Steiger

Staatlich verordneter Denial of Service

Noch ein weiteres Risiko muss bei der Cloud-Nutzung zusätzlich betrachtet werden: Dass nämlich eine fremde Regierung einem Cloudanbieter plötzlich verbietet, weiterhin mit einem Unternehmen, einer Regierungs- oder Nichtregierungsorganisation oder einzelnen Personen zusammenzuarbeiten.

So geschehen bei Internationalen Strafgerichtshof (IStGH bzw. ICC) in Den Haag. US-Präsident Trump war ein Haftbefehl des ICC vom vergangenen Herbst nicht genehm, also hat er kurzerhand verfügt, dass

The President’s executive order] also threatens any person, institution or company with fines and prison time if they provide Khan with “financial, material, or technological support.”

(In etwa: Die Exekutivorder des US-Präsidenten droht auch allen Firmen, Institutionen und Firmen mit Bussen oder Gefängnis, welche Khan finanziell, materiell oder technologisch unterstützen.)

Associated Press-Artikel zum Thema

Die Open Source Business Alliance (OSBA) betont gegenüber Heise, «der US-Präsident könne per Dekret jede Organisation, die von US-Technologie abhängig ist, digital abschalten», auch in vielen anderen Fällen. Um so wichtiger sei es, dass wir auch für solche Dienste Unabhängkeit benötigten, wenn wir Souveränität wollten.

Seit über 10 Jahren arbeitet übrigens das Bundesgericht in Lausanne mit LibreOffice. Das ist gelebte Souveränität. Der Internationale Strafgerichtshof in Den Haag hat bislang Microsoft die Treue gehalten, was ihm jetzt auf die Füsse gefallen ist. Der Konzern hat nach Trump-Sanktionen das Mail-Konto des Chefanklägers des Internationalen Gerichtshofs blockiert

Kleine, aber wichtige Schritte zur Europäischen Eigenständigkeit

Wir steigen im Expertisen-Level eine Stufe hoch. Forscher in allen Bereichen sind auf Datenbanken angewiesen. Doch viele dieser Datenbanken waren und sind in den USA beheimatet. Einige davon sind unter der neuen Regierung aktiv in Gefahr. Doch inzwischen gibt es Alternativen aus Europa.

CVE: So beispielsweise die für IT-Sicherheitsforscher und -Umsetzer wichtige CVE-Datenbank (Common Vulnerability and Exposures), die sowohl als zentrale Ablage für öffentlich bekannte IT-Sicherheitslücken dient, ihnen eine eindeutige ID und einen Schweregrad zuweist, aber auch Verweise auf Anleitungen zur Erkennung und Behebung davon listet. Diese wichtige Datenbank stand im April vor dem Aus, weil kurz vor der geplanten Verlängerung der Finanzierung diese abgesagt wurde. Vorerst gibt es die Gelder zwar für weitere 11 Monate, aber die wichtigsten Eigenschaften einer solchen Datenbank ­– Zuverlässigkeit und Kontinuität – sind durch diese Winkelzüge der US-Regierung für absehbare Zeit dahin.

Schon im letzten Sommer hat die ENISA, die Agentur der Europäischen Union für Cybersicherheit, das Mandat zum Aufbau einer eigenen Datenbank bekommen, der EUVD (European Vulnerability Database). Diese ist seit letzter Woche live. Da die ENISA auch gleichzeitig eine Vergabstelle für CVE-Nummern ist, erhalten EUVD-Einträge gleichzeitig auch eine CVE-Nummer. Und solange es die CVE noch gibt, auch gleichzeitig einen CVE-Eintrag. Damit ist sowohl der ursprünglich geplante redundanzarme Parallelbetrieb möglich als auch eine Basis für eine Nachfolgelösung gelegt, falls nächsten März dann CVE doch begraben werden müsste.

PubMed: Lebenswissenschaften: Im neuen wissenschaftsfeindlichen US-Umfeld ist auch die PubMed-Datenbank bedroht. Mit Europe PMC gibt es für wissenschaftliche Open-Access-Volltexte bereits länger Ausweichmöglichkeiten, sollte PubMed kurzfristig ausfallen. Am 14. Mai hat nun das deutsche Informationszentrum Lebenswissenschaften («ZB MED») informiert, dass sie ihre bestehende LIVIVO-Datenbank zu OLSPub (Open Life Sciences Publication database) ausbauen wollen, damit die weltweite Forschung (Metadaten, Volltexte, Querverweise, …) auch unabhängig von den US-Entwicklungen verfügbar bleiben werden.

Übrigens: Kennt jemand aus unser Leser:innenschaft ähnliche Ansätze in der Schweiz?

Macht KI Entwickler effizienter?

Wir klettern eine weitere Stufe hoch. Es gibt unzählige Versprechen online, dass man mittels KI quasi über Nacht ein «100x coder» werde. Nehmen wir einmal an, die wären wahr. Müssten dann nicht diese «Superentwickler» dann so viel effizienter sein, dass sie 1 % ihrer neugewonnenen Leistung (und damit gleich viel, wie sie ursprünglich leisteten) in Open Source-Projekte stecken könnten? Ein ähnliches Gedankenexperiment hat David Gerard zu einer Analyse der Open-Source-Produktivitätssteigerung durch Generative KI inspiriert. Ihr Ergebnis: Alles andere als rosig. Und bestätigt damit eine kürzliche formalere Studie.

Ob KI-Tools hilfreich sind (oder zumindest als hilfreich empfunden werden), hängt von vielen Faktoren ab: Der Erfahrung der Entwickler:in, der Komplexität des Projekts, ob die Programmiersprache viel repetitiven Code («Boilerplate») erfordert, wie unabhängig vom Rest die geforderte Funktionalität ist, wie viele Leute bereits ähnliche Probleme gelöst (und veröffentlicht) haben, wie wichtig Korrektheit und Fehlertoleranz bzw. Tests sind, …

Auch wenn das Schreiben von Code schneller wird, die Fehlersuche bzw. die zukünftige Wartung des Codes kann deutlich länger dauern und den initialen Vorteil locker eliminieren. Ganz abgesehen davon, dass gute Software eben nicht nur aus gutem Code besteht, sondern aus (mindestens) einer guten Problemanalyse, guten Benutzerführung, guter Architektur des Systems und guten Tests.

KI lässt Entwickler Zeit verschwenden

Daniel Stenberg – der Hauptentwickler hinter dem bekannten, inzwischen 27 Jahre alten Kommandozeilen-Webtool cURL – hatte sich schon vor über einem Jahr über KI-generierte Fehlerberichte geärgert, mit dem das Bug-Bounty-Portal für cURL gefüllt wurde. Er beschwerte sich insbesondere darüber, dass die Fehlermeldungen genügend plausibel klingen würden, dass sie viel Zeit verschwenden, bis klar ist, dass die angebliche Sicherheitslücke vom KI-Sprachmodell nur halluziniert (aka erfunden)https://daniel.haxx.se/blog/2024/01/02/the-i-in-llm-stands-for-intelligence/ wurde. Wer Lust hat, dieser Zeitverschwendung auf den Grund zu gehen: Etliche der hier als «Not-applicable» gelabelten angeblichen Sicherheitslücken sind KI-generiert.

Ähnliches trifft auch auf andere Open-Source-Projekte zu. Die Personen, welche angebliche Sicherheitslücken melden, haben wenig Aufwand mit dem Erstellen dieser Meldung, erhoffen sich aber eine Chance auf etliche hundert bis tausend Franken Belohnung. Sie haben also keinen Grund, ihre Meldung zu überprüfen. Die (oft unbezahlten, freiwilligen) Entwickler müssen dann aber durch diesen Müll durchwaten, bis sie nach z.T. extrem langen, mühsamen und nicht zielführenden Dialogen endlich feststellen, dass sie wieder einmal verarscht wurden.

Während gewisse KI-Funktionen – verantwortungsbewusst eingesetzt – Effizienzgewinne erreichen können, gibt es leider auch diese Anwendungen, mit denen die Zeit anderer effizienter verschwendet werden kann.

Und schliesslich:

dnip.ch mit Deiner Spende unterstützen

Wir wollen, dass unsere Inhalte frei verfügbar sind, weil wir es wichtig finden, dass möglichst viele Menschen in unserem Land die politischen Dimensionen der Digitalisierung erkennen und verstehen können.

Damit das möglich ist, sind wir auf deine Unterstützung angewiesen. Jeder Beitrag und sei er noch so klein, hilft uns, unsere Aufgabe wahrzunehmen.

6 Antworten

  1. Der US-Präsident kann, wie beschrieben, per Dekret Organisationen oder Einzelpersonen Cloud-Dienste abschalten. Das ist richtig übel, vor allem, wenn es sich wie im vorliegendem Fall effektiv um Rache handelt.

    Aber hat sich schonmal jemand darüber Gedanken gemacht, dass im Prinzip die chinesische Regierung durch Remote-Abschaltung von (privaten) Solaranlagen Europa in ein Blackout treiben könnte? Die Anlagen hängen alle am Netz und ich schätze mal, dass 95% der aktuellen Anlagen ihren Ursprung in China haben. Ich bekomme gerade Angst, wenn ich das im Kopf weiter spinne.

  2. „und Freunde und Familien informieren“. Den meisten Menschen in meinem Umfeld ist es „schnuppe“, wenn die Tech-Giganten ihre Daten sammeln. Ein Kollege sagt, es spiele keine Rolle, es hat sowieso überall Überwachungskameras auf der Strasse. ☹️.
    Ich bedanke mich bei Euch, über die regelmässigen Informationen betreffend des Datenschutz.

    1. Dann würde ich es umformulieren: „… und Freunde und Familie informieren, denen Datenschutz wichtig ist.“

      Aber, wie anderswo in diesem Zusammenhang schon gesagt wurde: Wer auch heute noch aktiv bei Facebook ist, dem ist das wohl nicht so wichtig.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Weitere Beiträge