techjourno-perlen

Techjourno-Perlen und Anderes, Teil 11

Weil auf der ganzen Netzwelt so viel passiert, und wir nicht alles gleichzeitig verarbeiten, verarzten und verkommentieren können, empfehlen wir hin und wieder ein paar Artikel aus der Netzwelt, mit Lob, mit Kritik und auch Ergänzungen. Einfach und simpel Meta. Ausserdem nutzen wir das Format für Kurzeinordnungen und -erklärungen zu brandaktuellen Tech-News.

Kanton Zürich lanciert eine Testumgebung für Vorhaben im Bereich der Künstlichen Intelligenz

Auch wenn der erste Satz auf der Webseite mit „Künstliche Intelligenz (KI) ist eine Zukunftstechnologie von grosser Bedeutung“ gleich mehrere Felder im typischen KI-Bullshit-Bingo abdeckt: Was der Kanton Zürich da zusammen mit den hier ansässigen Hochschulen anbietet, tönt vielversprechend. Um was geht es?

Der Einsatz von computergestützten Prognosemethoden (eben „KI“) ist ja nicht ganz so problemlos wie das manche feurige Verfechter des Thema gerne behaupten. Seien es die verwendeten Modelle an sich, seien es die fürs Trainieren der Modelle verwendeten Daten, sei es die Interpretation und Nutzung der Ergebnisse, schon rein in auf der technischen/rechnerischen Seite hat es diverse Fallstricke. Auch ist zu beachten, dass die Datenbeschaffung und -verwendung rechtlich abgesichert ist, und dass die Nutzung der Ergebnisse transparent und rechtssicher erfolgt. Unter Umständen braucht es auch angepasste oder neue gesetzliche Leitplanken, um die Wahrung der Rechte aller Beteiligten sicherzustellen, Leitplanken welche von einer Regierung/Verwaltung ausgearbeitet werden müssen für welches das Thema KI verständlicherweise das oft beschworene „Neuland“ darstellt.

Die Testumgebung des Kantons soll nun dazu beitragen, zumindest für auf öffentlich verfügbaren Daten operierende Prognosemethonden eine Spielwiese bereitzustellen auf welcher Technikerinnen wie auch Regulatoren Algorithmen ausprobieren, deren Ergebnisse analysieren und den Bedarf bzw. die Wirkung von regulatorischen Eingriffen überprüfen können. Zumindest auf dem Papier scheint das ein guter Ansatz zu sein, erlaubt er doch allen Beteiligten, im Umgang mit auf öffentlichen Daten operierenden Algorithmen Erfahrungen zu sammeln.

Wenn man sich die auf der Projektseite aufgeführten Vorteile ansieht, zeigt sich allerdings ein etwas gemischtes Bild (Vorteile kursiv):

  • Zugang zu regulatorischem Know-how und Unterstützung in rechtlichen Fragestellungen: Das ist für die beteiligten Unternehmen sicherlich hilfreich, man kann sich höchstens fragen ob die kantonale Verwaltung dazu überhaupt in der Lage ist. In der Medienmitteilung ist die Rede davon, dass die „Verwaltung profitiert, in dem sie ebenfalls Kompetenzen im Bereich KI aufbaut und Erkenntnisse für eine mögliche Regulierung gewinnt“. Inwiefern man sich unter diesen Umständen auf Augenhöhe zu einem beidseitigen Knowhow-Austausch begegnen will, bleibt vorderhand offen.
  • Unterstützung beim Zugang zu öffentlichen Datenbanken: Es ist eine Eigenschaft öffentlicher Datenbanken dass sie eben öffentlich (und damit frei zugänglich) sind. Was genau mit der Unterstützung gemeint ist, wird nicht näher ausgeführt.
  • Möglichkeit positiv auf die KI-Rahmenbedingung einzuwirken und die Innovationsfähigkeit flächendecken[d] zu fördern wie auch Aufbau der Reputation im Bereich verantwortungsvolle Innovation durch enge Kooperation mit Verwaltung: Das Thema „Kompetenzaufbau in der Verwaltung“ haben wir schon im ersten Punkt gestreift, diese beiden Punkte hier lässt eher darüber nachdenken, wo genau die Grenzen zwischen „einwirken“ und „zum eigenen Vorteil beeinflussen“ liegen.

Noch steht das Vorhaben allerdings am Anfang, bis Ende Juni können Projektvorschläge eingereicht werden Danach wird sich weisen ob sich die Erwartungen erfüllen..

CoverDrop: Securing Initial Contact for Whistleblowers

Whistleblower sind eine wichtige Quelle zum Aufdecken von Fehlverhalten oder Sicherheitslücken in Unternehmen und Verwaltungen. Bekannterweise setzen sich Whistleblower dabei einen gehörigen Risiko auf, führt doch die Bekanntgabe von Firmeninternas an Aussenstehende meist im mindesten zu einer fristlosen Kündigung, im schlimmsten Fall zu einem Gerichtsurteil und einer mehr oder weniger langen Haftstrafe.

War es für Whistleblower schon vor dem digitalen Zeitalter oft nicht ganz einfach, auf längere Zeit hinweg unerkannt zu bleiben und nicht als Quelle aufzufliegen, ist es im Internet noch viel schwieriger. Datentransfers im Internet hinterlassen viele Spuren (und vor allem IP-Adressen), und man kann als Whistleblower auch nicht ohne weiteres Signal oder ähnliche Kanäle verwenden da hier die Anonymität defacto nicht gewährleistet ist (spätestens dann nicht mehr, wenn das Smartphone des Whistleblowers im Rahmen einer Anklage untersucht wird). Um die Sicherheit zu erhöhen, gibt es Lösungen wie SecureDrop (die zum Beispiel von Heise und The Guardian eingesetzt werden) welche unter Verwendung von Tor und airgapped Systemen auf der Empfänger-Seite sicherstellen sollen, dass aus einer Meldung nicht auf den Urheber/Absender zurückgeschlossen werden kann. SecureDrop benötigt aber technisches Knowhow auf der Empfängerseite, auch macht sich der Whistleblower je nach Kontext gegenüber dem eigenen Arbeitgeber, oder einer Ermittlungsbehörde schon verdächtig wenn er Tor überhaupt einsetzt.

Eine interessante Alternative schlagen die AutorInnen des im Titel verlinkten Papers vor. Sie integrieren die gesicherte Whistleblower-Kommunikation direkt in einer News-App auf dem Smartphone und reduzieren so das Risiko, dass sich ein Whistleblower alleine schondurch die vorhandenen Apps auf seinem Smartphone verdächtig macht. Natürlich eignet sich das nur für kleine Datenmengen (da sonst eine Traffic Analysis ausreicht um eben doch herauszufinden, wer hier Dokumente weiterleitet), aber für den Aufbau eines Erstkontakts könnte das ein guter Ansatz sein.

Nicht addressiert werden allerdings all die anderen Faktoren welche die Aufdeckung eines Whistleblowers begünstigen: Metadaten in Dokumenten, Zugriffsprotokolle/-logs bei vertraulichen Dokumenten, personalisierte Versionen von Dokumenten bei denen dann harmlos wirkende Zitate die Quelle identifizieren etc. Diese Gefahren bleiben unabhängig vom Kommunikationskanal bestehen.

Deep Learning Is Hitting a Wall

Der Erfolg von KI-Methoden in den letzten Jahren basiert primär auf der Kombination von grossen Datenmengen, schnellen Rechnern und intelligenter Anwendung mathematischer Methoden vor allem aus Statistik und Kombinatorik. Entstanden sind dabei Anwendungen welche in eng definierten Bereichen (Strategiespiele wie Schach oder Go, Mustererkennung wie beim Matching von Bildern oder bei selbstfahrenden Autos, Spracherkennung wie Siri oder Alexa) teilweise beeindruckende Leistungen zeigen. Allerdings war schon seit Jahren fraglich, ob sich diese Entwicklungen so ohne weiteres auch auf breitere Anwendungsgebiete übertragen lassen. Nun mehren sich die Anzeichen, dass zumindst typische KI-Algorithmen wie Deep Learning an ihre Grenzen stossen, wenn die Aufgabenstellung allzu komplex wird.

Das Wissenschaftsmagazin Nautilus hat dies in einem umfassenden Artikel zusammengestellt, es lohnt sich, die Zeit zur Lektüre zu nehmen. Hier das wichtigste in Kürze:

  • Deep Learning-Algorithmen suchen nach Mustern in Datensätzen und „erkennen“ auf diese Weise Objekte. Naheliegenderweise wird diese Mustererkennung bessern wenn mehr Daten verfügbar sind, allerdings skaliert die Verbesserung nicht linear (d.h. eine Verdoppelung der Trainings-Datenmenge führt nicht zu einer Verdoppelung der Objekterkennungs-Leistung). Deep Learning-Algorithmen können aber kein „Verständnis“ für die erkannten Objekte entwickeln (d.h. sie finden zwar Bilder auf denen sie ein Muster erkennen, welches demjenigen auf den Trainingsbildern mit Pferdeköpfen ähneln, wissen aber nix über Pferde).
  • Der alternative Ansatz für KI-Algorithmen basiert auf sogenannt symbol-basierter KI. Dabei wird (vereinfacht gesagt) die Welt oder der Problembereich modellhaft beschrieben („ein Pferd hat einen Körper, vier Beine und einen Kopf mit Mähne“) und es werden Regeln definiert, anhand welcher die KI dann ein Pferd von von Katze unterscheiden kann. Der KI-Algorithmus kennt in diesem Fall zumindest die Grundeigenschaften von „Pferd“ und kann sie (so die Theorie) einfacher auf neue Kontexte übertragen.

Exemplarisch zeigt sich diese Problematik am Versuch, eine KI das Spiel Nethack spielen zu lassen. Das ist ein Dungeon-Spiel aus der Zeit der ASCII-Terminals, in welchem man auf der Suche nach einen Amulet durch ein unterirdisches Labyrinth zieht, Waffen und Werkzeuge sammelt, Rätsel löst und Monster erschlägt (wer es nicht kennt: Spielempfehlung, schon nur um zu erkennen dass spannende Spiele nicht zwingend die neuste Grafikkarte brauchen). Ein zentraler Teil des Spiel ist das Erkunden des jedesmal neu erstellten Labyrinths und das Identifizieren der Eigenschaften der Waffen und Werkzeuge, und auch menschliche Spieler tun sich schwer damit, eine klare Strategie zu finden. Und reinen Deep Learning-Algorithmen geht es offenbar ähnlich, jedenfalls schneiden sie gegenüber symbol-basierten deutlich schlechter ab.

NetHack probably seemed to many like a cakewalk for deep learning, which has mastered everything from Pong to Breakout to (with some aid from symbolic algorithms for tree search) Go and Chess. But in December, a pure symbol-manipulation based system crushed the best deep learning entries, by a score of 3 to 1—a stunning upset.

https://nautil.us/deep-learning-is-hitting-a-wall-14467/

Jetzt gleich alle Deep Learning-Ansätze über Bord zu werfen und vollständig auf Symbolic AI zu setzen, wäre wohl gleichermassen verfehlt wie der heutige Fokus auf ersteres. Mehr Hoffnung setzen der Autor und die von ihm befragten ForscherInnen auf „Symbolic AI“ bzw. auf hybride Modelle welche „Symbolic AI“ und Deep Learning-Ansätze miteinander verbinden.

Ob diese Systeme den Durchbruch bezüglich AI bringen werden? Nun, in den 60er-Jahren war man überzeugt davon:

Indeed, early pioneers, like John McCarthy and Marvin Minsky, thought that one could build AI programs precisely by extending these [symbolic] techniques, representing individual entities and abstract ideas with symbols that could be combined into complex structures and rich stores of knowledge

Unterdessen schreiben wir 2022…

Teile Diesen Beitrag

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.