„Wörter verhalten sich wie Pixel und Sätze wie Bilder“ Ein Gespräch mit Mario Klingemann

Foto: Onkaos

Mario Klingemann gilt als Pionier im Bereich Neuronale Netze, Computerlernen und KI-Kunst. Mit dem Goethe-Institut spricht er über die kreative Nutzung von AI und die Rolle der Technologie in einer modernen Interpretation des Begriffs Kulturtechnik.

Jochen Gutsch

Datenschutz

Mario Klingemann beschreibt sich selbst als Skeptiker mit wissbegierigem Geist. Der in München lebende Künstler ist kein Neuling, was Technologie angeht: Er brachte sich in den frühen 1980er Jahren das Programmieren bei und wollte schon damals Maschinen darauf trainieren, ein fast autonomes kreatives Verhalten an den Tag zu legen.

Klingemann war Artist in Residence bei Google Arts & Culture und hat mit prestigeträchtigen Institutionen wie der British Library, der Universität Cardiff und der New York Public Library zusammengearbeitet. Mit dem Goethe-Institut sprach er im Vorlauf der Ausstellung Future U in der RMIT Gallery in Melbourne, wo er sein Werk Mistaken Identity präsentieren wird.

Sie sind nach eigener Aussage zuversichtlich, dass Kunstmaschinen in naher Zukunft in der Lage sein werden, „interessantere Werke“ als Menschen zu kreieren. Gilt das auch für Ästhetik und Schönheit?

In meinem Weltmodell durchaus. Wenn man ein Venn-Diagramm der Dinge zeichnet, die für Menschen interessant sind, gehören Ästhetik und Schönheit dabei mit Sicherheit zu den größeren Kreisen. Aber nicht alles, was wir für schön halten, ist auch interessant. Schönheit alleine kann ziemlich langweilig werden – was wiederum die Frage der „Interessantheit“ so interessant macht. Wenn Schönheit alles wäre, was es braucht, um unsere Aufmerksamkeit zu erregen, uns zu faszinieren oder Emotionen in uns zu wecken, dann wäre die Frage der Kreativität gelöst – man fügt einfach eine Blume oder ein hübsches Gesicht hinzu und fertig.

Etwas zu kreieren, das die Mehrheit der Leute ästhetisch ansprechend findet, ist technisch nicht schwierig. Man kann eine Permutation einer Gruppe typisch ästhetischer Motive erstellen, ein paar bekannte Kompositionsregeln darauf anwenden und hat im Handumdrehen Schönheit – mit hoher Wahrscheinlichkeit langweiligen und vorhersagbaren Kitsch. Etwas zu kreieren, das schön und interessant zugleich ist, ist viel schwieriger, und aufgrund der flüchtigen Natur von Interessantheit auch etwas, das nie ein für allemal gelöst werden kann. Es muss jedes Mal wieder neu erlangt werden. Mistaken Identity von Mario Klingemann

"Mistaken Identity" besteht aus drei Videos, die auf neuralen Berechnungen basieren | © Mario Klingemann Hier in Australien wird das Werk „Mistaken Identity“ gezeigt werden. Für diese Installation haben sie zufällige Elemente und Glitches eingearbeitet, sie spielen also im Grunde genommen mit Fehlern. Sind sie manchmal aufrichtig überrascht von den Ergebnissen, die sie mithilfe neuronaler Netze generieren?

Überraschung ist die Quintessenz der Interessantheit. Wir erleben sie, wenn unsere Erwartungen nicht erfüllt werden – auf positive oder negative Art. Wenn wir mit einer Information oder Situation konfrontiert werden, fangen wir an, auf Basis unseres Wissens Vorhersagen zu machen: Was passiert wahrscheinlich als nächstes? Was ist sonst auf dem Bild zu sehen? Was werden wir im nächsten Satz lesen? Und wenn das, was als nächstes kommt, unsere Erwartungen nicht erfüllt, sind wir überrascht und interessiert – denn das stellt uns eine Erweiterung und Verbesserung des Modells unserer Welt in Aussicht, sodass wir in Zukunft besser vorbereitet sind.

Insbesondere in der Frühphase der Arbeit mit neuronalen Netzen gab es viele solche Überraschungen, denn diese Modelle waren wie Schiffe, die einen in bis dato unerforschtes Gelände brachten. Stellen Sie sich vor, wie es für die ersten Siedler*innen gewesen sein muss, die nach Australien kamen und zum ersten Mal einem Platypus oder einem Känguru begegneten – so fühle ich mich bei meinen künstlerischen Experimenten. Aber je länger ich in diesen latenten Räumen unterwegs bin, desto mehr gewöhne ich mich an ihr Wesen. Und genauso, wie Sie es wahrscheinlich nicht mehr allzu aufregend finden, wenn Ihnen mal wieder ein Beuteltier begegnet, erfordert es heute Mühe und Zeit, aus diesen Modellen echte Überraschungen herauszuholen. Aber es kommt immer noch vor.

KI-Kunst ist ein relativ junges Genre. Wir befinden uns derzeit noch in der Pionierphase, aber früher oder später werden leicht bedienbare Anwendungen zu den Massen durchsickern. Erfüllt sie die Aussicht, dass KI-Kunst zum Mainstream wird, mit Freude oder mit Sorge?

So läuft das nun mal, aber ich bin froh, dass ich zumindest ein paar Jahre für mich hatte, in denen diese Art des Kreierens nicht die Norm war. Das ist eben die Crux mit der Interessantheit – wenn etwas leicht ist, sodass es jede*r kann, wird es schwieriger, etwas damit zu machen, das nicht schon jemand gemacht hat oder das nicht schon alle gesehen haben. Je mehr also die Zivilisation in Form von One-Click-Tools für KI-Kunst in diese Bereiche vordringt, desto mehr bin ich gezwungen, nach Bereichen zu suchen, die ich noch als „Wildnis“ betrachte, und mehr darüber zu lernen, was es ist, das wir Menschen wahrhaft interessant und fesselnd finden. Im Moment sind Wörter und Geschichtenerzählen einige dieser Bereiche, die mir vielversprechend scheinen.

Für Ihr jüngstes Werk „Appropriate Response“ entschieden sie sich dafür, sich auf Sprache und die Macht der Wörter als ihr Hauptmedium zu konzentrieren. Wie unterschied sich das davon, mit Bildern zu arbeiten?

Das wirklich Faszinierende an der Funktionsweise von neuronalen Netzen ist, dass allem Zahlen zugrunde liegen. Es spielt keine Rolle, ob man sich mit Bildern, Klang oder Wörtern beschäftigt – sobald man einen Weg hat, sie in Zahlen zu konvertieren, sind sie alle auf einer Ebene. „Sinn“ wird also zu einem Ort in einem multidimensionalen Raum und man kann ihn messen, manipulieren und übersetzen. In diesem Sinne verhalten sich Wörter wie Pixel und Sätze wie Bilder – oder, um ein anderes Bild zu verwenden – Buchstaben sind wie Ton, der zu Skulpturen geformt werden kann – und zwar mithilfe ähnlicher oder sogar derselben Methoden, die ich benutze, um Bilder zu erstellen.

Ein großer Unterschied ist, dass Wörter beim Zusammensetzen weniger Spielraum lassen als Bilder – Bilder sind wesentlich redundanter und unbestimmter und es spielt in der Regel keine Rolle, wenn sich ein paar Pixel „an der falschen Stelle“ befinden, während ein einziger falsch gesetzter Buchstabe bereits die gesamte Bedeutung eines Satzes verändern kann. Was nicht unbedingt schlecht ist, da das eine Menge Überraschungen möglich macht. Aber der Anteil an „neuronalem Müll“, den man bei Text bekommt, ist höher, und es erfordert mehr Arbeit, das Interessante vom Mittelmäßigen zu trennen.

Eines der Systeme, die sie benutzt haben, ist GPT-2, das aus dem von Elon Musk gegründeten Forschungsunternehmen OpenAI stammt. Das Unternehmen selbst konstatiert eine konkrete Gefahr, dass extremistische Gruppen das System zur Generierung synthetischer Propaganda benutzen könnten. Spielen wir mit dem Feuer, wenn solche leistungsstarken Tools für die Allgemeinheit zugänglich gemacht werden?

Mit solchen Systemen ist es ein bisschen wie mit dem Coronavirus: Ja, es mag eine vorübergehende Gefahr bestehen, die darin begründet liegt, wie wir heutzutage Informationen online verbreiten und konsumieren und was wir dann als Realität wahrnehmen, hauptsächlich über Social Media und Google-Suchen. Wenn plötzlich ein Informationsvirus daherkommt, das sich mit enormer Geschwindigkeit reproduzieren kann und die Informationsreplikatoren dazu verleiten kann, zu glauben, dass es sich um eine Nachricht von Wert handelt, dann kann das diese Systeme und letztlich die Gesellschaft überwältigen. Leider neigen wir dazu, zu glauben, was wir sehen – vor allem, wenn es irgendwo Schwarz auf Weiß geschrieben steht. Unser gesellschaftliches Immunsystem ist noch nicht auf neuronal optimierte Angriffe vorbereitet, die diese Situation missbrauchen können.

Aber ich bin überzeugt, dass wir, wenn wir solchen Bedrohungen vermehrt ausgesetzt sind, eine „Herdenimmunität“ entwickeln und in der Lage sein werden, unsere Informationsrezeptoren zu verfeinern, sodass wir sinnvolle Informationen wieder von leeren Phrasen unterscheiden können.

Als Künstler arbeiten sie daran, immer mehr Kontrolle an Maschinen abzugeben – machen Sie sich als Bürger Sorgen über das Ausmaß an Kontrolle, das Big Data und Algorithmen über ihren Alltag haben?

Ja, absolut. Es vergeht kein Tag, an dem ich nicht von der Naivität oder Niedertracht bestimmter Politiker*innen schockiert bin, die uns davon zu überzeugen versuchen, unter irgendeinem Vorwand ein weiteres Stück unserer Privatsphäre aufzugeben. Durch meine Arbeit mit maschinellem Lernen weiß ich, wie wenig Informationen erforderlich sein können, um sich auf ein bestimmtes Ziel einzuschießen oder Datenpunkte in verschiedene Klassen aufzuteilen, und wie man Gradientenverfahren zur Optimierung jedes beliebigen Ziels benutzen kann, um seinen Nutzen zu maximieren. Im Alltag bin ich also gegenüber jedem Vorstoß sehr misstrauisch, der mich zur Preisgabe persönlicher Daten zwingt, und ich versuche, die Kontrolle darüber zu behalten, was ich teilen möchte und was nicht.
Mario Klingemann

© Onkaos
Ihre Projekte sind in der Regel sehr technisch und erfordern nicht nur programmiererische, sondern auch ingenieurwissenschaftliche Fähigkeiten. Sind unsere traditionelleren „Kulturtechniken“ wie Zeichnen und Schreiben bedroht, wenn Maschinen darauf trainiert werden, immer mehr dieser Fertigkeiten zu lernen?

Darüber mache ich mir keine Sorgen. Ja, man könnte sagen, dass Technologie der natürliche Feind der Tradition ist, aber die Geschichte lehrt uns auch, dass sie eher wie ein Umwandler oder Katalysator wirkt als wie ein Zerstörer. Die Fotografie hat die Malerei nicht verdrängt, das Fernsehen nicht die Bücher. Was Technologie allerdings durchaus verändert, ist der Anteil an Menschen, die von einer bestimmten Kulturtechnik leben können. Gleichzeitig ebnet sie den Weg dafür, dass andere am System teilhaben können, und schafft neue Möglichkeiten für diejenigen, die gewillt sind, sich anzupassen. Was für die heutige Zeit heißt, dass das Programmierenlernen neben Zeichnen und Schreiben als eine der wichtigsten Fähigkeiten gelten sollte, die man sich aneignen kann, um auf eine Zukunft vorbereitet zu sein, in der Maschinen eine aktive Rolle in unser aller Leben spielen werden.

Dass ich mir keine Sorgen mache, liegt daran, dass einer der wichtigen Aspekte, die ein Werk für uns interessant machen, die Tatsache ist, dass es von einer menschlichen Hand oder einem menschlichen Geist geschaffen wurde. Die Geschichte hinter dem Werk ist häufig genauso wichtig wie das Werk selbst. Und das ist etwas, das für Maschinen extrem schwer nachzumachen sein dürfte.

Mistaken Identity besteht aus drei digitalen Videos von je zwei Stunden Länge. Basierend auf dem „Neural Glitch“-Verfahren des Künstlers zeigen die vollständig synthetisierten Videos Visualisierungen, die von Generative Adversarial Networks (GANs) ausgeführt wurden. Mistaken Identity wird 2021 als Teil der Ausstellung Future U in der RMIT Gallery gezeigt werden.

Weitere Stichworte von Mario Klingemann über die Zukunft kreativer KI gibt es hier.

Artikelvorschläge

Ein Systemfehler ist aufgetreten. Versuchen Sie es später noch mal.