Generative Adversarial Network (GAN)

Transparenz

Was ist ein Generative Adversarial Network?

Ein Generative Adversarial Network (GAN), dt. etwa erzeugende gegnerische Netzwerke, ist ein System des maschinellen Lernens, das aus zwei neuronalen Netzen besteht: einem Generator und einem Diskriminator. 

Die Aufgabe des Generators ist die Erzeugung synthetischer Daten (z. B. Bilder, Text oder Audio). Die Rolle des Diskriminators besteht darin, zwischen den synthetischen und realen Daten aus einem Trainingssatz zu unterscheiden.

Während des Trainings lernt der Generator, immer realistischere Ergebnisse zu produzieren, indem er versucht, den Diskriminator zu täuschen.

Der Diskriminator wiederum lernt, seine Fähigkeit zu steigern, synthetische Daten korrekt zu identifizieren. Dieser kontradiktorische Prozess ermutigt beide Netzwerke, sich im Laufe der Zeit zu verbessern.

Das ultimative Ziel eines GAN ist es, synthetische Daten zu erzeugen, die von realen Daten nicht zu unterscheiden sind.

GANs spielen eine wichtige Rolle in der generativen KI. Sie werden zur Anreicherung von Daten für Bildverarbeitungsanwendungen und zur Erstellung von Bild-, Sprach-, Video- und Textinhalten verwendet.

Außerdem werden mit GANs gefälschte Inhalte (Deepfakes) produziert.

Wie ein GAN funktioniert

Die beiden Netze treten in einem Nullsummenspiel gegeneinander an. Dabei geht es darum, dass der Generator seine Fähigkeit verbessert, synthetische Daten zu erzeugen, die echt zu sein scheinen.

Parallel dazu versucht der Diskriminator, seine Fähigkeit zu steigern, Daten korrekt als echt oder synthetisch zu klassifizieren. 

Das Spiel endet, wenn das Diskriminatornetz die synthetischen Daten des generativen Netzes nicht von den realen Daten unterscheiden kann.

GANs sind speziell für Aufgaben des unüberwachten maschinellen Lernens konzipiert, und jede Runde des Nullsummenspiels, das die beiden Netze spielen, ist eigentlich eine Trainingssitzung.

Bei jeder Iteration des Spiels gibt der Generator einen Stapel echter Datenproben und einen gleich großen Stapel generierter Datenproben an das Diskriminatornetz weiter. 

Der Diskriminator hat die Aufgabe, realen Daten hohe Wahrscheinlichkeiten und synthetischen Daten geringe Wahrscheinlichkeiten zuzuordnen und diese Informationen an den Generator zu übermitteln.

Der Generator nutzt diese Rückmeldung, um seine Parameter anzupassen, und das Spiel beginnt von vorn.

Durch das Nullsummenspiel entsteht eine Wettbewerbsdynamik. Diese hilft dem Generatornetzwerk, statistische Muster aus den Trainingsdaten zu erfassen und mithilfe von Deep Learning neue Muster zu erzeugen, die ähnliche Merkmale aufweisen.

Gleichzeitig lernt das Diskriminatornetzwerk mehr über die zugrundeliegende Verteilung der echten Trainingsdaten und kann die neuen Daten, die es erhält, besser klassifizieren.

Je weiter das Spiel fortschreitet, desto mehr passt der Generator die Parameter zum Generieren realistischer Daten an. Gleichzeitig passt der Diskriminator seine eigenen Parameter ständig an, um seine Vorhersagen zu verbessern.

Das Spiel geht so lange weiter, bis das Diskriminatornetz nicht mehr zwischen echten und generierten Proben unterscheiden kann. An diesem Punkt haben die beiden Netze Konvergenz erreicht und das Training wird beendet.

Verwandte Begriffe

Margaret Rouse
Redaktion
Margaret Rouse
Redaktion

Margaret Rouse ist eine preisgekrönte technische Autorin und Dozentin. Sie ist für ihre Fähigkeit bekannt, komplexe technische Themen simpel und nachvollziehbar zu erklären. In den letzten zwanzig Jahren sind ihre Erklärungen auf TechTarget-Websites erschienen und sie wurde in Artikeln der New York Times, des Time Magazine, USA Today, ZDNet, PC Magazine und Discovery Magazine als Quelle und Expertin zitiert. Wenn Sie einen Vorschlag für eine neue Definition haben oder eine technische Erklärung verbessern möchten, schicken Sie einfach Margaret eine E-Mail oder kontaktieren Sie sie auf LinkedIn oder Twitter.