In der "Deus Ex Machina? – KI-Tools im Test"-Reihe stellen wir euch verschiedene Tools vor, die mithilfe von Künstlicher Intelligenz Schreib‑, Design- und Rechercheprozesse vereinfachen sollen. Mehr zur "Deus Ex Machina?"-Reihe gibt es hier.
Ein Beitrag von Helena Bodem (Masterstudiengang Wissenschaft-Medien-Kommunikation, KIT Karlsruhe)
Im Überblick
Das digitale Werkzeug Playground AI (playgroundai.com) ist ein Bildgenerator, der sowohl für Laien als auch erfahrene Anwender:innen eine einfache Methode bietet, um Bilder zu erstellen und zu bearbeiten. Herzstück des Tools ist eine „Text to Image“-KI, die es den Nutzenden ermöglicht, mittels spezifischer Textanweisungen (Prompts) Bilder zu generieren oder bestehende Bilder zu verändern. Weil eine „Text to Image“-Generierung viel Raum für zufällige Ergebnisse lässt, ist unter dem Prompt-Feld noch eine weitere Texteingabe möglich: die sogenannten „Negative Prompts“, über die bestimmte Merkmale oder Elemente explizit aus der Bildgenerierung ausgeschlossen werden können.
Über eine Bandbreite an möglichen Filtern und Reglern kann die Bildgenerierung feiner abgestimmt werden. Da die dahinterstehenden Effekte jedoch nicht intuitiv zugänglich sind, ist es gerade für Laien empfehlenswert, erst einmal bei den Standardeinstellungen zu bleiben. Denn gerade am Anfang dürften Anwender:innen von der Vielfalt der Ergebnisse überwältigt sein: Selbst wenn man einfach denselben Textprompt stehenlässt und mehrfach auf „Generate“ klickt, produziert das Tool unterschiedliche Bildinterpretationen. Außerdem können Nutzer:innen ihre eigenen Fotos hochladen und diese mit der KI modifizieren. Sowohl ein bestehendes als auch ein generiertes Bild kann bearbeitet werden, indem man Teile des Bildes maskiert und über „Edit Instruction“ maskierte Objekte verändert oder neue Objekte hinzufügt.
Wer das Tool nutzen möchte, benötigt einen Google-Account. In der kostenfreien Basisversion können bis zu 1000 Bilder pro Tag generiert oder bearbeitet werden. Die so erzeugten Bilder können nicht nur heruntergeladen, sondern auch qualitativ hochskaliert werden. Während Playground AI den Nutzenden die Verwendung der Bilder für private und kommerzielle Zwecke erlaubt, bleiben auch bei diesem Bildgenerator urheberrechtliche und ethische Fragen bestehen.
Die KI hinter der Anwendung
Die Technologie, die Playground AI antreibt, basiert auf verschiedenen Ausführungen des KI-Modells Stable Diffusion. Dieser Name leitet sich von der Firma Stability AI ab, die maßgeblich an der Entwicklung von Stable Diffusion beteiligt war. Stability AI investierte signifikante Mengen an GPU-Rechenleistung, um das Training dieses Modells zu ermöglichen. Obwohl es diverse "Text to Image"-KI-Modelle gibt, mit Dall‑E als wohl prominentestem Vertreter, hebt sich Stable Diffusion dadurch ab, dass es als einziges seiner Art im Open-Source-Format veröffentlicht wurde: Das Modell ist vollständig öffentlich einsehbar und kann von der Entwicklercommunity modifiziert werden.
In seiner Arbeitsweise nutzt Stable Diffusion das Prinzip der Diffusion, wobei Bilder durch wiederholtes Hinzufügen von Gauß’schem Rauschen modifiziert werden, d.h. die Pixel eines Bildes werden entschärft, bis es nur noch aus verschiedenfarbigen Flecken oder Punkten besteht. Das KI-Modell wird dann darauf geschult, das „verrauschte“ Bild wieder zu rekonstruieren und so eine Variation des ursprünglichen Bildes zu erstellen.
Damit "Text to Image“-KIs möglichst vielfältige Bilder generieren können, wird ein großes Set an Trainingsdaten benötigt. Im Fall von Stable Diffusion wurde ein Datenset verwendet, das unter dem Namen LAION 5B bekannt ist. Es enthält beeindruckende 5,8 Milliarden HTML-Links zu entsprechenden Bild-Text-Paaren. Bei der Erstellung dieses Sets wurden Inhaltsbewertung, Urheberrechte oder Datenschutz der Bilder jedoch kaum berücksichtigt. So entdeckte eine Künstlerin zum Beispiel medizinische Aufnahmen in dem Set, die vor und nach einer Operation von ihr gemacht worden waren. Die Künstlerin hat nun kaum Chancen, diese Bilder löschen zu lassen. Denn laut den AGBs von LAION können Besitzer:innen von Bildern die Löschung der Links aus dem Set nur dann beantragen, wenn sich identifizierbare Daten auf den verlinkten Bildern wiederfinden, z.B. Name, Telefonnummer oder Adresse.
(Weitere Informationen zu ethischen und rechtlichen Konflikten stehen im Abschnitt „Einsatz in der Wissenschaftskommunikation“ sowie in der Info-Box.)
Das rhetorische Potenzial des Tools
Vor allem Personen mit kreativem und designorientiertem Hintergrund dürften von Playground AI angezogen werden. Die Möglichkeiten des Tools, Ideen schnell zu visualisieren und Anpassungen der Bilder ohne Vorkenntnisse von professionellen Bearbeitungsprogrammen vorzunehmen, machen dieses aber auch für eine breite Masse interessant.
Allerdings ist zu betonen, dass Playground AI nicht völlig intuitiv in der Anwendung ist. Die Formulierung eines effektiven Textprompts erfordert Übung. Hierbei empfiehlt sich die Verwendung von "Tags", kurzen Bildbeschreibungen, die in der Regel aus einem oder zwei Wörtern bestehen und die durch Semikola getrennt aneinandergereiht werden. Zudem gibt es eine Vielzahl von Filtern, Einstellparametern und Bearbeitungsoptionen, die dabei helfen, die Ergebnisse zu verfeinern. Das kann für Einsteiger:innen anfangs überfordernd wirken.
Ein charakteristisches Merkmal von "Text to Image"-Modellen ist ein hoher Zufallsfaktor beim Generieren von Bildern. Dies wird vor allem bei der Verwendung von Playground AI deutlich: Nutzer:innen können den "Generate"-Button wiederholt betätigen, ohne die Einstellungen oder den Prompt zu ändern, und erhalten dennoch jedes Mal unterschiedliche Ergebnisse. Tatsächlich sind die Ergebnisse so vielfältig, dass man schnell dazu übergehen möchte, ein besonders interessantes Bild zu variieren. Variationen eines bestimmten Bildes zu erzeugen ist beispielsweise über die Generierungsnummer eines Bildes, den sog. Seed, möglich. (In der Benutzeroberfläche „Board“ gibt es hierfür sogar eine auswählbare Aktion.)
Ein weiteres Ärgernis ist, dass das Tool Schwierigkeiten mit dem Generieren von speziellen Details wie Fingern und Fußzehen zu haben scheint. Um diese und ähnliche Problematiken zu beheben, stellt Playground AI allerdings einige längere YouTube-Tutorials zur Verfügung.
Das Tool hat zwei Benutzeroberflächen – Board und Canvas – die in ihrer Funktionalität recht ähnlich sind, jedoch unterschiedliche Schwerpunkte für die Nutzung setzen. Während Canvas sich besonders dazu eignet, schnell aufeinanderfolgende Bilder zu generieren, ist das Board optimal, um Variationen eines bereits erstellten Bildes zu erzeugen.
Eine wichtige Anmerkung zum Board: Hier werden Bilder automatisch mit der Community geteilt, es sei denn, die Teilen-Funktion wird vor der Generierung deaktiviert. Diese Einstellung muss vor jeder Nutzung erneut vorgenommen werden.
Einsatz in der Wissenschaftskommunikation
In einem Selbsttest zeigt sich, welche Möglichkeiten und Grenzen das Tool bietet. Für den Entwurf eines Titelbilds zu einem journalistischen Artikel über künstliche Intelligenz erweist sich Playground AI als nützlich. Ein einfacher Prompt wie „Artificial Intelligence“ kombiniert mit verschiedenen Filtern und Einstellungen liefert rasch innovative Bildkonzepte. Mit angepasster Prompt-Eingabe und korrektem Bildverhältnis kann ein ansprechendes Resultat erzielt werden.
Prompt: Artificial Intelligence, Intelligence, interesting, connections, illustration, article
Negative Prompt: human, human face, disturbing, noise, too much detail
Dagegen scheiterte der Versuch, ein einfaches Diagramm mit vier Beschriftungen zu erstellen. Zwar gibt es wahrscheinlich Möglichkeiten, dem Tool genauere Anweisungen zu geben, aber der hohe Zufallsfaktor bei der Bild-Generierung durch Playground AI steht akkuraten Diagrammen dennoch im Weg. Und wie steht es um wissenschaftliche Darstellungen? Ist es beispielsweise möglich, eine mikroskopische Ansicht des Vogelgrippe-Virus zu generieren? Auch wenn das Virus bereits umfassend erforscht ist, erweist sich das Vorhaben ohne konkrete Bildvorlage als schwierig.
Prompt: bird flu virus, Avian influenza, virus, structure, science, microscope, scientific, microscopic
Natürlich findet Wissenschaftskommunikation nicht nur über Artikel und wissenschaftliche Paper statt. Wichtige Plattformen sind auch die sozialen Medien. Hier werden häufig einfach bunte Bilder benötigt, die die Aufmerksamkeit der Nutzer:innen auf sich ziehen. Gerade für diesen Zweck liefert das Tool schnell vielversprechende Ergebnisse.
Prompt: science, communication
Negative Prompt: bad illustration, disproportioned, kitsch, morbid
Gut zu wissen: Da das KI-Modell Stable Diffusion mit Bildern der Größe 512 x 512 trainiert wurde, generiert Playground AI in diesem Seitenverhältnis besonders gute Bilder. Für Bildstrecken ist es deshalb empfehlenswert die voreingestellte Höhe und Länge auf jeweils 512 zu belassen und ausgewählte Bilder nachträglich hoch zu skalieren (Rechtsklick > „Upscale by 4x“).
Wer nun seine selbst generierten Bilder in der Hand hält, stellt sich wahrscheinlich auch Fragen rund um Bildrechte und ‑nutzung. In den FAQs (Stand: 04.09.2023) gibt Playground AI eine großzügige Antwort auf die Frage „How does copyright work? Do I own the images I create?“: Sämtliche Rechte, Titel und Interessen an den erzeugten Bildern werden den Nutzer:innen überlassen – sowohl für private als auch für kommerzielle Zwecke.
Allerdings präsentiert sich die Angelegenheit in den Nutzungsbedingungen differenzierter. Hier behält sich Playground AI, ebenso wie seinen Rechtsnachfolgern und Bevollmächtigten, weitreichende Nutzungsrechte vor. Das erstreckt sich nicht nur auf über das Tool generierte Inhalte, sondern auch auf jegliche Bilder, die von den Nutzer:innen eingebracht werden. Wer außerdem versäumt, seine Kreationen in einem privaten Modus zu erstellen (was zu Beginn jeder Board-Sitzung erneut getan werden muss), räumt auch anderen Mitgliedern der Plattform eine nicht-exklusive Nutzungslizenz ein.
Der Fall DeviantArt: Ethische Konflikte mit KI-generierter Kunst
DeviantArt, eine unter Kunstschaffenden beliebte Plattform, geriet ins Rampenlicht, als sie ein „Text to Image“-Tool namens „DreamUp“ einführte. Das Problem dabei: DeviantArt markierte automatisch alle Kunstwerke der Benutzer:innen als für KI-Datensätze verwendbar. Zudem wiesen einige der KI-generierten Bilder verblüffende Ähnlichkeiten mit existierenden Kunstwerken auf. Eine Gruppe aus Kunstschaffenden schloss sich zu einer Sammelklage wegen Urheberrechtsverletzungen zusammen und der Fall DeviantArt entfachte eine hitzige Debatte über die ethischen Grenzen von KI im Kunst-Bereich: Kann Technologie wirklich kreativ sein, wenn sie lediglich das geistige Eigentum anderer modifiziert?
Was das konkret bedeutet: Wer ein eigenes Bild in das Tool einspeist, z.B. als Vorlage oder zur Bearbeitung, der sollte stets sicher sein, dass er die entsprechenden Rechte daran besitzt. Denn man muss damit rechnen, dass Playground AI dieses Bild weiterverwendet. Zudem stellt Playground AI in seinen Nutzungsbedingungen klar, dass die Nutzenden selbst für ihre Aktivitäten verantwortlich sind und weist darauf hin, dass generierte Bilder geschützten Bildern unabsichtlich ähneln könnten. In der Praxis ist es also wahrscheinlich ratsam, zumindest eine Google-Bildersuche durchzuführen, bevor man ein generiertes Bild für öffentliche Zwecke verwendet.
Zu bedenken ist auch, dass nach aktuellem Stand noch sehr unsicher ist, ob für KI-generierte Bilder ein Copyright oder ein Urheberrecht geltend gemacht werden kann. In den USA haben Gerichte bereits Copyright-Anträge abgelehnt. Während die kommerzielle Nutzung also wahrscheinlich kein Problem darstellt, könnte es eventuell schwierig werden juristische Schritte einzuleiten, wenn eine andere Person die eigenen KI-generierten Werke verwendet.
Wrap-Up
„Playground AI“ hält, was sein Name verspricht: Es bietet einen kreativen Spielplatz, auf dem sich Nutzer:innen nach Herzenslust mit Wörtern und Einstellungen ausprobieren können, um schnell visuell ansprechende Ergebnisse zu erhalten. Doch die anfängliche Euphorie kann schnell in Frustration umschlagen, wenn das angestrebte Resultat unerreichbar scheint. Besonders im Kontext der Wissenschaftskommunikation, wo Genauigkeit und Präzision im Vordergrund stehen, hat Playground AI seine Grenzen und eignet sich eher, um schmückendes Beiwerk zu erzeugen.
Tiefergehende Recherchen zu dem Tool sorgen für gemischte Gefühle: Einerseits ist es motivierend, Playground AI durch verbesserte Prompts und präzisere Einstellungen zu immer besseren Ergebnissen anzuregen. Andererseits stößt man schnell auf Informationen darüber, dass für die KI des Tools Bilder verwendet wurden, deren Schöpfer:innen weder zugestimmt haben, noch dafür entlohnt wurden.