KI-Tools im Test: Playground AI

In der "Deus Ex Machi­na? – KI-Tools im Test"-Reihe stel­len wir euch ver­schie­de­ne Tools vor, die mit­hil­fe von Künst­li­cher Intel­li­genz Schreib‑, Design- und Recher­che­pro­zes­se ver­ein­fa­chen sol­len. Mehr zur "Deus Ex Machina?"-Reihe gibt es hier.

Ein Bei­trag von Hele­na Bodem (Mas­ter­stu­di­en­gang Wis­sen­schaft-Medi­en-Kom­mu­ni­ka­ti­on, KIT Karlsruhe)

Im Überblick

Das digi­ta­le Werk­zeug Play­ground AI (playgroundai.com) ist ein Bild­ge­ne­ra­tor, der sowohl für Lai­en als auch erfah­re­ne Anwender:innen eine ein­fa­che Metho­de bie­tet, um Bil­der zu erstel­len und zu bear­bei­ten. Herz­stück des Tools ist eine „Text to Image“-KI, die es den Nut­zen­den ermög­licht, mit­tels spe­zi­fi­scher Text­an­wei­sun­gen (Prompts) Bil­der zu gene­rie­ren oder bestehen­de Bil­der zu ver­än­dern. Weil eine „Text to Image“-Generierung viel Raum für zufäl­li­ge Ergeb­nis­se lässt, ist unter dem Prompt-Feld noch eine wei­te­re Text­ein­ga­be mög­lich: die soge­nann­ten „Nega­ti­ve Prompts“, über die bestimm­te Merk­ma­le oder Ele­men­te expli­zit aus der Bild­ge­ne­rie­rung aus­ge­schlos­sen wer­den können.

Über eine Band­brei­te an mög­li­chen Fil­tern und Reg­lern kann die Bild­ge­ne­rie­rung fei­ner abge­stimmt wer­den. Da die dahin­ter­ste­hen­den Effek­te jedoch nicht intui­tiv zugäng­lich sind, ist es gera­de für Lai­en emp­feh­lens­wert, erst ein­mal bei den Stan­dard­ein­stel­lun­gen zu blei­ben. Denn gera­de am Anfang dürf­ten Anwender:innen von der Viel­falt der Ergeb­nis­se über­wäl­tigt sein: Selbst wenn man ein­fach den­sel­ben Text­prompt ste­hen­lässt und mehr­fach auf „Gene­ra­te“ klickt, pro­du­ziert das Tool unter­schied­li­che Bild­in­ter­pre­ta­tio­nen. Außer­dem kön­nen Nutzer:innen ihre eige­nen Fotos hoch­la­den und die­se mit der KI modi­fi­zie­ren. Sowohl ein bestehen­des als auch ein gene­rier­tes Bild kann bear­bei­tet wer­den, indem man Tei­le des Bil­des mas­kiert und über „Edit Ins­truc­tion“ mas­kier­te Objek­te ver­än­dert oder neue Objek­te hinzufügt.

Wer das Tool nut­zen möch­te, benö­tigt einen Goog­le-Account. In der kos­ten­frei­en Basis­ver­si­on kön­nen bis zu 1000 Bil­der pro Tag gene­riert oder bear­bei­tet wer­den. Die so erzeug­ten Bil­der kön­nen nicht nur her­un­ter­ge­la­den, son­dern auch qua­li­ta­tiv hoch­ska­liert wer­den. Wäh­rend Play­ground AI den Nut­zen­den die Ver­wen­dung der Bil­der für pri­va­te und kom­mer­zi­el­le Zwe­cke erlaubt, blei­ben auch bei die­sem Bild­ge­ne­ra­tor urhe­ber­recht­li­che und ethi­sche Fra­gen bestehen.

Die KI hinter der Anwendung

Die Tech­no­lo­gie, die Play­ground AI antreibt, basiert auf ver­schie­de­nen Aus­füh­run­gen des KI-Modells Sta­ble Dif­fu­si­on. Die­ser Name lei­tet sich von der Fir­ma Sta­bi­li­ty AI ab, die maß­geb­lich an der Ent­wick­lung von Sta­ble Dif­fu­si­on betei­ligt war. Sta­bi­li­ty AI inves­tier­te signi­fi­kan­te Men­gen an GPU-Rechen­leis­tung, um das Trai­ning die­ses Modells zu ermög­li­chen. Obwohl es diver­se "Text to Image"-KI-Modelle gibt, mit Dall‑E als wohl pro­mi­nen­tes­tem Ver­tre­ter, hebt sich Sta­ble Dif­fu­si­on dadurch ab, dass es als ein­zi­ges sei­ner Art im Open-Source-For­mat ver­öf­fent­licht wur­de: Das Modell ist voll­stän­dig öffent­lich ein­seh­bar und kann von der Ent­wick­ler­com­mu­ni­ty modi­fi­ziert werden.

In sei­ner Arbeits­wei­se nutzt Sta­ble Dif­fu­si­on das Prin­zip der Dif­fu­si­on, wobei Bil­der durch wie­der­hol­tes Hin­zu­fü­gen von Gauß’schem Rau­schen modi­fi­ziert wer­den, d.h. die Pixel eines Bil­des wer­den ent­schärft, bis es nur noch aus ver­schie­den­far­bi­gen Fle­cken oder Punk­ten besteht. Das KI-Modell wird dann dar­auf geschult, das „ver­rausch­te“ Bild wie­der zu rekon­stru­ie­ren und so eine Varia­ti­on des ursprüng­li­chen Bil­des zu erstellen.

Damit "Text to Image“-KIs mög­lichst viel­fäl­ti­ge Bil­der gene­rie­ren kön­nen, wird ein gro­ßes Set an Trai­nings­da­ten benö­tigt. Im Fall von Sta­ble Dif­fu­si­on wur­de ein Daten­set ver­wen­det, das unter dem Namen LAION 5B bekannt ist. Es ent­hält beein­dru­cken­de 5,8 Mil­li­ar­den HTML-Links zu ent­spre­chen­den Bild-Text-Paa­ren. Bei der Erstel­lung die­ses Sets wur­den Inhalts­be­wer­tung, Urhe­ber­rech­te oder Daten­schutz der Bil­der jedoch kaum berück­sich­tigt. So ent­deck­te eine Künst­le­rin zum Bei­spiel medi­zi­ni­sche Auf­nah­men in dem Set, die vor und nach einer Ope­ra­ti­on von ihr gemacht wor­den waren. Die Künst­le­rin hat nun kaum Chan­cen, die­se Bil­der löschen zu las­sen. Denn laut den AGBs von LAION kön­nen Besitzer:innen von Bil­dern die Löschung der Links aus dem Set nur dann bean­tra­gen, wenn sich iden­ti­fi­zier­ba­re Daten auf den ver­link­ten Bil­dern wie­der­fin­den, z.B. Name, Tele­fon­num­mer oder Adresse.

(Wei­te­re Infor­ma­tio­nen zu ethi­schen und recht­li­chen Kon­flik­ten ste­hen im Abschnitt „Ein­satz in der Wis­sen­schafts­kom­mu­ni­ka­ti­on“ sowie in der Info-Box.)

Das rhetorische Potenzial des Tools

Vor allem Per­so­nen mit krea­ti­vem und design­ori­en­tier­tem Hin­ter­grund dürf­ten von Play­ground AI ange­zo­gen wer­den. Die Mög­lich­kei­ten des Tools, Ideen schnell zu visua­li­sie­ren und Anpas­sun­gen der Bil­der ohne Vor­kennt­nis­se von pro­fes­sio­nel­len Bear­bei­tungs­pro­gram­men vor­zu­neh­men, machen die­ses aber auch für eine brei­te Mas­se interessant.

Aller­dings ist zu beto­nen, dass Play­ground AI nicht völ­lig intui­tiv in der Anwen­dung ist. Die For­mu­lie­rung eines effek­ti­ven Text­prompts erfor­dert Übung. Hier­bei emp­fiehlt sich die Ver­wen­dung von "Tags", kur­zen Bild­be­schrei­bun­gen, die in der Regel aus einem oder zwei Wör­tern bestehen und die durch Semi­ko­la getrennt anein­an­der­ge­reiht wer­den. Zudem gibt es eine Viel­zahl von Fil­tern, Ein­stell­pa­ra­me­tern und Bear­bei­tungs­op­tio­nen, die dabei hel­fen, die Ergeb­nis­se zu ver­fei­nern. Das kann für Einsteiger:innen anfangs über­for­dernd wirken.

Ein cha­rak­te­ris­ti­sches Merk­mal von "Text to Image"-Modellen ist ein hoher Zufalls­fak­tor beim Gene­rie­ren von Bil­dern. Dies wird vor allem bei der Ver­wen­dung von Play­ground AI deut­lich: Nutzer:innen kön­nen den "Generate"-Button wie­der­holt betä­ti­gen, ohne die Ein­stel­lun­gen oder den Prompt zu ändern, und erhal­ten den­noch jedes Mal unter­schied­li­che Ergeb­nis­se. Tat­säch­lich sind die Ergeb­nis­se so viel­fäl­tig, dass man schnell dazu über­ge­hen möch­te, ein beson­ders inter­es­san­tes Bild zu vari­ie­ren. Varia­tio­nen eines bestimm­ten Bil­des zu erzeu­gen ist bei­spiels­wei­se über die Gene­rie­rungs­num­mer eines Bil­des, den sog. Seed, mög­lich. (In der Benut­zer­ober­flä­che „Board“ gibt es hier­für sogar eine aus­wähl­ba­re Aktion.)

Ein wei­te­res Ärger­nis ist, dass das Tool Schwie­rig­kei­ten mit dem Gene­rie­ren von spe­zi­el­len Details wie Fin­gern und Fuß­ze­hen zu haben scheint. Um die­se und ähn­li­che Pro­ble­ma­ti­ken zu behe­ben, stellt Play­ground AI aller­dings eini­ge län­ge­re You­Tube-Tuto­ri­als zur Verfügung.

Das Tool hat zwei Benut­zer­ober­flä­chen – Board und Can­vas – die in ihrer Funk­tio­na­li­tät recht ähn­lich sind, jedoch unter­schied­li­che Schwer­punk­te für die Nut­zung set­zen. Wäh­rend Can­vas sich beson­ders dazu eig­net, schnell auf­ein­an­der­fol­gen­de Bil­der zu gene­rie­ren, ist das Board opti­mal, um Varia­tio­nen eines bereits erstell­ten Bil­des zu erzeugen.

Auf dem Bild ist die Canvas-Oberfläche von Playground AI zu sehen. Links ist ein Reiter zu sehen, in dem die Buttons "Image to Image", "Filter" und "Exclude from Image" stehen. In gelben Infoboxen steht "Filter: Bilder nach vorgegebenen Stilen erzeugen" und "negative prompt: Was soll von der Bildgenerierung ausgeschlossen werden?"
In der Mitte sind generierte Teller voller Spaghetti zu sehen, rechts davon ein Reiter mit Reglern und den Buttons "Prompt Guidance", "Quality & Details" und "Seed". Gelbe Infoboxen erklären "Seitenlängen: Veränderung liefert sehr unterschiedliche Ergebnisse, selbst wenn Seed vorgegeben und alle Parameter gleich"; "Prompt und Button zum Generieren"; "Parameter: Erhöhung der Regler liefert nicht automatisch besseres Ergebnis" und "Seed: spezielle Generierungsnummer. Hier Häkchen setzen, um starke Variationen vom Prompt zu erzeugen".
Play­ground AI: Can­vas-Benut­zer­ober­flä­che
Auf dem Bild ist die Board-Oberfläche von Playground AI zu sehen. Links ist ein Reiter zu sehen, in dem die Buttons "Prompt", "Exclude from Image" und "Image to Image" stehen. In gelben Infoboxen steht "Prompt: Was soll auf dem Bild zu sehen sein?" und "negative prompt: Was soll von der Bildgenerierung ausgeschlossen werden?"
In der Mitte sind zwei generierte Teller voller Spaghetti zu sehen, der obere ist angewählt und eine Bildbeschreibung sowie Bearbeitungsoptionen werden angezeigt. Eine gelbe Infobox erklärt "Bild-Aktionen: Edit - Bereich maskieren und bearbeiten; Inpaint - Bereich maskieren und neu generieren; Create Variants - Leichte Veränderungen genau dieses Bildes generieren".
Rechts davon ist ein Reiter mit weiteren Reglern und den Buttons "Seed", "Number of Images" und "Private Sessions". Gelbe Infoboxen erklären "Seed: spezielle Generierungsnummer. Hier Häkchen setzen, um starke Variationen vom Prompt zu erzeugen" und neben "Private Session" steht "Vor jeder Sitzung aktivieren, damit Bilder nicht automatisch mit der Community geteilt werden!".
Play­ground AI: Board-Benut­zer­ober­flä­che

Eine wich­ti­ge Anmer­kung zum Board: Hier wer­den Bil­der auto­ma­tisch mit der Com­mu­ni­ty geteilt, es sei denn, die Tei­len-Funk­ti­on wird vor der Gene­rie­rung deak­ti­viert. Die­se Ein­stel­lung muss vor jeder Nut­zung erneut vor­ge­nom­men werden.

Einsatz in der Wissenschaftskommunikation

In einem Selbst­test zeigt sich, wel­che Mög­lich­kei­ten und Gren­zen das Tool bie­tet. Für den Ent­wurf eines Titel­bilds zu einem jour­na­lis­ti­schen Arti­kel über künst­li­che Intel­li­genz erweist sich Play­ground AI als nütz­lich. Ein ein­fa­cher Prompt wie „Arti­fi­ci­al Intel­li­gence“ kom­bi­niert mit ver­schie­de­nen Fil­tern und Ein­stel­lun­gen lie­fert rasch inno­va­ti­ve Bild­kon­zep­te. Mit ange­pass­ter Prompt-Ein­ga­be und kor­rek­tem Bild­ver­hält­nis kann ein anspre­chen­des Resul­tat erzielt werden.

Ein Robotergesicht mit menschlichen Zügen ist abgebildet. Die Seiten des Kopfes sind geöffnet, es ragen Kabel aus dem Schädel die in den Hintergrund übergehen und dort ein Muster aus technischen Verbindungen bilden.
Mit Play­ground AI gene­rier­tes Bild für einen Arti­kel über künst­li­che Intel­li­genz

Prompt: Arti­fi­ci­al Intel­li­gence, Intel­li­gence, inte­res­t­ing, con­nec­tions, illus­tra­ti­on, artic­le
Nega­ti­ve Prompt: human, human face, dis­tur­bing, noi­se, too much detail

Dage­gen schei­ter­te der Ver­such, ein ein­fa­ches Dia­gramm mit vier Beschrif­tun­gen zu erstel­len. Zwar gibt es wahr­schein­lich Mög­lich­kei­ten, dem Tool genaue­re Anwei­sun­gen zu geben, aber der hohe Zufalls­fak­tor bei der Bild-Gene­rie­rung durch Play­ground AI steht akku­ra­ten Dia­gram­men den­noch im Weg. Und wie steht es um wis­sen­schaft­li­che Dar­stel­lun­gen? Ist es bei­spiels­wei­se mög­lich, eine mikro­sko­pi­sche Ansicht des Vogel­grip­pe-Virus zu gene­rie­ren? Auch wenn das Virus bereits umfas­send erforscht ist, erweist sich das Vor­ha­ben ohne kon­kre­te Bild­vor­la­ge als schwie­rig.

Sechs Bilder sind nebeneinander aufgereiht, alle generiert mit dem prompt "bird flu virus". In den meisten Bildern ist ein Virus abgebildet, wie man ihn unter dem Mikroskop sehen kann. In manchen Bilder ist der Viruskern in Vogelform abgebildet, in den beiden mittleren Bildern sind Zeichnungen von Hühnern neben den Mikroben eingefügt.
Ver­such, eine mikro­sko­pi­sche Dar­stel­lung des Vogel­grip­pe Virus mit Play­ground AI zu gene­rie­ren.

Prompt: bird flu virus, Avi­an influ­en­za, virus, struc­tu­re, sci­ence, micro­scope, sci­en­ti­fic, microscopic

Natür­lich fin­det Wis­sen­schafts­kom­mu­ni­ka­ti­on nicht nur über Arti­kel und wis­sen­schaft­li­che Paper statt. Wich­ti­ge Platt­for­men sind auch die sozia­len Medi­en. Hier wer­den häu­fig ein­fach bun­te Bil­der benö­tigt, die die Auf­merk­sam­keit der Nutzer:innen auf sich zie­hen. Gera­de für die­sen Zweck lie­fert das Tool schnell viel­ver­spre­chen­de Ergebnisse.

Pro Bild wur­de ledig­lich der ver­wen­de­te Fil­ter ver­än­dert (Fil­ter, von links nach rechts: None, Bella’s Dre­a­my Sti­ckers, Macro Rea­lism, Ethe­re­al Low poly, Dream­sha­per)

Prompt: sci­ence, com­mu­ni­ca­ti­on
Nega­ti­ve Prompt: bad illus­tra­ti­on, dis­pro­por­tio­ned, kitsch, morbid

Gut zu wis­sen: Da das KI-Modell Sta­ble Dif­fu­si­on mit Bil­dern der Grö­ße 512 x 512 trai­niert wur­de, gene­riert Play­ground AI in die­sem Sei­ten­ver­hält­nis beson­ders gute Bil­der. Für Bild­stre­cken ist es des­halb emp­feh­lens­wert die vor­ein­ge­stell­te Höhe und Län­ge auf jeweils 512 zu belas­sen und aus­ge­wähl­te Bil­der nach­träg­lich hoch zu ska­lie­ren (Rechts­klick > „Ups­ca­le by 4x“).

Wer nun sei­ne selbst gene­rier­ten Bil­der in der Hand hält, stellt sich wahr­schein­lich auch Fra­gen rund um Bild­rech­te und ‑nut­zung. In den FAQs (Stand: 04.09.2023) gibt Play­ground AI eine groß­zü­gi­ge Ant­wort auf die Fra­ge „How does copy­right work? Do I own the images I crea­te?“: Sämt­li­che Rech­te, Titel und Inter­es­sen an den erzeug­ten Bil­dern wer­den den Nutzer:innen über­las­sen – sowohl für pri­va­te als auch für kom­mer­zi­el­le Zwecke. 

Aller­dings prä­sen­tiert sich die Ange­le­gen­heit in den Nut­zungs­be­din­gun­gen dif­fe­ren­zier­ter. Hier behält sich Play­ground AI, eben­so wie sei­nen Rechts­nach­fol­gern und Bevoll­mäch­tig­ten, weit­rei­chen­de Nut­zungs­rech­te vor. Das erstreckt sich nicht nur auf über das Tool gene­rier­te Inhal­te, son­dern auch auf jeg­li­che Bil­der, die von den Nutzer:innen ein­ge­bracht wer­den. Wer außer­dem ver­säumt, sei­ne Krea­tio­nen in einem pri­va­ten Modus zu erstel­len (was zu Beginn jeder Board-Sit­zung erneut getan wer­den muss), räumt auch ande­ren Mit­glie­dern der Platt­form eine nicht-exklu­si­ve Nut­zungs­li­zenz ein.

Der Fall DeviantArt: Ethische Konflikte mit KI-generierter Kunst

Devi­ant­Art, eine unter Kunst­schaf­fen­den belieb­te Platt­form, geriet ins Ram­pen­licht, als sie ein „Text to Image“-Tool namens „Drea­mUp“ ein­führ­te. Das Pro­blem dabei: Devi­ant­Art mar­kier­te auto­ma­tisch alle Kunst­wer­ke der Benutzer:innen als für KI-Daten­sät­ze ver­wend­bar. Zudem wie­sen eini­ge der KI-gene­rier­ten Bil­der ver­blüf­fen­de Ähn­lich­kei­ten mit exis­tie­ren­den Kunst­wer­ken auf. Eine Grup­pe aus Kunst­schaf­fen­den schloss sich zu einer Sam­mel­kla­ge wegen Urhe­ber­rechts­ver­let­zun­gen zusam­men und der Fall Devi­ant­Art ent­fach­te eine hit­zi­ge Debat­te über die ethi­schen Gren­zen von KI im Kunst-Bereich: Kann Tech­no­lo­gie wirk­lich krea­tiv sein, wenn sie ledig­lich das geis­ti­ge Eigen­tum ande­rer modifiziert?

Was das kon­kret bedeu­tet: Wer ein eige­nes Bild in das Tool ein­speist, z.B. als Vor­la­ge oder zur Bear­bei­tung, der soll­te stets sicher sein, dass er die ent­spre­chen­den Rech­te dar­an besitzt. Denn man muss damit rech­nen, dass Play­ground AI die­ses Bild wei­ter­ver­wen­det. Zudem stellt Play­ground AI in sei­nen Nut­zungs­be­din­gun­gen klar, dass die Nut­zen­den selbst für ihre Akti­vi­tä­ten ver­ant­wort­lich sind und weist dar­auf hin, dass gene­rier­te Bil­der geschütz­ten Bil­dern unab­sicht­lich ähneln könn­ten. In der Pra­xis ist es also wahr­schein­lich rat­sam, zumin­dest eine Goog­le-Bil­der­su­che durch­zu­füh­ren, bevor man ein gene­rier­tes Bild für öffent­li­che Zwe­cke verwendet.

Zu beden­ken ist auch, dass nach aktu­el­lem Stand noch sehr unsi­cher ist, ob für KI-gene­rier­te Bil­der ein Copy­right oder ein Urhe­ber­recht gel­tend gemacht wer­den kann. In den USA haben Gerich­te bereits Copy­right-Anträ­ge abge­lehnt. Wäh­rend die kom­mer­zi­el­le Nut­zung also wahr­schein­lich kein Pro­blem dar­stellt, könn­te es even­tu­ell schwie­rig wer­den juris­ti­sche Schrit­te ein­zu­lei­ten, wenn eine ande­re Per­son die eige­nen KI-gene­rier­ten Wer­ke verwendet.

Wrap-Up

Play­ground AI“ hält, was sein Name ver­spricht: Es bie­tet einen krea­ti­ven Spiel­platz, auf dem sich Nutzer:innen nach Her­zens­lust mit Wör­tern und Ein­stel­lun­gen aus­pro­bie­ren kön­nen, um schnell visu­ell anspre­chen­de Ergeb­nis­se zu erhal­ten. Doch die anfäng­li­che Eupho­rie kann schnell in Frus­tra­ti­on umschla­gen, wenn das ange­streb­te Resul­tat uner­reich­bar scheint. Beson­ders im Kon­text der Wis­sen­schafts­kom­mu­ni­ka­ti­on, wo Genau­ig­keit und Prä­zi­si­on im Vor­der­grund ste­hen, hat Play­ground AI sei­ne Gren­zen und eig­net sich eher, um schmü­cken­des Bei­werk zu erzeugen.

Tie­fer­ge­hen­de Recher­chen zu dem Tool sor­gen für gemisch­te Gefüh­le: Einer­seits ist es moti­vie­rend, Play­ground AI durch ver­bes­ser­te Prompts und prä­zi­se­re Ein­stel­lun­gen zu immer bes­se­ren Ergeb­nis­sen anzu­re­gen. Ande­rer­seits stößt man schnell auf Infor­ma­tio­nen dar­über, dass für die KI des Tools Bil­der ver­wen­det wur­den, deren Schöpfer:innen weder zuge­stimmt haben, noch dafür ent­lohnt wurden.