KI-Tools im Test: Designs AI

In der "Deus Ex Machi­na? – KI-Tools im Test"-Reihe stel­len wir euch ver­schie­de­ne Tools vor, die mit­hil­fe von Künst­li­cher Intel­li­genz Schreib‑, Design- und Recher­che­pro­zes­se ver­ein­fa­chen sol­len. Mehr zur "Deus Ex Machina?"-Reihe gibt es hier.

Im Überblick

Designs.ai ist ein KI-basier­tes Design­tool der Fir­ma Inma­gi­ne Lab, das Logo‑, Video- und Gra­fik­erstel­lung umfasst. Zudem beinhal­tet das Pro­gramm die Mög­lich­keit, von einem Text­ge­ne­ra­tor Tex­te per Ein­ga­be­prompt erstel­len zu las­sen oder bereits geschrie­be­ne Tex­te mit einem Audio­ge­nera­tor zu ver­to­nen. Nutzer:innen kön­nen dabei aus über zwan­zig Spra­chen – unter ande­rem Deutsch – und meh­re­ren Sprecher:innen-Optionen je Spra­che auswählen.

Der Auf­bau des Logo- und Design­tools erin­nert in sei­ner Struk­tur und sei­nem User­de­sign an die bekann­te Design­soft­ware Can­va. Für Logos wer­den auf Basis eines inhalt­li­chen Inputs Design­vor­schlä­ge erstellt. Die­se Opti­on fehlt beim Design­ma­ker, bei dem aus­schließ­lich aus bereits bestehen­den Tem­pla­tes Vor­la­gen aus­ge­wählt und anschlie­ßend bear­bei­tet wer­den kön­nen. Für zusätz­li­chen Input kön­nen Nutzer:innen Vor­schlä­ge ein­ho­len, wel­che Far­ben und Schrift­ar­ten gut zusammenpassen.

Bild 1: Screenshot der Startseite von Designs.ai nach Login
Bild 1: Screen­shot der Start­sei­te von Designs.ai nach Login

Für beson­ders gute Ergeb­nis­se, ins­be­son­de­re für den Copy­wri­ter, sind mög­lichst detail­liert aus­for­mu­lier­te Prompts ein Muss. Je mehr Infor­ma­tio­nen das Tool zur Ziel­grup­pe, dem Ver­wen­dungs­zweck sowie Stich­wor­ten, die im Text vor­kom­men sol­len, hat, des­to bes­ser ist das Ergeb­nis. Aus die­sem Grund lohnt sich die Kom­bi­na­ti­on mit Ange­bo­ten wie Per­ple­xi­ty AI oder dem Bing Chat­bot, die zusätz­li­che Infor­ma­tio­nen für Prompts lie­fern kön­nen. Mit RATH von Kana­ries Data (ein Daten­ana­ly­se- und ‑visua­li­sie­rungs­tool), kön­nen zudem Daten­vi­sua­li­sie­run­gen für Infor­ma­ti­ons­ma­te­ria­li­en mit Designs.ai erstellt werden.

Inma­gi­ne Lab ver­mark­tet Designs.ai beson­ders an Grafikdesigner:innen und Kom­mu­ni­ka­ti­ons­ab­tei­lun­gen. Im Ver­gleich zu ande­ren KI-Tools ist Designs.ai bis­her aber noch weit­ge­hend unbe­kannt – zumin­dest, wenn man die Fol­lo­wer­zah­len des Unter­neh­mens auf Social Media mit denen von Ope­nAI, der Fir­ma aus deren Haus ChatGPT stammt, oder dem Online-Design­tool Can­va vergleicht.

Die KI hinter der Anwendung

Künst­li­che Intel­li­genz gene­riert aus den Anga­ben, die Nutzer:innen dem jewei­li­gen Tool geben, meh­re­re Design­va­ri­an­ten und Vor­schlä­ge, wie die­se wei­ter bear­bei­tet wer­den kön­nen. In den Tools von Designs.ai, die mit geschrie­be­ner oder gespro­che­ner Spra­che arbei­ten, wird maschi­nel­les Ler­nen ein­ge­setzt, um Tex­te basie­rend auf einem Prompt zu gene­rie­ren (ähn­lich wie bei ChatGPT, aller­dings ohne die Chat­funk­ti­on) und zu vertonen.

Designs.ai wird mit "Inma­gi­ne Brain" betrie­ben, einem KI-Pro­dukt der Fir­ma Inma­gi­ne Ltd. Die Soft­ware ist käuf­lich erwerb­bar zum Ein­bau in eige­ne Web­sites und Online-Ange­bo­te. Die Web­site gibt kei­nen Hin­weis dar­auf, auf Basis wel­cher Daten "Inma­gi­ne Brain" trai­niert wur­de. Es wird ledig­lich dar­auf hin­ge­wie­sen, dass ver­gan­ge­ne Such­an­fra­gen von Nutzer:innen aus­ge­wer­tet wer­den, um künf­ti­ge Such­an­fra­gen prä­zi­ser aus­zu­füh­ren und dass Natu­ral Lan­guage Pro­ces­sing und Image Ana­ly­sis im Aus­wer­tungs­pro­zess vor­kom­men – so ein Hin­weis im Web­site-Abschnitt "Ser­vices". In den FAQs von Designs.ai wird erläu­tert, dass die Design­tools auf einem Lan­guage Model basie­ren, das auch Bil­der und Vide­os auf ent­hal­te­ne Ele­men­te aus­wer­ten und rele­van­ten Text­pas­sa­gen in einem Skript zuwei­sen kann.

Das rhetorische Potenzial des Tools

Auf der Start­sei­te ver­spricht Designs.ai, dass es mög­lich sei, inner­halb von zwei Minu­ten Logos, Vide­os und mehr zu erstel­len. Kann das Pro­gramm das Ver­spre­chen halten?

Die Ant­wort: Kommt dar­auf an. Je höher der eige­ne Anspruch und je kom­pli­zier­ter die Anfor­de­run­gen, des­to län­ger wird auch die Bear­bei­tung brau­chen. Auf Text­prompts reagiert das Tex­terstel­lungs­tool schnell und Anpas­sun­gen an Text­sor­te und Level an Kom­pli­ziert­heit sind mög­lich, aller­dings benö­tigt man oft­mals meh­re­re Ver­su­che, bis der Prompt für den Text­ge­ne­ra­tor in genau dem rich­ti­gen Text umge­setzt wird.

Bild 2: Screen­shot aus dem Copy­wri­ter mit Ein­ga­be­prompt und dem KI-gene­rier­ten Text

Wie man im Bei­spiel sieht, ist der von dem Gene­ra­tor aus­ge­ge­be­ne Text in sich logisch auf­ge­baut und von Recht­schrei­bung und Zei­chen­set­zung her stim­mig – auch wenn der gewünsch­te Part zur che­mi­schen Reak­ti­on von der Text-KI über­sprun­gen wur­de. Zudem ist der Text sehr all­ge­mein for­mu­liert (was auch bei ande­ren Prompts der Fall war) und geht inhalt­lich nicht in die Tie­fe. Und wie bei ande­ren Text­ge­ne­rie­rungs­tools auch ist die inhalt­li­che Rich­tig­keit nicht garan­tiert – was die Nutzer:innen dazu zwingt, die Inhal­te zu über­prü­fen. Hin­zu kommt, dass der Text­ge­ne­ra­tor die Quel­len für sei­ne Infor­ma­tio­nen nicht angibt und auch Inma­gi­ne Ltd. die Trai­nings­da­ten bis­her nicht offen­ge­legt hat.

Posi­tiv anzu­mer­ken ist, dass die Anpas­sung auf die Ziel­grup­pe "sechs­te Klas­se" vom Ton­fall und Schwie­rig­keits­grad des Tex­tes funk­tio­niert. Je nach Prompt­ein­ga­be kom­men aller­dings Wie­der­ho­lun­gen im Text vor – wie auch im Bei­spiel hier mit der "dome-shaped struc­tu­re" –, um eine Über­ar­bei­tung des Tex­tes kommt man daher sicher nicht her­um. Zudem kann der Text­ge­ne­ra­tor nicht auf Infor­ma­tio­nen aus dem Inter­net zurück­grei­fen. Das hat zur Fol­ge, dass neue­re Ereig­nis­se und kom­ple­xe­re Infor­ma­tio­nen nicht auto­ma­tisch von der KI umge­setzt wer­den kön­nen und im Prompt ent­hal­ten sein müs­sen. Der sprach­li­che Ton inner­halb eines Tex­tes bleibt jeweils auf einem ver­gleich­ba­ren Level. Für Per­so­na­li­sie­rung der Tex­te oder die Imple­men­tie­rung eines eige­nen Schreib­stils ist hier nur wenig Spiel­raum gege­ben, Schrei­ben­de müs­sen dies in einem zwei­ten, manu­el­len Schritt anpas­sen. Und dies alles vor dem Hin­ter­grund, dass der Text­ge­ne­ra­tor nicht im Chat ver­wen­det wer­den kann, son­dern jedes Mal einen neu­en Prompt fäl­lig ist.

Ist man zufrie­den mit dem Text, kann man die­sen über die Gra­fik­erstel­lungs­funk­ti­on oder das Videoer­stel­lungs­tool wei­ter­ver­wen­den. Bei der Videoer­stel­lung wird zuerst der Text ein­ge­ge­ben (für die­sen Ver­such ist der Eis­vul­kan­text aus dem ers­ten Bei­spiel die Grund­la­ge für das Video), der anschlie­ßend mit einem auto­ma­tisch gene­rier­ten Voice-over vor­ge­le­sen wird. Anschlie­ßend wählt man aus ver­schie­de­nen Kate­go­rien die Funk­ti­on aus, für die das Video erstellt wird: Bil­dung, Wer­bung, Bau­bran­che und ande­re mehr. Für den Eis­vul­kan­text hat der Gene­ra­tor die The­men­fel­der Bau­bran­che oder Fort­be­we­gung als pas­sen­de Kate­go­rien vor­ge­schla­gen – bei­de pas­sen frei­lich nicht zum Text. Nach der Aus­wahl von Spra­che und Stim­me erstellt das Pro­gramm einen Video­vor­schlag mit bereits aus­ge­wähl­ten Sequen­zen und einer Hintergrundmusik.

Bild 3: Screen­shot aus dem Video­ma­ker nach Gene­rie­rung eines ers­ten Video-Vor­schlags, der auf Basis des Textin­puts erstellt wurde

Das Tool geht dabei so vor, dass pro Satz ein neu­er Clip gezeigt wird. Wie man aus den im unte­ren Abschnitt ein­ge­blen­de­ten Clips sieht, ori­en­tiert sich die KI dabei an bestimm­ten Stich­wör­tern im Satz und sucht dazu pas­sen­de Clips – die aber nicht immer den Gesamt­kon­text des Vide­os tref­fen. Wie man an den am unte­ren Bild­rand ein­ge­blen­de­ten Clips erken­nen kann, hat das Tool sich für die ers­ten drei Clips auf Wor­te wie "Jupi­ter" oder "Was­ser" kon­zen­triert, für den vier­ten auf "Pro­zess" – wodurch das Pro­gramm den Clip mit den Kle­be­zet­teln als für das The­ma "Eis­vul­ka­ne" pas­send befun­den hat. Auch hier ist also manu­el­les Nach­schär­fen notwendig.

Bild 4: Screenshot aus dem Designmaker. Das Mock-Up der Vorlage wurde beibehalten, Text, Farben und Bild wurden manuell ausgetauscht
Bild 4: Screen­shot aus dem Design­ma­ker. Das Mock-Up der Vor­la­ge wur­de bei­be­hal­ten, Text, Far­ben und Bild wur­den manu­ell ausgetauscht

Eine Stim­mung oder gar Emo­tio­nen durch Bil­der, Musik oder bestimm­te For­mu­lie­run­gen in die mit Designs.ai erstell­ten Pro­duk­te ein­flie­ßen zu las­sen, ist ein Pro­zess, der weit­ge­hend manu­ell gesteu­ert wer­den muss. Anhand der Design- und Video­vor­la­gen fin­den sich je nach Anlass pas­sen­de Tem­pla­tes und zusätz­li­che Vor­schlä­ge, wie die­se erwei­tert wer­den kön­nen. Anders als beim Video­ma­ker gibt man der KI beim Erstel­len von Designs aber kei­nen Textin­put, bevor man die Tem­pla­tes aus­wählt. Für Vide­os gibt es die Opti­on, die­se mit Musik zu unter­le­gen und Schrift- und Farb­wahl wie gewünscht anzu­pas­sen. Für das Eis­vul­kan-Video kam zum Bei­spiel noch ein mit "Space" beti­tel­ter Track dazu, der an die Musik aus Pla­ne­ta­ri­ums-Doku­men­tar­fil­men erin­nert. Dadurch soll­te der Zweck des Vide­os (Infor­ma­tio­nen auf ein­fa­che und anschau­li­che Wei­se ver­mit­teln) und die Fas­zi­na­ti­on für das The­ma trans­por­tiert werden.

Einsatz in der Wissenschaftskommunikation

Als eine poten­zi­el­le Ziel­grup­pe nennt Designs.ai "Edu­ca­tors": "Ergän­zen Sie Unter­richts­plä­ne mit anspre­chen­den Foli­en, Pos­tern und Vide­os, um Ihre Schü­ler zu begeis­tern." (Über­set­zung aus dem Eng­li­schen mit DeepL) heißt es auf der Start­sei­te. Lehr­kräf­te sind aber nicht die ein­zi­ge Ziel­grup­pe des Unternehmens.

Für Wissenschaftskommunikator:innen, die in den Sozia­len Medi­en aktiv sind, steht ein brei­tes Ange­bot an Social-Media-Tem­pla­tes bereit, die zur Erstel­lung von Anschau­ungs­ma­te­ri­al genutzt wer­den kön­nen. Ande­re Tools kön­nen zum Bran­ding von Wis­sens­ver­mitt­lungs­pro­jek­ten ein­ge­setzt wer­den, zum Bei­spiel durch die Erstel­lung von Logos, oder um einen ein­heit­li­chen Look für Kam­pa­gnen zu kreieren.

Reviews zu Designs.ai loben die ein­fa­che Bedien­bar­keit und die Brei­te des Ange­bots. Durch die Ver­bin­dung zum Stock­fo­to-Unter­neh­men 123RF haben Nutzer:innen eine brei­te Aus­wahl an Bild- und Video­ma­te­ri­al, das in die eige­nen Pro­jek­te mit auf­ge­nom­men wer­den kann.

Ein Kri­tik­punkt ist, dass die Text-zu-Stim­me-Ver­ar­bei­tung oft noch unna­tür­lich klingt und dass Designs.ai bis­her nur web­ba­siert unter­stützt wird und nicht als App. Zudem ist die Web­site zum Teil feh­ler­be­haf­tet und lang­sam in der Aus­füh­rung der KI-gestütz­ten Design- und Schreib­pro­zes­se. Da hier nur mit der frei­en Ver­si­on getes­tet wur­de, war die Anzahl der Prompts und Tem­pla­tes, die ver­wen­det wer­den konn­ten, limitiert.

Wrap-up

"Erstel­le Logos, Vide­os, Ban­ner, Mock­ups mit KI in nur 2 Minu­ten": Die­ses Ver­spre­chen will Designs.ai auch für Nutzer:innen ohne Vor­kennt­nis­se hal­ten. Was für das Tool spricht, ist die Schritt-für-Schritt-Anlei­tung der ein­zel­nen Desi­gn­ab­läu­fe. Dadurch ent­ste­hen aber zunächst gene­risch aus­se­hen­de Pro­duk­te, die oft der­sel­ben visu­el­len For­mel fol­gen. Wer also ein indiv­du­el­les Ergeb­nis haben will, muss defi­ni­tiv deut­lich mehr als zwei Minu­ten aufbringen.

Wün­schens­wert wäre sicher­lich noch, dass die KI so wei­ter­trai­niert wird, ins­be­son­de­re bei der Videoer­stel­lung ver­stärkt auf den gesam­ten Kon­text eines Tex­tes zu ach­ten, statt aus­schließ­lich ein­zel­ne Sät­ze aus­zu­le­sen. Das wür­de den Schaf­fens­pro­zess enorm ver­kür­zen. Auch die Opti­on, ein eige­nes Voice-over in den Video­ma­ker mit ein­zu­be­zie­hen, wäre eine sinn­vol­le Erwei­te­rung. So wür­den die ent­ste­hen­den Vide­os per­sön­li­cher klin­gen und bes­ser auf die indi­vi­du­el­len Bedürf­nis­se von Wissenschaftskommunikator:innen ange­passt wer­den. Und beson­ders wün­schens­wert wäre natür­lich noch, dass die Trai­nings­da­ten für die KI und ihre Her­kunft offen­ge­legt werden.