KI-Tools im Test: Ideogram.ai

In der "Deus Ex Machi­na? – KI-Tools im Test"-Reihe stel­len wir euch ver­schie­de­ne Tools vor, die mit­hil­fe von Künst­li­cher Intel­li­genz Schreib‑, Design- und Recher­che­pro­zes­se ver­ein­fa­chen sol­len. Mehr zur "Deus Ex Machina?"-Reihe gibt es hier.

Im Überblick

"Hel­ping peo­p­le beco­me more crea­ti­ve", so lau­tet das Mot­to von Ideogram.ai, einem von vie­len Online-Tools zur Bild­ge­ne­rie­rung, die seit kur­zer Zeit im Inter­net prä­sent sind. Aber was unter­schei­det Ideogram.ai von Ado­be Fire­fly, Sta­ble Dif­fu­si­on, Mid­jour­ney und ande­ren Anbie­tern ähn­li­cher Dienste? 

Ideogram.ai ist die ers­te KI, die Bil­der mit Text gene­rie­ren kann. Der Vor­teil: Statt manu­ell über ein bereits vor­han­de­nes Bild einen Text zu legen, wer­den Bild und Text in einem Pro­zess gene­riert. Für jeden Prompt, den man in die Such­leis­te ein­gibt, erhält man vier Bil­der. Eines die­ser vier gene­rier­ten Bil­der wird als Cover-Foto aus­ge­wählt und allen User:innen auf der Start­sei­te von Ideogram.ai ange­zeigt. Klickt man auf eines die­ser Fotos, kann man sich auch die alter­na­ti­ven Ver­sio­nen ansehen. 

Ideogram.ai (Stand 04.04.2024)
Ein Aus­schnitt der Start­sei­te von Ideogram.ai: Die kos­ten­lo­se Ver­si­on setzt vor­aus, dass alle Bil­der, die gene­riert wer­den, der Öffent­lich­keit zugäng­lich sind (Stand: 20.12.2023).

Die Web­site erlaubt es, dass man sich nicht nur die eige­nen Bil­der her­un­ter­la­den kann, son­dern auch die der ande­ren User:innen, sofern die­se die kos­ten­lo­se Ver­si­on ver­wen­den. Neben dem kos­ten­frei­en Zugang gibt es auch noch die Basis­ver­si­on, die­se kos­tet $7 USD/Monat, die Plus­ver­si­on gibt es für $16 USD/Monat und die Pro­ver­si­on für $48 USD/Monat. Die Abon­ne­ments unter­schei­den sich haupt­säch­lich in der Anzahl der ver­wend­ba­ren Prompts pro Tag und der Qua­li­tät der her­un­ter­ge­la­de­nen Bil­der, gemes­sen an der Pixelzahl. 

Ideogram.ai bie­tet bei der Erstel­lung der Bil­der ver­schie­de­ne For­ma­te und Sti­le an. Auch die Schrift­art kann nach Wunsch vari­ie­ren. Das macht es mög­lich, auch einen kur­zen Prompt zu ver­fei­nern und für die gewünsch­te sti­lis­ti­sche Rich­tung pas­sen­de­re Ergeb­nis­se zu erhal­ten. Für alle Expe­ri­men­tier­freu­di­gen gibt es außer­dem die Funk­ti­on Lucky style, mit wel­cher der Stil zufäl­lig gene­riert wird. 

Die ver­schie­de­nen Sti­le und For­ma­te, die Ideogram.ai der­zeit anbie­tet (Stand: 07.03.24)

Um einen Text schrift­lich statt bild­lich umge­setzt zu bekom­men, muss er in Anfüh­rungs­zei­chen gesetzt wer­den. Das ist auch in den für die­sen Arti­kel ver­wen­de­ten Bei­spiel­prompts zu sehen. 

Die KI hinter der Anwendung

Ideogram.ai wur­de von ehe­ma­li­gen Mit­ar­bei­ten­den von Goog­le Brain, UC Ber­ke­ley und der Uni­ver­si­tät von Toron­to, Moham­mad Norou­zi, Chit­wan Saha­ria, Wil­liam Chan und Jona­than Ho, mit­be­grün­det. Mit einem Start­ka­pi­tal von 16,5 Mil­lio­nen US-Dol­lar, das durch Seed-Fun­ding zusam­men­ge­tra­gen wur­de, erschien das Tool im August 2023.

Ideogram.ai bie­tet ein umfang­rei­ches Ange­bot an künst­le­ri­schen Sti­len an – von lebens­ech­ten, cine­ma­ti­schen Bil­dern über Graf­fi­ti bis hin zum Comic, oder Ani­me-Stil. Die Ergeb­nis­se kön­nen fol­gen­der­ma­ßen aussehen:

Prompt: Blue holo­gram­me face that says "AI is the future" | Model: Ideo­gram 0.2

Es darf dabei aber nicht ver­ges­sen wer­den, dass die KI noch sehr jung ist – und auch aus­bau­fä­hig. Die Prä­mis­se, Bil­der mit Text zu gene­rie­ren, klingt viel­ver­spre­chend. Trotz­dem muss man bei der Anwen­dung beach­ten, dass sich die KI noch in ihren ers­ten Schrit­ten befin­det und eini­ge Feh­ler machen kann. Ins­be­son­de­re lan­ge Prompts setzt das Tool nicht immer pas­send um, vor allem dann, wenn viel Text oder kom­pli­zier­te Wor­te ver­wen­det wer­den. Im Selbst­ver­such ent­stan­den dabei eini­ge lus­ti­ge, aber lei­der auch 'nutz­lo­se', Bil­der. Gera­de die Ergeb­nis­se der Remix-Funk­ti­on, bei der man neue Bil­der auf­grund bereits kre­ierter Bil­der erstel­len kann, sind oft nicht zufriedenstellend: 

Kurz nach der Erst­ver­öf­fent­li­chung hat­te Ideogram.ai schon 1.1 Mil­lio­nen Nutzer:innen und allein bis Anfang Okto­ber 2023 kre­ierte die KI bereits an die 80 Mil­lio­nen Bil­der. Teil­wei­se müs­sen User:innen bis zu 30 Sekun­den oder län­ger war­ten, bis die gewünsch­ten Bil­der erstellt wer­den, da der Ser­ver oft über­las­tet ist. Der Frust dar­über zeigt sich in meh­re­ren von Nutzer:innen ange­wen­de­ten Prompts, die Bil­der von Pro­tes­tie­ren­den kre­ieren, die Schil­der wie "YOU NEED MORE SERVERS" hochhalten.

Prompt: A comic­al cat hol­ding a sign say­ing "You need more ser­vers", pos­ter, illus­tra­ti­on | Model: Ideo­gram 0.2

Seit Febru­ar 2024 steht Ideo­gram 1.0 für alle Nutzer:innen kos­ten­frei zur Ver­fü­gung. Ein neu­es Fea­ture die­ser ver­bes­ser­ten Ver­si­on ist der soge­nann­te Magic Prompt, der sich je nach Wunsch an- und aus­schal­ten lässt. Der Magic Prompt ist gene­rell eine ver­län­ger­te Ver­si­on des eige­nen Prompts, der wäh­rend des Erstel­lens der 4‑Bil­der-Rei­he auto­ma­tisch von der KI hin­zu­ge­fügt wird.

Ursprüng­li­cher Prompt: sil­ly cat sti­cking out tongue

Magic Prompt: A playful and ado­rable cat, sti­cking out its ton­gue with a mischie­vous grin, is seen in the cen­ter of a vibrant and colorful pos­ter. The cat is sur­roun­ded by a varie­ty of objects, such as a rain­bow, a sun, and a smi­ling moon, with a cheerful and ener­ge­tic atmo­sphe­re. The over­all design is eye-cat­ching and per­fect for a ligh­the­ar­ted and fun set­ting, pos­ter | Model: Ideo­gram 1.0

Das rhetorische Potential des Tools

Ideogram.ai eig­net sich beson­ders gut für Grafik-Designer:innen, Social Media Con­tent Ersteller:innen oder gene­rell für die­je­ni­gen, die zeit­spa­rend Logos, Posts, Fly­er o.Ä. erstel­len wol­len. Die Bedie­nung des Tools ist schnell erlernt und es ist nicht schwie­rig, sich einen Prompt aus­zu­den­ken und ein­zu­tip­pen. Auch Stu­die­ren­de und sogar Schüler:innen kön­nen davon pro­fi­tie­ren, sowie auch Pri­vat­per­so­nen, die Freu­de an KI-Bild­ge­ne­ra­to­ren haben. Aller­dings ist die kom­mer­zi­el­le Nut­zung ver­bo­ten. Durch die Mög­lich­keit, aus ver­schie­de­nen Sti­len aus­wäh­len zu kön­nen, ist auch das Ergeb­nis per­so­na­li­sier­bar. Ein Prompt kann dadurch unter­schied­li­che For­men annehmen:

Ver­schie­dens­te Far­ben und For­men sind eben­falls kein Pro­blem für Ideogram.ai. Die aus­wähl­ba­ren Sti­le gibt es auch bei ande­ren KI-Bild­ge­ne­ra­to­ren, die end­gül­ti­gen Designs unter­schei­den sich jedoch im Ver­gleich in Art und Design. Im Nor­mal­fall ent­ste­hen kei­ne Bil­der, die Gesich­ter oder Kör­per unpro­por­tio­nal dar­stel­len (d.h. fal­sche Bild­in­for­ma­tio­nen lie­fern, wie z.B. zu vie­le Fin­ger an einer Hand). Dabei ist nun die Fra­ge, inwie­weit man die Remix-Funk­ti­on aus­rei­zen kann. Für die­sen Selbst­ver­such wird das obi­ge mit­ti­ge Bild der oran­gen Kat­ze 1, das soge­nann­te „Parent“-Bild (Prompt: an oran­ge cat say­ing "Hel­lo", pos­ter | Model: Ideo­gram 0.2) mehr­fach durch die Remix-Funk­ti­on geschickt. Mit dem Remix gesell­te sich unge­plant eine schwar­ze Kat­ze 2 zur ers­ten dazu. Beim ers­ten Remix erschien statt einer oran­gen Kat­ze 1 und einer schwar­zen Kat­ze 2 eine oran­ge-schwar­ze Kat­ze 3. Beim zwei­ten Remix änder­te sich zusätz­lich der Stil und das Bild ver­lor stark an Qua­li­tät. Außer­dem wächst nun aus der oran­ge-schwar­zen Kat­ze 4 eine wei­te­re oran­ge Kat­ze 5. Beim drit­ten Remix wird der Text von "Hel­lo" zu "Hel­lo you" geän­dert. Die Ergeb­nis­se sind hier zu sehen:

Auf der einen Sei­te ist es pro­ble­ma­tisch, dass die ein­ge­ge­be­nen Tex­te meist nicht kor­rekt ange­zeigt wer­den. Ein wei­te­res Pro­blem ist, dass zwar bis­her kein Copy­right auf den von der KI kre­ierten Bil­dern liegt, es aber den­noch ver­bo­ten ist, sie kom­mer­zi­ell zu ver­wen­den – da näm­lich in Zukunft doch even­tu­ell Copy­right dar­auf lie­gen könn­te. Das ver­rin­gert den Nut­zen der KI dem­entspre­chend ein­deu­tig, vor allem für Grafik-Designer:innen, die somit das Tool eher zur Inspi­ra­ti­ons­ge­win­nung als zur Erstel­lung fer­ti­ger Pro­duk­te nut­zen können.

Kann Ideogram.ai also ledig­lich als Ideen­fin­der oder pri­va­ter Spaß fun­gie­ren? Ist die­se KI somit nur ein lus­ti­ges Hob­by, ein net­tes Dekostück für Refe­ra­te an der Uni­ver­si­tät oder steckt noch mehr dahinter?

Auf der ande­ren Sei­te för­dert das Expe­ri­men­tie­ren mit Sät­zen und Wör­tern (den Prompts) die eige­ne Krea­ti­vi­tät. Durch den Zusatz der Schrift müs­sen Prompts im Ver­gleich zu ande­ren Bild­ge­ne­ra­to­ren noch ein­mal über- und umge­dacht wer­den, um das gewünsch­te Ergeb­nis zu erhal­ten. Durch die zuvor erwähn­te Remix-Funk­ti­on kommt Ideogram.ai zudem den User:innen ent­ge­gen, die den Dreh mit den rich­ti­gen Prompts noch nicht so her­aus­ha­ben. Außer­dem kann man sich jeder­zeit an den Prompts ande­rer User:innen ori­en­tie­ren, indem man sich auf der Start­sei­te durch die Bil­der klickt und sich die dazu­ge­hö­ri­gen Prompts anschaut. Bis Febru­ar 2024 schlug die KI selbst kei­ne Bei­spiel­prompts vor. Der (pas­si­ve) Aus­tausch in der Com­mu­ni­ty hat somit eher die Wei­ter­ent­wick­lung der KI geför­dert. Inzwi­schen hel­fen die zuvor bereits erwähn­ten Magic Prompts auf Wunsch. Sie machen es ein­fa­cher, krea­ti­ve Ergeb­nis­se zu erhal­ten, schrän­ken aber auch die eige­ne Krea­ti­vi­tät der User:innen ein. Wich­tig ist es des­halb, dass man selbst dar­über ent­schei­den kann, ob man die Magic Prompts an- oder ausschaltet.

Der Aus­tausch in der Com­mu­ni­ty: Likes, Fol­lows, die Mög­lich­keit des Remi­xing, Editing und des Kopie­rens des Prompts.

Erwäh­nens­wert ist hier­bei noch, dass die KI bis­her aus­schließ­lich auf Eng­lisch funk­tio­niert, aber anders­spra­chi­ge Tex­te auf ein Bild über­tra­gen kann, da die KI die Wor­te zwar (rich­tig oder falsch) wie­der­ge­ben kann, sie aber offen­sicht­lich nicht "ver­steht".

Einsatz in der Wissenschaftskommunikation

Kon­kre­te Anwen­dungs­mög­lich­kei­ten in der Wis­sen­schafts­kom­mu­ni­ka­ti­on sind nicht das Erstel­len von Gra­fi­ken oder Bei­spiel­bil­dern, son­dern das Erstel­len von Bil­dern, die Sach­ver­hal­te zwar ver­an­schau­li­chen kön­nen, aber kein Wahr­heits­an­spruch haben. Ideogram.ai kann ver­schie­de­ne Inter­pre­ta­tio­nen eines Quer­schnitts der Erde zur Ver­fü­gung stellen:

BildPromptMagic Prompt
Bei­spiel­bild 1cross-sec­tion of the earth, scientificalA cap­ti­vat­ing cross-sec­tion­al image of the Earth, depic­ting its various lay­ers, inclu­ding the crust, man­t­le, outer core, and inner core. The crust is shown with diver­se land­forms, such as moun­ta­ins, deserts, and forests. The man­t­le, with its dar­ker hue, has con­vec­tion curr­ents that dri­ve tec­to­nic pla­te move­ment. The outer core, com­po­sed of mol­ten iron and nickel, is sur­roun­ded by the solid inner core. The Earth's core is an inten­se envi­ron­ment, with extre­me pres­su­re and tem­pe­ra­tu­re conditions.
Bei­spiel­bild 2Cross-sec­tion of the earth, cinematic/
Bei­spiel­bild 3Cross-sec­tion of the earthA stun­ning cross-sec­tion of the Earth, reve­al­ing its lay­ers in intri­ca­te detail. The crust, man­t­le, and core are cle­ar­ly visi­ble, with the man­t­le being divi­ded into the upper and lower man­t­le. The core con­sists of the den­se inner core and the less den­se outer core, sur­roun­ded by the Earth's crust. The image is color-coded, with the crust in shades of green and brown, the man­t­le in shades of red and oran­ge, and the core in shades of yel­low and gold. The Earth's magne­tic field lines are depic­ted in blue, spi­ra­ling around the mol­ten outer core.
Model (alle): Ideo­gram 1.0

Gera­de hier­bei wird deut­lich, dass die neue Funk­ti­on des Magic Prompts sehr hilf­reich sein kann, wenn man selbst noch kei­ne genaue Vor­stel­lung von dem End­ergeb­nis hat. Die Bil­der sind qua­li­ta­tiv hoch­wer­tig, teil­wei­se jedoch eher fan­tas­tisch-krea­tiv als seri­ös-wis­sen­schaft­lich. Je nach­dem, in wel­chem Kon­text und Umfeld man die Gra­fi­ken ver­wen­den möch­te, kön­nen sie also mehr oder weni­ger nütz­lich sein.

Gra­fi­ken, wie bei­spiels­wei­se ein Kuchen­dia­gramm, las­sen sich nicht wirk­lich mit Ideogram.ai erstel­len. Mit dem Prompt pie chart, 65% like cats, 25% like dogs, 10% like fish erhält man zwar ein Kuchen­dia­gramm, aller­dings nicht in der gewünsch­ten Aufteilung:

Prompt: pie chart, 65% like cats, 25% like dogs, 10% like fish | Model: Ideo­gram 1.0

Auch nach Umfor­mu­lie­ren des Prompts zu pie chart with 65% cats, 25% dogs, 10% fish und Expe­ri­men­tie­ren mit und ohne Magic Prompt, erhält man nicht das gewoll­te Ergebnis:

Prompt: pie chart with 65% cats, 25% dogs, 10% fish | Model: Ideo­gram 1.0

Dia­gram­me scheint Ideogram.ai dem­entspre­chend noch nicht her­stel­len zu kön­nen. Zudem muss erneut dar­auf hin­ge­wie­sen wer­den, dass die Bil­der von Ideogram.ai nicht kom­mer­zi­ell ver­wen­det wer­den dür­fen. Die Bil­der kön­nen also bei­spiels­wei­se nicht von Zeit­schrif­ten, die Wis­sen­schafts­kom­mu­ni­ka­ti­on betrei­ben, ver­wen­det werden.

Fazit

Zusam­men­fas­send kann fest­ge­hal­ten wer­den, dass Ideogram.ai sich durch sei­ne Viel­fäl­tig­keit, Ein­fach­heit und Zugäng­lich­keit aus­zeich­net. Mit etwas Expe­ri­men­tie­ren erhält man beson­de­re, schö­ne Bild­ergeb­nis­se im gewünsch­ten Stil. Die eigen­stän­di­ge Ver­wen­dung der Prompts (ohne Magic Prompts) erfor­dert jedoch eini­ges an Übung und Geduld und man muss damit rech­nen, am Ende nicht die gewünsch­ten Ergeb­nis­se zu erhal­ten. Die Magic Prompts ver­ein­fa­chen zwar den Pro­zess, kön­nen aber auch irre­füh­rend sein und Ergeb­nis­se erstel­len, die mit der ursprüng­li­chen Inten­ti­on der User:innen wenig zu tun haben. Das Tool eig­net sich dem­entspre­chend beson­ders für die­je­ni­gen, die offe­ner für diver­se Ergeb­nis­se sind und sich nichts Expli­zi­tes als End­re­sul­tat vorstellen.

Die Hersteller:innen von Ideogram.ai sind die ers­ten, die die Initia­ti­ve ergrif­fen haben, eine Text-Bild-KI zu ent­wi­ckeln. Das macht Ideogram.ai unter den Bild­ge­ne­ra­to­ren (vor­erst) einzigartig.