Netzkolumne:Seeotter mit Perlenohrring

Lesezeit: 2 min

Seeotter mit Perlenohrring: Nein, dies ist kein verschollenes Werk von Jan Vermeer, es stammt von der Software Dall-E2. (Foto: AFP Photo / OpenAI / Handout)

Generatoren für Bilder können jeden noch so fantastischen Einfall umsetzen - wenn der Nutzer die richtigen Befehle kennt.

Von Michael Moorstedt

Die Menschen haben ein neues Hobby. Auf ihren Social-Media-Profilen teilen sie seit Kurzem nicht mehr nur die üblichen Befindlichkeitsschnuten und was es im Urlaub zu Mittag gab, sondern scheinen auf einmal eine geradezu überbordende Fantasie entwickelt zu haben. Plötzlich sieht man Bilder von im Weltraum schwebenden Ameisen, knuffige Beuteltiere im Anzug oder futuristische Maschinenstädte. Woher kommt die kreative Explosion?

KI ist nicht im Kommen, sie ist schon längst hier. Gerade noch High-End, jetzt Massenware. Innerhalb von kürzester Zeit haben es die Generatoren für Bild (Dall-E2, Midjourney) und Text (GPT-3) aus wissenschaftlichen Papern zum Endanwender gebracht. Das Versprechen: In ein paar Stichworten beschreibt man, was auf dem gewünschten Bild zu sehen sein soll, die Maschine erledigt den Rest. Bei manchen muss man noch selbst Regler und Einstellungen manipulieren. Bei anderen wie Midjourney reicht es via Chatplattform Discord Befehle zu geben, was zu sehen sein soll. Innerhalb einer Minute serviert der Bot dann vier Vorschläge. In Testversionen gratis, kostet die Bilderstellung dann bei einem Anbieter 15 Dollar, dafür generiert die KI bis zu 460 Bilder.

Der Fantasie sind also keine Grenzen mehr gesetzt. Was man sich ausdenken kann, das kann die KI hervorbringen. Bleibt die Frage, wie es eigentlich um die Fantasie der Nutzer bestellt ist.

Auf den ersten Blick nicht sonderlich gut. Oder warum sonst hat sich inzwischen rund um die Bild- und Texterstellungsplattformen eine Art von Sekundärindustrie entwickelt? Auf Marktplätzen wie Promptbase, Super Prompts oder Neutron Field werden nicht die fertigen Illustrationen oder Texte zum Verkauf gestellt, stattdessen handeln die Nutzer hier allein mit den Stichwörtern, die man der KI geben muss, um ein gutes Ergebnis zu erzielen.

Sind die Menschen wirklich zu faul, um sich zu überlegen, was sie sich wünschen?

Bei den sogenannten Prompts handelt es sich letztendlich um Arbeitsanweisungen an die KI. Welchen Stil soll das Bild haben? Welcher Autor dient als Vorbild? Welche Farbpalette darf verwendet werden? Pastell oder eher Neon? Porträt oder Panorama? Und nicht zuletzt: Was soll eigentlich zu sehen sein?

Teuer sind die Prompts nicht. Die meisten Nutzer verlangen einstellige Dollarbeträge. Doch warum sollte man sie überhaupt kaufen? Sind die Menschen wirklich zu faul, um sich zu überlegen, was sie sich wünschen? So weit ist es zum Glück noch nicht gekommen, doch weil man es auf der Gegenseite mit einer KI zu tun hat, reicht es nicht, die Prompts in halbwegs vernünftiger Syntax aufzuschreiben. Eine gelungene Arbeitsanweisung lautet dagegen eher so: futuristic city under a dome digital art deviantart high detail high definition octane render. Man muss genau wissen, was man will - und wie man es so formuliert, dass es die Maschine kapiert.

Während bei den Twitter-Laien verwaschene Albtraumfiguren herauskommen, benutzen Experten die Programme schon längst, um damit Illustrationen in Profiqualität hervorzubringen. Albumcover, Firmenlogos, ja ganze Comicbände wurden bereits durch Dall-E2 entwickelt. Interessant ist dabei die Frage des Copyrights. Wem gehören eigentlich die Rechte an den so erzeugten Bildern? Die Software kann es nicht sein, denn sonst müssten ja auch alle Bilder, die je mit Photoshop bearbeitet wurden, urheberrechtlich dem Adobe-Konzern gehören. Kann also etwas so vermeintlich Nebensächliches wie die genaue Formulierung des Arbeitsauftrages die schützenswerte intellektuelle Leistung sein?

Darüber zerbrechen sich gerade viele Menschen überall auf der Welt den Kopf. Derweil scheint es fast so, als könne man dem Entstehen eines neuen Berufsbilds beiwohnen: dem KI-Flüsterer. Ein Mensch also, der es schafft, durch die Verwendung von scheinbar unzusammenhängenden Wörtern einem Computer den gewünschten Effekt zu entlocken. Näher an tatsächlich funktionierenden Zaubersprüchen war die Menschheit nie.

© SZ - Rechte am Artikel können Sie hier erwerben.
Zur SZ-Startseite

SZ PlusMeinungDigital Burnout
:Erschöpft vom digitalen Dasein

Nach der Wut vieler Nutzer auf die Medien setzt nun die große Müdigkeit ein, sagen Studien. Über den Beginn einer Ausstiegsbewegung.

Von Andrian Kreye

Lesen Sie mehr zum Thema

Jetzt entdecken

Gutscheine: