Welche kreativen Möglichkeiten eröffnet generative KI für die Modebranche?
Etablieren KI-generierte Modebilder eine eigene mediale Kategorie?
Schafft KI eine neue Wirklichkeit?
What creative opportunities does generative AI provide for the fashion industry?
Is AI- generated fashion establishing their own media category?
Is AI creating a new reality?
KI als Inspiration?
Für unsere Ausstellung haben wir Personen aus unterschiedlichen Arbeitsbereichen und Forschungsfeldern befragt. Neben Vertreter:innen aus den Medien- und Kulturwissenschaften, konnten wir unter anderen Expert:innen aus der Informatik, der Ethik und Philosophie, der Soziologie, den Rechts- und Literaturwissenschaften sowie aus den Bereichen von Kunst, Kultur, Politik und Journalismus gewinnen.
Wir fragten nach digitaler Kreativität und einer möglichen kreativen Schaffenskraft von Künstlichen Intelligenzen. Auch galt unser Interesse möglichen Problemen, Risiken und Bedenken in Zusammenhang mit dem Einsatz von KI als auch der Frage nach einer individuellen Einschätzung und Prognose für die Entwicklungen in der Zukunft. Dabei sind die Antworten auf unsere Fragen so vielfältig wie die Arbeits- und Forschungsfelder unserer Interviewpartner:innen.
Auf dieser Seite widmen wir uns den Themen Bildproduktion durch KI und Mode.
Den Expert:innen haben wir folgende Frage zu diesen Themenkomplexen gestellt:
Sind KI-generierte Modebilder noch Teil eines fotografischen Mediums, oder etablieren sie eine eigene mediale Kategorie?
Prof. Dr. Maja Jerrentrup, Kultur- und Medienwissenschaftlerin und Fotografin:
Wenn man ihr Aussehen ins Zentrum rückt, sind mit KI generierte Modebilder kaum und sicher bald gar nicht von Fotografien unterscheidbar: Man sieht dem Bild nicht an, wie es entstanden ist. Schon heute lese ich unter vielen meiner mit KI generierten Bildern, die ich online präsentiere, Kommentare wie „schönes Foto“ oder Lob an das Model oder die Visagistin – die es natürlich nie gegeben hat. Oft genug habe ich Rezipienten darauf hingewiesen, dass es sich nicht um Fotos handelt – so richtig angekommen ist es nicht bei allen und ich frage mich, ob das überhaupt wichtig ist. In einer Studie, die ich durchgeführt habe, fiel Folgendes auf: Personen, die zunächst dachten, es handele sich um Fotos, revidierten oftmals ihre erste Einschätzung , wenn sie erfuhren, dass es mit KI generierte Bilder waren. Oft war eine gewisse Enttäuschung festzustellen. Aber auch dies wurde dann zum Teil wieder infrage gestellt. Ein Interviewpartner sagte: „Es ist, als wenn ich einen tollen Song höre. Dann erfahre ich, dass er von einem Künstler stammt, den ich an sich nicht mag. Erst bin ich enttäuscht, aber der Song bleibt der Song und es ist auch dumm, mein Gefühl gegenüber einem tollen Song zu ändern. Und er landet doch auf meiner Playlist.“ So ist es auch mit Bilder – ob mit KI generiert oder nicht, es gibt solche, die einen ansprechen oder eben nicht, es gibt extravagante, skurrile und traditionelle Looks.
Verlassen wir die Looks in Richtung Entstehung. Hier zeigen sich natürlich deutliche Differenzen: Für ein Fotoshooting muss man raus in die Welt, mit dem arbeiten, was die Welt zu bieten hat und vor allem in der Mode, mit anderen Menschen – Modellen, Designern, Assistenten etc. – kooperieren. Man muss, zumindest als guter Fotograf, die Motivationslage seiner Teammitglieder verstehen, ihre Visionen ebenso wie ihre Sorgen nachvollziehen können, um in einer oft unperfekten Situation das für alle Beteiligten Bestmögliche zu schaffen. Ein gewisses Maß an Empathiefähigkeit ist zentral: Als Fotografin muss ich z.B. verstehen, was das Model an sich mag oder nicht leiden kann, wo ihre Stärken liegen, mit welchen Umfangsformen sie sich wohlfühlt etc., nur dann wird das Shooting zu einem angenehmen Event und das Model ihr Bestes geben. Auch in der Arbeit mit KI benötige ich eine Art Empathiefähigkeit, ich muss mich auf den Horizont der KI einlassen und nachvollziehen, welcher Eingaben meinerseits die KI wie umsetzt. Aber es ist kein anderer Mensch, auf den ich mich einlassen muss und es erfordert keine physische Kopräsenz.
Betrachten wir die Fähigkeiten des Künstlers, so sehen wir zwar bei beiden wie gerade angesprochen eine gewisse Empathiefähigkeit, wie auch weitere Parallelen, z.B. das Wissen um verschiedene Kunstepochen und -stile, gesellschaftliche Trends, Arten von Lichtsetzung etc, das dabei hilft, das gewünschte Ergebnis zu erzielen. Der Fotograf arbeitet jedoch mit technischen Geräten und mit der Wirklichkeit, während der KI Künstler Worte (und manchmal Bildprompts) nutzt. Diese Worte müssen speziell auf die KI zugeschnitten sein, wenn man eine konkrete Vorstellung umsetzen möchte – ohne Ergebniserwartung kann man aber auch zu interessanten Ergebnissen erlangen, vergleichbar mit Glückstreffern bei der Fotografie.
Man könnte nun noch weitere Bereiche betrachten, so z.B. die Künstlerpersönlichkeit – grundsätzlich ordne ich mit KI generierte Modebilder aufgrund ihrer Entstehungsweise als ein anderes, aber benachbartes, sich oft auch überschneidendes Genre ein.
Vladimier Alexeev / Merzmensch:
Als Boris Eldagsen 2023 den renommierten ersten Fotopreis von Sony Photography Awards ablehnte, erklärte er seine Entscheidung damit, dass sein Gewinnerbild „The Electrician“ kein Photo ist. Es sei ein mit KI generiertes Bild und darf mit dem Genre und Technik Photographie nicht verwechselt oder gleichgesetzt werden. Er verwendete dafür den Begriff der Promptographie, der damals bereits ihre Runden machte. Damit stiess er eine öffentliche Diskussion an, in welcher wir uns befinden, und die möglicherweise kein Ende nehmen wird. Die Bezeichnungen sind vielfältig: auch Synthographien, oder Technobilder (nach Vilém Flusser). Jedenfalls ist es klar, dass es eine völlig neue mediale Kategorie ist und mit der Photographie nicht unter einen Hut gebracht werden darf.
In welcher Weise beeinflusst generative KI die Ästhetik und die Repräsentation von Mode, und welche ethischen Herausforderungen bringt dies mit sich?
Prof. Dr. Maja Jerrentrup, Kultur- und Medienwissenschaftlerin und Fotografin:
Geben Sie „schöne Frau“ als Prompt ein. Mit hoher Wahrscheinlichkeit erhalten Sie eine weiße Frau mit dunklen, langen Haaren, vollen Lippen. Sie ist jung, schlank und trägt oft ein schwarzes Oberteil. Ist das die einzige Art von Schönheit? Was KI hier ohne weitere Spezifizierungen fabriziert, ist sehr einseitig und monoton und entspricht keineswegs der Vielfalt, die der Begriff zu bieten hätte, abhängig von persönlichen und kulturellen Präferenzen, Stimmungslagen u.v.a.. Bezeichnend zum Beispiel: Nur um die 10% der Weltbevölkerung ist weiß – warum sind es im Schnitt 75% der KI generierten Bilder zu „schöne Frau“?
Verkürzen Sie den Prompt auf „Schönheit“ und Sie erhalten mit guter Wahrscheinlichkeit das Gesicht einer Frau. Offenbar sind Männer oder transgender Personen nicht repräsentativ für Schönheit? Was im Umkehrschluss bedeuten könnte, dass für Frauen das Aussehen von zentraler Bedeutung ist, sich Männer aber eher über andere Eigenschaften definieren (dürfen)…? Dass Frauen bei Männern keine Schönheit zu suchen haben…?
Diese Beispiele zeigen ganz klar, wie gebiased die KI ist. Meinen Beobachtungen zufolge wird es etwas besser, aber es gibt noch viel Raum nach oben – dies u.a. auch, weil manche ästhetische Praktiken wenig weltweite Beachtung gefunden haben oder einfach schlechter zum Basismedium, der zweidimensionalen Abbildung passen. Kleidungstraditionen, die zum Beispiel eher auf komplizierten Wickelungen basieren wie Saris oder Dhotis, für die die Haptik eines Stoffes besonders wichtig ist etc. lassen sich weniger gut abbilden und finden weniger Beachtung.
Als ethische Schlußfolgerung ergibt sich damit: KI muss inklusiver werden und wir als Nutzer und Rezipienten verstehen lernen, dass sie es noch nicht ist. KI muss nicht immer die Wahrheit zeigen, aber wir als Nutzer und Rezipienten müssen uns das stets vergegenwärtigen – gerade, weil wir einfach gewohnt sind, unseren Augen am meisten zu vertrauen. Andererseits, auch Fotos lügen seit jeher. Für die Fotografie werden Situationen inszeniert, die es ohne sie nicht gegeben hätte, Bilder werden von Anbeginn der Fotografie nachbearbeitet, verändert, zusammenmontiert, aus dem Kontext gerissen etc. Die Dimension, in der das möglich ist, hat sich zwar mit der KI geändert, der Fakt jedoch nicht.
Und schließlich gibt es auch positive Einflüsse, nicht nur, dass (theoretisch) viel mehr Menschen an der Darstellung von Mode teilhaben und ihre Bedürfnisse visualisieren können, sondern auch, dass unkompliziert viel krassere Experimente möglich sind. Mit einem verrückt geprompteten Headdress haben Sie wahrscheinlich weniger Zeit, Geld und Energie verschwendet, als mit der real-life Umsetzung und können erst einmal risikoärmer testen, ob Ihre Idee ankommt. Das könnte zu mehr Kreativität führen.
Vladimier Alexeev / Merzmensch:
Alles steht und fällt mit dem Datensatz, auf welchen das jeweilige Modell trainiert ist. Und ehrlich gesagt: je mehr Daten drin, desto besser. Es geht nicht um die Megalomanie, sondern eher um die Vielfalt. Trainieren Sie ein KI-Modell nur an bestimmten, zB westlichen Repräsentanten der Mode, so werden neue generierte Visionen eher repetitiv und epigonal sein. Mischen Sie internationale Daten aus Afrika, Japan, Australien etc., so erreicht das Model eine ästhetische Befreiung von einem dem jeweiligen Kulturraum gehörenden Konventionellen, behält dabei kulturspezifischen Kenntnisse, was sich für später als sehr hilfreich herausstellen wird.
Natürlich, KI arbeitet nach Wahrscheinlichkeiten (was aber auch bedeutet, dass sie das am Wenigstens Wahrscheinliche erzeugen können, was besonders faszinierend ist). Unsere menschliche kulturelle Stereotypen sind auch Wahrscheinlichkeiten. Die ethische Herausforderung ist es, die kulturellen, gesellschaftlichen und übrigen Bias zu vermeiden, und auch auf unterrepräsentierten Kulturkreise Augenmerk zu werfen, jedoch nicht aus einer kolonialistisch-westlichen Perspektive, sondern auf der gleichen Augenhöhe, mit Respekt und Aufgeschlossenheit. Und mehr Platz einräumen, da die von westlichen Ästhetik dominierte Gesellschaft das Gefühl für die Welt verliert.
Empfehlenswert ist auch, Ethnien in gleichmäßigen und gleichbedeutenden Situationen zu entwerfen und clichée-haften irreführenden Parallelen zu vermeiden. Es geht keineswegs um irgendwelche Quoten, sondern um die Selbstverständlichkeit, dass die Welt mittlerweile global genug ist, um die alte Völkerstafel als irreführend, schädlich und toxisch zu betrachten. Leider denken viele immer noch in Völkertafeln, auch wenn sie dessen nicht einmal bewusst sind.
Inwiefern unterscheidet sich die Ästhetik generativer KI-Bilder von Stilmitteln der Modefotografie?
Prof. Dr. Maja Jerrentrup, Kultur- und Medienwissenschaftlerin und Fotografin:
Bildgenerierende KI beruht auf riesigen Datensätzen und kann damit auch alle möglichen Richtungen von Fashion Fotografie imitieren. Auf rein visueller Ebene ist es heute schon für einen Laien schwer zu bemerken, ob ein Bild mit KI generiert wurde oder nicht – und das Ende der Fahnenstange ist ja noch lange nicht erreicht! Zwar gibt es einen bestimmten Look, den KI ohne weitere Vorgaben derzeit präferiert – weil er in den Datensätzen und von den Usern offenbar bevorzugt wird – aber dies ist keine zwingende Eigenschaft von Bildgenerierung mit KI. Im Look unterscheidet sie sich also kaum von echter Fotografie und wird das auch immer weniger tun. Was man fotografieren kann, kann man auch generieren, auch wenn das manchmal ein recht umständliches Prompten bedeutet und Wissen über modehistorische Epochen, Stoffe, Schnitte, Lichtsetzungen, Posings etc. Voraussetzt.
Führt die Bildproduktion durch KI eher zu einer Standardisierung oder Diversifizierung der ästhetischen Ausdrucksformen?
Vladimier Alexeev / Merzmensch:
Es gibt zwei Seiten der Medaille. Die gängigen Modelle wie Midjourney, wenn mit basischen, einfachen, figurativen Prompts gesteuert, produzieren eine ähnliche Ästhetik (zumindest innerhalb einer Version des Models). Und wir sehen es bereits an der Überflutung mit ähnlichen Bildern in Sozialen Netzwerken. Die Aufgabe der Künstler*innen ist es, weg von „default“, vom standardmäßigen, mediokren zu gehen. Dabei spielen Prompts eine untergeordnete Rolle, da man mit Parametern, Einstellungen, Finetunen, weiteren Programmen arbeitet. Bei DALL·E 3 lohnt es sich beispielsweise, eine Stunde lang mit dem Model zu diskutieren, über die Ästhetik und Semantik. Nur so entstehen völlig einzigartige und seltene Motive, Kompositionen, Visualisierungen, weg von vorgegeben Standards. Ich glaube, es ist an uns, Kreativen, für diese Diversität zu sorgen und es als Gegenposition dem Einheitsbrei entgegenzustellen, mit welchem die Welt konfrontiert wird. Denn die KI-Modelle können praktisch alles und jede beliebige, auch noch nicht existente Ästhetik. Wir müssen sie den Maschinen entlocken. Nur so gehen wir weg von Standardisierung hin zur Diversifizierung der ästhetischen Ausdrucksformen.
Inwiefern sind diese KI-generierte Modebilder als kulturelle Artefakte zu verstehen, die neue Bedeutungsräume schaffen?
Prof. Dr. Maja Jerrentrup, Kultur- und Medienwissenschaftlerin und Fotografin:
Ich würde gerne das Wording anpassen und i.d.R. von „mit KI generierten Bildern“ sprechen. Denn auch das Prompten und Auswählen ist ein kreativer Akt. Offensichtlich wird dies, wenn Sie über Stunden eine Idee umsetzen möchten, die KI aber nie genau das versteht, was Sie möchten, und Sie immer wieder Prompts modifizieren und Bildbereiche ändern, sich manchmal auf Vorschläge der KI einlassen, ausprobieren, selektieren und das fertige Werk schließlich kontextualisieren und als Gag, als Kunstwerk oder Fashionbild veröffentlichen.
KI ermöglicht es uns, auch mit denkbar wenigen und günstigen Mitteln an einem Gestaltungsprozess teilzuhaben: Sie brauchen einen Rechner, ein Programm, ggf. ein Pay-Abonnement – aber bei weitem nicht die Kosten, die man für ein Fotoshooting einplanen muss oder für einen Kurs in Ölmalerei. Damit kann jeder Einzelne von uns die Welt mitgestalten und z.B. ihm wichtige Trends mitkreieren und Themen illustrieren. Vor kurzem habe ich zur Repräsentation des Hashtags #depression auf Instagram geforscht und festgestellt, dass es wenige Bildposts gibt, obwohl die Kunsttherapie bei der Krankheit gerne eingesetzt wird. Dies könnte bald anders werden, wenn man mit Hilfe von bildgenerierender KI seine Gefühle visualisieren kann. Dafür erforderlich ist aber Wissen – passender Umgang mit Worten, Wissen um Kunststile und Looks, Wissen um die Objekte, die man darstellen möchte oder in unserem Fall, der Mode, Wissen um Modeepochen, Stoffqualitäten, Schnitte etc. Obwohl die Technik günstig und verfügbar ist, besteht wie so oft das Risiko eines wachsenden digital divide, zugleich aber auch die Chance größerer Teilhabe und Gestaltungsmöglichkeit.
Welche Möglichkeiten bestehen, um die Medienkompetenzen der Konsumenten zu stärken, um KI- generierte Inhalte zu bewrben?
Vladimier Alexeev / Merzmensch:
Digitale und mediale Kompetenz ist das A und O, doch es geht dabei nicht nur um die Theorie. Praxis ist das Schlüsselwort. Ich veranstaltete hier im Museum für Kommunikation Frankfurt vor 5 Jahren, also 2020, einen Workshop „KI für KIDS“. Damals war KI zwar schon in der internationalen Kulturszene als vielversprechendes kreatives Medium angekommen, in der breiten Öffentlichkeit war das Thema KI noch rar. Vor meinem Workshop zeigte ich den Kids (zwischen 7 und 12 Jahren alt) Fotos und KI-generierte Portraits, die sie zunächst nicht unterscheiden konnten. Im Anschluss an den Workshop, während dessen sich die Kinder intensiv und praktisch mit KI-Modellen (GANs und CNNs) beschäftigten, wiederholte ich den Vergleich – und die Kinder erkannten sehr schnell, welche Bilder generiert waren. Denn in Laufe der Arbeit haben sie empirisch und perzeptiv die Besonderheiten der synthetischen Bilder erkannt und gefühlt. Sie wussten auch, was mittlerweile so alles machbar ist, daher waren sie eher bereit, ein auch so fotorealistisches Portrait kritisch zu hinterfragen.
Daher sollte die Gesellschaft lernen, wie diese Bilder entstehen – bereits um solche erkennen zu können. Wir sind nicht imstande, Missbrauch von KI wie Deepfake zu verhindern, doch mit genügend Kompetenz ist es möglich, den negativen Impact davon abzumildern.
Welche Rolle spielt KI bei der Fortsetzung oder dem Umbruch von fast-fashion Modellen in einer zunehmend digitalisierten Welt?
Prof. Dr. Gerard de Melo, Lehrstuhl für Artificial Intelligence and Intelligent Systems, Universität Potsdam/Hasso-Plattner-Institut:
KI trägt zu einer weiteren Beschleunigung der Mode bei, da vom Design bis zur Auslieferung diverse Prozesse schneller ablaufen können. Durch individualisierte Werbung sowie persönliche Stilberatungs-Bots, die uns das perfekte Outfit zusammenstellen, kann die Nachfrage weiter steigen. Zugleich kann KI aber zu mehr Nachhaltigkeit beitragen. Mit zielgerichtetem, KI-basiertem Forecasting lässt sich das Problem der Überproduktion von Fast Fashion reduzieren. Virtuelle Anproben, teilweise sogar mit präzisen 3D-Körperscans, helfen, Retouren zu vermeiden. Auch im Bereich Resale, Reuse und Recycling eröffnet sich großes Potenzial, da KI den Zustand von Kleidungsstücken erfassen und die verwendeten Stoffe identifizieren kann.
Welche Entwicklungen erwarten Sie in der Verschmelzung von KI-generierten Bildern und traditioneller Modefotografie?
Samuel Gärtner, Fashion Designer:
KI kann die Modefotografie bereichern, indem sie Prozesse beschleunigt und neue kreative Möglichkeiten eröffnet. Während KI-generierte Bilder ein aktueller Trend sind, bleibt die menschliche Kreativität essenziell. Die Verschmelzung von KI und traditioneller Fotografie wird weniger eine Ablösung als eine Erweiterung sein. Besonders für kleinere Marken bietet sie die Chance, beeindruckende Kampagnen mit geringerem Budget umzusetzen. Die Zukunft liegt in der Balance zwischen technologischer Innovation und authentischer, künstlerischer Gestaltung.
Prof. Dr. Gerard de Melo, Lehrstuhl für Artificial Intelligence and Intelligent Systems, Universität Potsdam/Hasso-Plattner-Institut:
Die Mode lebt von der Spannung zwischen Wunsch und Wirklichkeit. Generative KI eröffnet vielfältige neue Möglichkeiten, die Grenzen der traditionellen Modefotografie zu sprengen und neue kreative Ideen in Szene zu setzen. Es besteht dabei jedoch die Gefahr einer zu starken Entfremdung zwischen der Realität und der in den Medien präsentierten Illusion. Gesichter und Körper eines Fotomodells können substanziell modifiziert oder komplett durch KI-generatierte [gernerative/generierte?] Avatare ersetzt werden, sodass unrealistische Schönheitsideale dominieren. Zugleich ermöglicht die KI aber auch personalisierte Modefotografie, die gezielt an verschiedene Zielgruppen oder auch an einzelne Konsument:innen angepasst wird.
Inwiefern könnten KI-generierte Bilder traditionelle Produktionsprozesse in der Modeindustrie ersetzen oder ergänzen? Wie nutzen Marken generative KI, um Werbung und Branding neu zu gestalten?
Prof. Dr. Gerard de Melo, Lehrstuhl für Artificial Intelligence and Intelligent Systems, Universität Potsdam/Hasso-Plattner-Institut:
Meine Doktorandin Alexandra Kudaeva hat in der Vergangenheit in der Modebranche gearbeitet und dort an einer KI mitgewirkt, die Skizzen in fotorealistische Designs verwandelt. So können verschiedene Stoffe, Farbtöne und Texturen schnell erprobt werden, ohne auf das Prototyping warten zu müssen. Durch KI können zudem auch neue Trends frühzeitig erkannt und aufgegriffen werden. Vage Ideen lassen sich in konkrete Designs überführen, und Tech Packs mit Produktionsspezifikationen können effizienter erstellt werden. KI trägt außerdem dazu bei, die Nachfrage besser vorherzusagen und die Produktionsmengen sowie das Inventurmanagement zu optimieren. Hinzu kommt noch der Trend zur On-Demand-Produktion, bei der individuelle Elemente wie Slogans und Logos nahtlos in ein Design integriert werden und maßgeschneiderte Kleidung effizient produziert und ausgeliefert werden kann.
Henning Strauss, Engelbert Strauss Gmbh & Co.KG:
Wir haben viel mit KI-generierten Visuals experimentiert. Es gibt viele interessante Anwendungsfälle, in denen man KI gewinnbringend einsetzen kann. Der klassische Herstellungsprozess von Produktfotografien aber wird auf dem bisherigen Stand der Technik allenfalls ergänzt. KI-Visuals sind hilfreich, um etwa Moodboards oder ganze Storyboards zu erstellen und bereichern so die Planungsphase einer Fotoproduktion. Wenn es aber um das finale Produktfoto im Webshop geht, zählt – insbesondere für unsere Work Gear – die Detailtreue, die Farbechtheit, der Fit der Kleidungsstücke am Menschen. Sicher ist in der digitalen Nachbearbeitung Vieles machbar. Wir behaupten aber: Der Betrachter erkennt und bevorzugt intuitiv das echte Foto. Licht, Perspektive, Anatomie – beim Realbild stimmt notwendigerweise alles.
Welche kreativen Möglichkeiten eröffnet generative KI für die Modebranche, und welche Risiken bestehen dabei?
Henning Strauss, Engelbert Strauss Gmbh & Co.KG:
Wir verstehen KI als Werkzeug. Als Tool macht sie neue Designworkflows möglich, von der schnellen Entwicklung personalisierter Mode bis hin zur KI-gestützten Generierung ganzer Kollektionsmuster auf Basis einer Referenz. Mit dem gezielten und richtigen Einsatz kann der Workflow also beschleunigt und effizienter gestaltet werden.
On top: KI eröffnet neue Kreativitätsräume. Der Designprozess an sich kann an verschiedenen Stellen die KI als Inspirationsquelle und digitalen Sparringspartner einbeziehen. Da kommen Impulse zu Lösungen in den Prozess, die völlig neuartig sind.Auch in Sachen Nachhaltigkeit kann Mode von KI profitieren: LLMs können helfen, Materialverschwendung zu reduzieren, effizientere Produktionsprozesse zu entwickeln und umweltfreundliche Alternativen zu simulieren. Stichwort Musteranfertigung – KI liefert Musterabbildungen in Fotoqualität.Trotz all dieser Vorteile bleibt KI ein Werkzeug, das die menschliche Kreativität ergänzt. Aktuell ist KI besonders stark in strukturierten Wissensgebieten, im kreativen Bereich folgt sie oft noch bestehenden Trends und reproduziert den Mainstream – bahnbrechende und originelle Designs entsteht weiterhin aus der Kombination mit dem Menschen. Der entscheidende Faktor bleibt der Anwender, der die KI gezielt und kreativ einsetzt – und das Resultat innovativ weiterdenkt.
Wie beeinflusst die Nutzung von generativer KI die visuelle Identität der Modebranche?
Samuel Gärtner, Fashion Designer:
Generative KI kann die Modebranche auf vielfältige Weise beeinflussen. Sie bietet die Möglichkeit, kreative Prozesse zu erweitern, neue Designs zu entwickeln und Innovationen voranzutreiben. Gleichzeitig besteht die Gefahr, dass sie die ohnehin schnelle Modeindustrie weiter beschleunigt und Kreativität durch Wiederholung und Standardisierung einschränkt. Während KI neue kreative Möglichkeiten eröffnet, kann sie auch zu Gleichförmigkeit und Kopien führen. Letztendlich hängt ihr Einfluss davon ab, wie sie eingesetzt wird – sie kann ein wertvolles Werkzeug sein, bringt aber auch Herausforderungen mit sich.
Wie reagieren traditionelle Fotograf:innen und Kreative auf die zunehmende Integration generativer KI in der Branche?
Samuel Gärtner, Fashion Designer:
Viele Fotografen und Kreative sehen generative KI als Chance, da sie neue Möglichkeiten eröffnet und Prozesse vereinfacht, besonders in der Nachbearbeitung. Meiner Meinung nach fürchten die meisten keine Verdrängung, da Kreativität und Authentizität essenziell bleiben. In einer zunehmend digitalen Welt wächst das Bedürfnis nach Echtheit. KI kann dabei unterstützen, ersetzt aber nicht die menschliche Handschrift.
Erzeugen KI-Bilder eine Entkoppelung zwischen der Ästhetik der Mode und ihrer physischen Tragbarkeit?
Samuel Gärtner, Fashion Designer:
Ob KI-Bilder eine Entkopplung zwischen der Ästhetik der Mode und ihrer physischen Tragbarkeit erzeugen, hängt stark von der Umsetzung ab. Es bleibt jedoch der entscheidende Punkt, dass die Echtheit von Shootings und Models nicht vollständig ersetzt werden kann. Menschen möchten sich mit den gezeigten Bildern identifizieren können. In den letzten Jahren hat sich die Modebranche zunehmend diverser entwickelt, mit Models unterschiedlicher Größen und Hintergründe. Kunden suchen nach Authentizität, und wenn diese in Kampagnen fehlt, wird der Bezug zur Mode verloren gehen
AI as inspiration?
For our exhibition, we interviewed people from various fields of work and research. In addition to representatives from media and cultural studies, we were able to win over experts from computer science, ethics and philosophy, sociology, law and literature as well as from the fields of art, culture, politics and journalism.
We asked about digital creativity and the possible creative power of artificial intelligences. We were also interested in possible problems, risks and concerns in association with the use of AI as well as the question of an individual assessment and prognosis for future developments. The answers to our questions are as diverse as the fields of work and research of our interviewees.
On this page, we focus on the topics of Image production through AI and fashion.
We asked the experts the following question:
Do AI-generated fashion images still form part of a photographic medium, or are they establishing their own media category?
Prof. Dr. Maja Jerrentrup, Cultur and Media Scientist and Photographer:
If you focus on their appearance, AI-generated fashion images are barely distinguishable from photographs and very soon will not be distinguishable at all: You can’t tell how the image was created. I can already read comments such as ‘beautiful photo’ or praise for the model or make-up artist – who of course never existed – under many of my AI-generated images that I present online. I’ve often pointed out to recipients that these are not photos – not everyone has fully understood this and I wonder whether it’s even important. In one study I conducted, I noticed the following: People who initially thought they were photos often revised their initial assessment when they learnt that they were AI-generated images. There was often a sense of disappointment. But even this was then partially questioned again. One interviewee said: ‘It’s like when I hear a great song. Then I find out that it’s by an artist I don’t really like. And it still ends up on my playlist.’ It’s the same with images – whether generated with AI or not, there are those that appeal to you and those that don’t, there are extravagant, quirky and traditional looks.
Let’s leave the looks behind and move on to how they are created. Here, of course, there are clear differences: For a photo shoot, you have to head out into the world, work with what the world has to offer and, especially in fashion, co-operate with other people – models, designers, assistants, etc. As a good photographer at least, you have to understand the motivations of your team members, understand their visions as well as their concerns in order to create the best possible outcome for everyone involved in an often imperfect situation. A certain degree of empathy is key: as a photographer, I need to understand, for example, what the model likes or dislikes about herself, where her strengths lie, what body shapes she feels comfortable with, etc. Only then will the shoot be a pleasant event and the model can give her best. I also need a kind of empathy when working with AI, I have to engage with the AI’s mindset and understand what input I give it and how it reacts. But it’s not actually another person that I have to engage with and it doesn’t require any physical presence.
Looking at the skills of the artist, as mentioned above, we see a degree of empathy in both, as well as other parallels, e.g. knowledge of different art eras and styles, social trends, types of lighting, etc., which helps to achieve the desired result. However, the photographer works with technical equipment and reality, while the AI artist uses words (and sometimes image prompts). These words have to be specially tailored to the AI if you want to achieve a concrete idea – however, you can also achieve interesting results without expecting results, comparable to lucky shots in photography.
You could now look at other areas, such as the artist’s personality – I generally classify AI-generated fashion images as a distinct but related and even often overlapping genre due to the way they are created.
Vladimier Alexeev/ Merzmensch:
In 2023, when Boris Eldagsen turned down the prestigious first Sony Photography Awards prize, he explained his decision by saying that his winning image ‘The Electrician’ was not a photograph. It was an AI-generated image and should not be confused or equated with the genre and technique of photography. He used the term ‘promptography’, which was already doing the rounds at the time. In doing so, he triggered a public debate that is still ongoing and may never end. There are a variety of terms: including synthographies, or techno-images (according to Vilém Flusser). It is clear, however, that it is a completely new media category and cannot be grouped with photography.
To what extent does generative AI influence the aesthetics and representation of fashion, and what ethical challenges does this pose?
Prof. Dr. Maja Jerrentrup, Cultur and Media Scientist and Photographer:
Enter ‘beautiful woman’ as a prompt. You will most likely get a white woman with dark, long hair and full lips. She is young, slim and often wearing a black top. Is this the only kind of beauty?
What AI produces here without further specification is very biased and monotonous and in no way corresponds to the diversity that the term has to offer, depending on personal and cultural preferences, moods and more. For example: Only about 10% of the world’s population is white – so why is it that on average 75% of AI-generated images for ‘beautiful woman’ are white?
Shorten the prompt to ‘beauty’ and you will most likely get the face of a woman. Apparently men or transgender people are not representative of beauty? Which, by implication, could mean that looks are of central importance to women, whereas men (may) define themselves more by other characteristics…? Meaning that women have no business looking for beauty in men…?
These examples clearly show how biased AI is. Based on my observations, it is improving somewhat, but there is still a lot of room for progress – not least because some aesthetic practices have attracted little global attention or are simply less suited to the basic medium, the two-dimensional image. Clothing traditions, such as saris or dhotis, which tend to be based on complicated wrappings, for which the feel of the fabric is particularly important, etc. are less easy to depict and receive less attention.
This leads to an ethical conclusion: AI must become more inclusive and we as users and recipients must learn to realise that it is simply not yet. AI does not always have to show the truth, but we as users and recipients must always bear this in mind – precisely because we are simply accustomed to trusting our eyes the most. On the other hand, photos too have always lied. Situations are staged for photography that would not have been possible otherwise, images are retouched, altered, assembled, taken out of context, etc. from the very outset of photography. The scale in which this is possible has changed with AI, but the fact has not.
Finally, there are also positive influences, not only that (theoretically) many more people can be involved in the representation of fashion and visualise their needs, but also that much more blatant experiments are possible in an straightforward way. You have probably wasted less time, money and energy with a wacky prompted headdress than with the real-life version and can first test whether your idea is successful with less risk. This could lead to more creativity.
Vladimier Alexeev/ Merzmensch:
Everything is dependent on the data set on which the respective model is trained. And frankly, the more data in it, the better. Megalomania is not the point, but rather diversity. If you train an AI model only on certain, for instance Western fashion representatives, the new visions generated will tend to be repetitive and more epigonal. Mix international data from Africa, Japan, Australia, etc., and the model will achieve an aesthetic liberation from the conventions of the respective cultural area, while retaining culturally relevant knowledge, which will prove to be very beneficial later on.
Obviously, AI works on the basis of probabilities (which also means that it can generate the least probable, which is especially fascinating). Human cultural stereotypes are also probabilities. Our ethical challenge is to avoid cultural, social and other bias and also to pay attention to underrepresented cultural groups, however not from a colonialist-western perspective, but on equal footing, with respect and open-mindedness. Furthermore, we need to make more space for them, as a society dominated by Western aesthetics is losing its awareness of the world.
It is also advisable to visualise ethnic groups according to equal and synonymous situations and to avoid clichéd, misleading comparisons. The point is not at all about quotas, but about the self-evident fact that the world is now global enough to regard the former table of nations as misleading, harmful and toxic. Regrettably, many people still think in terms of tables of nations, although they don’t even realise it.
How do the aesthetics of AI-generated images differ from the stylistic elements of fashion photography?
Prof. Dr. Maja Jerrentrup, Cultur and Media Scientist and Photographer:
Image-generating AI is based on huge data sets and can therefore also imitate all possible styles of fashion photography. On a purely visual level, it is already difficult for a layperson to recognise whether an image has been generated with AI or not – and the sky is still the limit! While there is a distinct look that AI currently favours without further specifications – because it is obviously favoured in the data sets and by users – this is not a mandatory feature of AI image generation. In terms of look, it barely differs from real photography and will continue to do so to an ever lesser extent. You can generate what you can photograph, even if this sometimes entails quite laborious prompting and requires knowledge of fashion-historical eras, fabrics, cuts, lighting, posing, etc.
Is image production through AI more likely to lead to a standardisation or diversification of aesthetic forms of expression?
Prof. Payal Arora, Professor of Incusive AI Cultures at Utrecht University and co-founder of FemLab:
To ask whether AI tools will lead to standardized or diversified aesthetic expressions is akin to asking if people will become similar or different over time. The fact is that people’s prompts for AI draw from their lived experiences of concerns, curiosities, and capacities to aspire for aesthetic futures that resonate with them. This makes the ‘similar’ different based on your vantage point. For instance, to a white European, red-green-yellow beads is just an aesthetic choice and perhaps may evoke the image of a traffic light, while for Oromo communities in Ethiopia whose culture has long been persecuted and even banned, this is a political act of defiance. These colours are associated with the Oromo Liberation Front movement, and thereby was criminalized for decades. Or take for instance nose rings in rural India. Depending on their designs, they can signal if you are married or single. However in San Francisco, nose rings can signal which subculture you come from, be it punk, or bohemian, or queer. The devil is in the details. Only those from these cultural groups are equipped to ‘read’ what these expressions mean to their community. It’s a humble reminder that aesthetics, AI induced or not, are social and political acts depending on who engages with these forms of expression. In short, the same will always be different in the eyes of the beholder.
Vladimier Alexeev/ Merzmensch:
The answer is twofold. The mainstream models like Midjourney, when driven by basic, simple, figurative prompts, produce a similar aesthetic (at least within one version of the model). And we can already recognise this by the flood of similar images on social networks. The artists‘ task is to move away from “default”, from the standard, mediocre. In doing so, prompts play a subordinate role, as you work with parameters, settings, fine-tuning and other programmes. For instance, with DALL-E 3 it is worth spending an hour discussing the aesthetics and semantics with the model. Only then can completely unique and rare motifs, compositions and visualisations be created, away from predefined standards.
I believe it is up to us, as creatives, to ensure this diversity and to counter the uniformity with which the world is confronted. After all, the AI models can do practically anything and almost any aesthetic, even those that do not yet exist. We need to coax them out of the machines. This is the only way to move away from standardisation and towards the diversification of aesthetic forms of expression.
To what extent are these AI-generated fashion images to be considered cultural artefacts which create new spaces of significance?
Prof. Payal Arora, Professor of Incusive AI Cultures at Utrecht University and co-founder of FemLab:
All acts of creativity are intrinsically cultural artifacts. The medium does not dictate value, it never has. Social gatekeepers do. For the longest time, a small and elite group of dominantly Anglo-Saxon cultural connoisseurs have dictated what counts as culture to the world. What is deemed a museum worthy artifact, what counts as art or craft, what is a culture of civility, has a legacy rooted in colonial thinking and doing. However, in the last decade, we have witnessed the rise of the ‘next billion users,’ first time internet users coming online in the Global South and in recent times, co-creating with emergent Large Language Models, be it Open AI from the US, Mistral from France, or DeepSeek from China. This majority world are not just co-producers but are fast becoming collective cultural arbiters online through their likes, shares, posts, and other social behaviour online that influences the visibility and valorising of certain AI generated fashion images over others. After all, our everyday creative practices online are the data that goes into training these AI models that in turn, shape the way in which we see the world. This disruption of gatekeeping typically evokes fear of the loss of control over creative value. On the contrary, it should be embraced as a democratizing movement. Creatives who have typically not had a seat at the table are now doing so in ways that can give us pause to reflect and regenerate a new way to engage with the world. For instance, the Nigerian artist Malik Afegbua in his ‘The Elder Series’, used AI to create a virtual fashion show featuring elderly models, carving a novel space to challenge prevailing stereotypes about aging and beauty and the African world. Similarly, Amsterdam-based start-up Lalaland.ai, founded by the Zimbabwean entrepreneur Michael Musandu, has gained much attention as their playfulness with hyper-realistic digital models are expanding our notions of fashion with and for a wider group of ethnicities, body types and age groups. As LLMs become more accessible, they are enabling the silenced to become the sounding boards for how we build new creative meaning and value.
Prof. Dr. Maja Jerrentrup, Cultur and Media Scientist and Photographer:
I would like to adapt the wording and generally speak of ‘AI-generated images’. After all, prompting and selecting is also a creative act. This becomes obvious when you want to implement an idea for hours, but the AI never understands exactly what you want and you repeatedly modify prompts and change image areas, sometimes accepting suggestions from the AI, trying things out, making selections and finally contextualising the finished work and publishing it as a gag, a work of art or a fashion image.
AI enables us to take part in a design process with the fewest and cheapest means possible: You only need a computer, a software programme and possibly a paid subscription – but nowhere near the cost of a photo shoot or an oil painting course. This allows each and every one of us to help shape the world and, for example, to co-create trends and illustrate themes that are important to us. I recently researched the #depression hashtag on Instagram and realised that there are few image posts, despite the fact that art therapy is often used to treat the illness. Things could soon change if we are able to visualise our feelings with the help of image-generating AI. However, this requires knowledge – an appropriate use of words, knowledge of art styles and looks, knowledge of the objects you want to depict or, in our case, fashion, knowledge of fashion eras, fabric qualities, cuts, etc. Despite the fact that technology is cheap and available, there is, as is so often the case, the risk of a growing digital divide, but at the same time the opportunity for greater participation and creative possibilities.
How can consumers‘ media skills be strengthened so that they can critically evaluate AI-generated content?
Vladimier Alexeev/ Merzmensch:
Digital and media literacy is the be-all and end-all, but it’s more than just theory. Hands-on practice is the key word. Five years ago, in 2020, I organised an ‘AI for KIDS’ workshop here at the Museum für Kommunikation Frankfurt. Back then, AI had already emerged as a promising creative medium in the international cultural scene, but the topic of AI was still rare among the general public. Prior to my workshop, I showed the kids (aged between 7 and 12) photos and AI-generated portraits, which they were initially unable to recognise. Following the workshop, during which the children worked intensively and practically with AI models (GANs and CNNs), I repeated the process of comparison – and the children were very quick to recognise which images had been generated. Over the course of the project, they empirically and perceptively recognised and sensed the special features of the synthetic images. They were also aware of everything that is now possible, so they were more willing to critically scrutinise a photorealistic portrait. Therefore, society should learn how these images are created – even just to be able to recognise them. We are not able to prevent the misuse of AI like Deepfake, but with sufficient expertise it is possible to minimise its harmful impact.
What role does AI play in the continued development or radical change of fast-fashion models in an increasingly digitalised world?
Prof. Dr. Gerard de Melo, Institut for Artificial Intelligence and Intelligent Systems, University Potsdam/Hasso-Plattner-Institut:
AI contributes to a continued acceleration of fashion, as a range of processes from design to delivery can run faster. Demand can continue to increase thanks to individualised advertising and personal style advice bots that compile the perfect outfit for us. And at the same time, AI can contribute to greater sustainability. AI-based, targeted forecasting can reduce the problem of fast fashion overproduction. Virtual fittings, sometimes even with precise 3D body scans, help to avoid returns. Great potential is also opening up in the area of resale, reuse and recycling, as AI can record the condition of garments and identify the fabrics used.
What developments do you foresee in the fusion of AI-generated images and traditional fashion photography?
Samuel Gärtner, Fashion Designer:
AI can enrich fashion photography by speeding up processes and opening up new creative possibilities. While AI generated images are a current trend, human creativity remains essential. The fusion of AI and traditional photography will be an enhancement rather than a replacement. Particularly for smaller brands, it provides the opportunity to create amazing campaigns on a smaller budget. A balance between technological innovation and authentic, artistic design is the future.
Prof. Dr. Gerard de Melo, Institut for Artificial Intelligence and Intelligent Systems, University Potsdam/Hasso-Plattner-Institut:
Fashion thrives on the tension between desire and reality. Artificial intelligence creates many new opportunities to push the boundaries of traditional fashion photography and showcase new creative ideas. There is however a danger of too much alienation between reality and the illusion portrayed in the media. A model’s face and body can be substantially modified or completely replaced by AI-generated avatars, resulting in unrealistic ideals of beauty. However, AI also enables personalised fashion photography that is specifically adapted to various target groups or even individual consumers.
To what extent could AI-generated images replace or enhance traditional fashion industry production processes? How are brands using generative AI to redisgn advertising and branding?
Prof. Dr. Gerard de Melo, Institut for Artificial Intelligence and Intelligent Systems, University Potsdam/Hasso-Plattner-Institut:
In the past, my PhD student Alexandra Kudaeva worked in the fashion industry, where she was involved in an AI that transforms sketches into photorealistic designs. This allows different fabrics, colours and textures to be quickly tested without having to wait for prototyping. In addition, AI allows new trends to be recognised and picked up on at a very early stage. Vague ideas can be transformed into concrete designs and tech packs with production specifications can be created more efficiently. AI also enables demand to be predicted more accurately and optimises production quantities and inventory management. In addition, there is the trend towards on-demand production, where individual elements such as slogans and logos can be seamlessly integrated into a design and customised clothing can be more efficiently produced and delivered.
Henning Strauss, Engelbert Strauss Gmbh & Co.KG:
We have experimented a lot with AI-generated visuals. There are many interesting application scenarios in which AI can be used profitably. The classic production process of product photography, however, is at best supplemented by current technology. AI visuals are helpful for creating mood boards or entire storyboards, for example, and thus enrich the planning phase of a photo production. However, when it comes to the final product photo in the web shop, what counts – especially for our work gear – is the level of detail, colour authenticity and the fit of the garments on people. There is certainly a lot that can be done in digital retouching. However, we claim that the viewer intuitively recognises and prefers the real photo. Light, perspective, anatomy – everything is just as it should be in the real image.
What creative opportunities does generative AI provide for the fashion industry, and what risks are involved?
Henning Strauss, Engelbert Strauss Gmbh & Co.KG:
We see AI as a tool. In its role as a tool, it makes new design workflows possible, from the rapid development of personalised fashion to the AI-supported generation of entire collection samples based on a reference. With targeted and correct use, the workflow can be accelerated and made more efficient. And on top: AI opens up new creative spaces. The design process itself can incorporate AI as a source of inspiration and digital sparring partner at different stages. The process can provide impetus for solutions that are completely new. Fashion can also benefit from AI in terms of sustainability: LLMs can help to reduce material waste, develop more efficient production processes and simulate environmentally friendly alternatives. Keyword sample production – AI provides sample images in photo quality.
However, despite all these advantages, AI remains a tool that complements human creativity. AI is now especially strong in structured areas of knowledge; in the creative field, it often still follows existing trends and reproduces the mainstream – groundbreaking and original designs still emerge from the creative process in combination with humans. The key factor is still the user, who utilises AI in a targeted and creative way – and continues to innovate the result.
How does the use of generative AI influence the fashion industry’s visual identity?
Samuel Gärtner, Fashion Designer:
Generative AI can influence the fashion industry in many ways. It offers the opportunity to expand creative processes, develop new designs and drive innovation. However, there is also a risk that it will further accelerate the already fast-paced fashion industry and limit creativity through repetition and standardisation. While AI opens up new creative possibilities, it can also lead to uniformity and duplication. Its impact ultimately depends on how it is used – it can be a valuable tool, but it also brings challenges.
What is the reaction of traditional photographers and creatives to the increasing integration of generative AI in the industry?
Samuel Gärtner, Fashion Designer:
Many photographers and creatives see generative AI as an exciting opportunity, as it opens up new possibilities and simplifies processes, especially in post-production. In my opinion, most do not fear being displaced, as creativity and authenticity remain essential. In an increasingly digital world, the need for authenticity is growing. AI can support this, but it cannot replace human handwriting.
Are AI images creating a disconnect between the aesthetics of fashion and its physical wearability?
Samuel Gärtner, Fashion Designer:
The question of whether AI images create a decoupling between the aesthetics of fashion and its physical wearability depends heavily on how they are implemented. The crucial point remains, however, that the authenticity of shoots and models cannot be fully replaced. People like to be able to identify with the images shown. In recent years, the fashion industry has become increasingly diverse, with models of different sizes and backgrounds. Customers are looking for authenticity and if this is missing in campaigns, the connection to fashion will be lost.