KI-gesteuerter DX: Bilderzeugung mit künstlicher Intelligenz
Künstliche Intelligenz (KI) wirkt sich auf verschiedene Branchen aus, auch auf die Welt der digitalen Erlebnisse. In diesem Interview mit Tobias Kerschbaum, Solution Architect bei Magnolia, erfahren wir, wie Magnolia seinen Kunden hilft, das Potenzial von KI zu nutzen.
Tobias zeigte mir das faszinierende Beispiel, wie eine KI namens DALL-E Bilder aus Textbeschreibungen generiert. In unserem Gespräch erklärte Tobias, wie die Integration funktioniert, und sprach über einige der zukünftigen Verbesserungen, an denen er arbeitet. Lesen Sie weiter, um mehr über diese spannende Entwicklung im Bereich der KI und der digitalen Erlebnisgestaltung zu erfahren.
KI-Anwendungsfälle im DX-Bereich
Sandra: Tobias, du bist Solution Architect bei Magnolia und arbeitest in unserem Professional Services Team. Ich weiß, dass du dich kürzlich mit der Nutzung von künstlicher Intelligenz beschäftigt hast. Kannst du uns ein paar Beispiele nennen, wie KI eingesetzt wird, um digitale Erlebnisse zu schaffen?
Tobias: Wir verwenden KI für Aufgaben wie die Textklassifizierung und das automatische Tagging von Bildern. Außerdem nutzen wir sie, um Texte zu optimieren. Wenn Sie zum Beispiel unsere Integration mit WordAI nutzen, können Content-Autoren einen Text schreiben und die KI mit einem Klick um Vorschläge bitten, wie der Text verbessert werden kann. Es ist bemerkenswert, wie eine einfache Sache wie diese das Leben eines Inhaltsautors einfacher machen kann.
Und ich gehe davon aus, dass sie in Zukunft noch mehr Einfluss haben wird. Das gilt vor allem für die Erstellung von Inhalten, insbesondere von Bildern, woran wir derzeit arbeiten.
XR for real - wie Extended Reality zum Leben erwacht
Wie real ist Virtual Reality heute und welche Innovationen sind in Sicht? Lesen Sie das Interview mit Jan Schulte von Magnolia, um mehr zu erfahren.
Bilderzeugung mit DALL-E in Magnolia
Sandra: Kannst du mir mehr darüber erzählen, woran du gerade arbeitest?
Tobias: Die Idee gibt es schon seit ein paar Monaten oder Jahren, aber jetzt gibt es eine neue Version der DALL-E API. Diese hier ist besonders gut.
Wir sehen einen großen Vorteil in der Bilderstellung und haben dies bereits mit einigen Kunden besprochen. Sie lieben die Tatsache, dass sie Bilder sofort erstellen können und nicht jedes Mal einen Designer fragen müssen, wenn sie ein Bild erstellen oder ändern wollen. Sie können einfach beschreiben, was sie brauchen, auf eine Schaltfläche klicken und dann aus mehreren Bildern auswählen. Das ist besonders nützlich, wenn sie schnell ein Bild für ihre Website brauchen.
Ein weiterer Vorteil ist die Erstellung von Bildern in einem bestimmten Kontext oder Stil. In der neuesten Version unserer Integration sind wir in der Lage, ein Bild als Basis zu verwenden und es dann auf der Grundlage bestimmter Anweisungen zu ändern. Dadurch wird sichergestellt, dass das neue Bild dem Stil des Basisbildes entspricht.
Sandra: Sie haben die DALL-E API erwähnt. Was ist DALL-E?
Tobias: DALL-E ist eine KI, die aus Textbeschreibungen Bilder erzeugen kann. Es wird ausgesprochen wie der Maler Salvador Dalí. DALL-E 2 ist die zweite Version der API und hat sich deutlich verbessert.
Es handelt sich um einen kostenpflichtigen Dienst von OpenAI, den Sie kostenlos ausprobieren können.
Wir haben ihn in Magnolia integriert, damit die Autoren die Plattform nicht verlassen müssen, um Bilder herunter- und hochzuladen. Sie können den Dienst innerhalb von Magnolia nutzen. Wir haben sogar einen Prompt-Generator, der dabei hilft, die textliche Beschreibung für die Erstellung eines Bildes zu erstellen. Er hilft bei der Erstellung, da es anfangs schwierig sein kann zu wissen, wie man einen Prompt schreibt, um gute Ergebnisse zu erzielen.
Sandra: Sehr cool. Als Marketer stelle ich mir vor, dass ich in meiner normalen Benutzeroberfläche Zugang zu dieser Funktion hätte. Helfen Sie mir zu verstehen, wie das funktioniert und wie wir es in Magnolia implementieren.
Tobias: Der Prompt-Generator wird von Magnolia verwaltet und steht den Autoren von Inhalten in einem Magnolia-Dialog zur Verfügung. Die KI ist ein externer Dienst, den wir im Hintergrund nutzen.
Der Prompt-Generator bietet ein Formular mit Dropdown-Listen und einigen Beispielen, die Sie als Ausgangspunkt verwenden können. Sie können zum Beispiel den Stil, den Inhalt und die Form eines Bildes angeben. Wenn Sie häufig Bilder in einem bestimmten Stil erstellen möchten, können Sie die Liste der Eingabeaufforderungskriterien auch mit einer Magnolia Content App erweitern.
Für die Integration haben wir einen normalen Magnolia-Dialog erstellt, der mit DALL-E kommuniziert. Um ein Bild zu generieren, nehmen wir die Eingabeaufforderung aus dem Prompt-Generator und machen einen REST-Aufruf an die DALL-E-API.
Die Ergebnisse werden dann im Dialog angezeigt. Abschließend lädt Magnolia das von Ihnen ausgewählte Bild automatisch in das Magnolia-DAM hoch.
Sandra: Damit wird ein Bild von Grund auf neu erstellt. Sie haben erwähnt, dass DALL-E auch Bilder verändern kann. Wie funktioniert das?
Tobias: Die Integration hat zwei Optionen: den Prompt-Generator und eine zweite Option, bei der Sie ein bestehendes Bild verwenden und nach Bedarf Änderungen vornehmen können. Der Rest des Prozesses bleibt derselbe: Wir senden es an die API, erhalten die Ergebnisse zurück, wählen aus den Ergebnissen aus und laden dann das Bild in Magnolia hoch.
Sandra: Sie haben das bereits aufgebaut, und das ist erstaunlich. Was kommt als Nächstes?
Tobias: Wir haben noch weitere Verbesserungsmöglichkeiten ausgemacht, z. B. die Erhöhung der Anzahl der generierten Bilder über die derzeitige Grenze von vier hinaus. Es wäre hilfreich, zusätzliche Bilder anzufordern, wenn der erste Satz nicht zufriedenstellend ist. Dies würde die Neuerstellung auslösen und eine größere Auswahl an Bildern zur Verfügung stellen.
Sandra: Das ist cool. Und anders als bei einem Designer muss man nicht befürchten, die Gefühle von jemandem zu verletzen, wenn man sagt: "Weißt du was, die ersten vier Bilder gefallen mir nicht.
Tobias: Ich denke, das ist ein guter Ausgangspunkt. Wir müssen noch mehr Nachforschungen anstellen und mit den Kunden darüber sprechen, wie sie die Funktion nutzen wollen. Einige könnten es einfach übernehmen und selbst verbessern, wenn sie zusätzliche Anforderungen in ihrem Projekt haben. Die Quellen sind offen. Jeder kann sich den Code ansehen und ihn erweitern.
Sandra: Wo wir gerade beim Code sind. Wie stellen Sie diesen zur Verfügung?
Tobias: Wir stellen es als kostenloses Magnolia Light Modul auf Git zur Verfügung. Sie können über unseren Marketplace Zugang dazu erhalten.
Anwendung von DALL-E in der Praxis
Sandra: Das klingt unglaublich, aber wie nützlich ist es wirklich?
Tobias: Ich muss zugeben, dass ich anfangs etwas gezögert habe, Zufallsbilder zu erzeugen. Ich war mir nicht sicher, ob es in echten Projekten nützlich sein würde. Als wir es jedoch den ersten ein oder zwei Kunden gezeigt haben, war ich überrascht, wie begeistert sie waren. Sie sahen sofort das Potenzial, was sehr ermutigend war.
Aus den Rückmeldungen von Kunden und Kollegen geht hervor, dass der Generator am besten verwendet werden kann, wenn einfache Textaufforderungen mit Bildern kombiniert werden. Das liegt daran, dass Bilder den notwendigen Kontext für die Generierung der Aufforderung liefern. Wenn Sie die KI zum Beispiel bitten, ein Bild einer Person zu erzeugen, die nach rechts statt nach links schaut, kann sie dies problemlos tun.
In ähnlicher Weise können Sie DALL-E verwenden, um das Bild zu erweitern oder zu verändern, indem Sie Elemente hinzufügen oder entfernen. Ich glaube, dass dieser Ansatz viel Potenzial für zukünftige Projekte hat. Indem wir der KI ein Bild als Kontext zur Verfügung stellen, können wir eine Menge nützlicher und interessanter Inhalte generieren.
Insgesamt denke ich, dass dieses Tool für alle Arten von Projekten sehr hilfreich sein wird.
Sandra: Die Idee klingt wirklich cool und könnte tatsächlich sehr hilfreich sein. Als Vermarkterin weiß ich nicht, ob wir das nutzen können, aber ich würde es auf jeden Fall gerne ausprobieren.